在數據庫的增刪改查操作中,使用最頻繁的就是查詢操作。而在所有查詢操作中,統計數量操作更是經常被用到。
關於數據庫中行數統計,無論是MySQL還是Oracle,都有一個函數可以使用,那就是COUNT。
COUNT
MySQL官網給出的解釋是:
1、COUNT(expr) ,返回SELECT語句檢索的行中expr的值不爲NULL的數量。結果是一個BIGINT值。
2、如果查詢結果沒有命中任何記錄,則返回0
3、但是,值得注意的是,COUNT(*)
的統計結果中,會包含值爲NULL的行數。
例如:
create table #bla(id int,age int)
insert #student values(null,null)
insert #student values(1,null)
insert #student values(null,1)
insert #student values(1,null)
insert #student values(null,1)
insert #student values(1,null)
insert #student values(null,null)
使用語句count(*),count(id),count(id2)查詢結果如下:
select count(*),count(id),count(age)
from #student
results 7 3 2
COUNT(常量)
和 COUNT(*)
表示的是直接查詢符合條件的數據庫表的行數。而COUNT(列名)
表示的是查詢符合條件的列的值不爲NULL的行數。
而COUNT(*)是SQL92定義的標準統計行數的語法,因爲他是標準語法,所以MySQL數據庫對他進行過很多優化。
SQL92,是數據庫的一個ANSI/ISO標準。它定義了一種語言(SQL)以及數據庫的行爲(事務、隔離級別等)。
COUNT(*)的優化
區分不同的執行引擎,MySQL中比較常用的執行引擎就是InnoDB和MyISAM。
MyISAM和InnoDB有很多區別,其中有一個關鍵的區別和我們接下來要介紹的COUNT(*)有關,那就是MyISAM不支持事務,MyISAM中的鎖是表級鎖;而InnoDB支持事務,並且支持行級鎖。
MyISAM做了一個簡單的優化,那就是它可以把表的總行數單獨記錄下來,如果從一張表中使用COUNT(*)進行查詢的時候,可以直接返回這個記錄下來的數值就可以了,當然,前提是不能有where條件。
InnoDB中索引分爲聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節點中保存的是整行記錄,而非聚簇索引的葉子節點中保存的是該行記錄的主鍵的值。
所以,相比之下,非聚簇索引要比聚簇索引小很多,所以MySQL會優先選擇最小的非聚簇索引來掃表。所以,當我們建表的時候,除了主鍵索引以外,創建一個非主鍵索引還是有必要的。
至此,我們介紹完了MySQL數據庫對於COUNT(*)的優化,這些優化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。
COUNT(1)
InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.
所以,對於COUNT(1)和COUNT(*),MySQL的優化是完全一樣的,根本不存在誰比誰快!
建議使用COUNT(*)
!因爲這個是SQL92定義的標準統計行數的語法,而且本文只是基於MySQL做了分析,關於Oracle中的這個問題,也是衆說紛紜的呢。
COUNT(字段)
最後,就是我們一直還沒提到的COUNT(字段),他的查詢就比較簡單粗暴了,就是進行全表掃描,然後判斷指定字段的值是不是爲NULL,不爲NULL則累加。
相比COUNT(*)
,COUNT(字段)
多了一個步驟就是判斷所查詢的字段是否爲NULL,所以他的性能要比COUNT(*)
慢。
總結
本文介紹了COUNT函數的用法,主要用於統計表行數。主要用法有COUNT(*)、COUNT(字段)和COUNT(1)。
因爲COUNT(*)是SQL92定義的標準統計行數的語法,所以MySQL對他進行了很多優化,MyISAM中會直接把表的總行數單獨記錄下來供COUNT(*)查詢,而InnoDB則會在掃表的時候選擇最小的索引來降低成本。當然,這些優化的前提都是沒有進行where和group的條件查詢。
在InnoDB中COUNT(*)和COUNT(1)實現上沒有區別,而且效率一樣,但是COUNT(字段)需要進行字段的非NULL判斷,所以效率會低一些。
因爲COUNT(*)是SQL92定義的標準統計行數的語法,並且效率高,所以請直接使用COUNT(*)查詢表的行數!