MySQL範圍查找時,索引失效問題探究

1 問題描述
本文對建立好的複合索引進行排序,並取記錄中非索引字段,發現索引不生效,例如,有如下表,DDL語句爲:

CREATE TABLE `employees` (
  `emp_no` int(11) NOT NULL,
  `birth_date` date NOT NULL,
  `first_name` varchar(14) NOT NULL,
  `last_name` varchar(16) NOT NULL,
  `gender` enum('M','F') NOT NULL,
  `hire_date` date NOT NULL,
  `age` int(11) NOT NULL,
  PRIMARY KEY (`emp_no`),
  KEY `unique_birth_name` (`first_name`,`last_name`) USING BTREE
  ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

複合索引爲unique_birth_name (first_name,last_name) 。使用以下語句:

EXPLAIN SELECT
    gender
FROM
    employees
ORDER BY
    first_name,
    last_name

根據上圖:type:all 及 Extra:Using filesort 可得,索引沒有生效。

繼續進行試驗,對查詢語句進一步改寫,加上一個範圍查找:

EXPLAIN SELECT
    gender
FROM
    employees
WHERE first_name > 'Leah'
ORDER BY
    first_name,
    last_name

執行計劃顯示如下圖:

這裏發現結果和第一次sql分析無異。繼續試驗。

改寫sql語句:

EXPLAIN SELECT
    gender
FROM
    employees
WHERE first_name > 'Tzvetan'
ORDER BY
    first_name,
    last_name

此時,令人驚訝的是,索引生效了。

2 問題分析
此時,我們做一個大膽的猜測:

第一次進行sql分析時,因爲第一次order by 後,得到的還是全表數據,如果根據複合索引中攜帶的主鍵查找每一個gender進行拼接,自然很費資源和時間,mysql不會做如此蠢的事。不如直接進行全表掃描,把掃描到的每條數據和order by得到的臨時數據進行拼接,從而得到需要的數據。

爲了驗證上述想法的正確性,我們對三次sql進行分析。

第一次sql根據複合索引得到的數據量爲:300024,爲全表數據

SELECT
    COUNT(first_name)
FROM
    employees
ORDER BY
    first_name,
    last_name

第二次改寫的sql根據複合索引得到的數據量爲:159149 , 爲全表數據量的1/2。

SELECT
    COUNT(first_name)
FROM
    employees
WHERE first_name > 'Leah'
ORDER BY
    first_name,
    last_name

第三次改寫的sql根據複合索引得到的數據量爲:36731, 爲全表數據量的1/10。

SELECT
    COUNT(first_name)
FROM
    employees
WHERE first_name > 'Tzvetan'
ORDER BY
    first_name,
    last_name

通過對比發現,第二次改寫的sql根據複合索引得到的數據量是全表數據量的1/2。此時還沒有達到mysql使用索引進行二次查找的量級。

第三次改寫的sql根據複合索引得到的數據量是全表數據量的1/10,達到了mysql使用索引進行二次查找的量級,於是從執行計劃上可以看到,第三次改寫sql是走了索引的。

3 總結
mysql 是否根據首次索引條件查詢出的主鍵進行二次查找,也是要看查詢出來的數據量級,如果數據量接近全表數據量的話,就會進行全表掃描,否則根據第一次查詢出來的主鍵進行二次查詢。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章