摘要
1、類型(三種)
主鍵索引名爲 pk_字段名; 唯一索引名爲 uk_字段名; 普通索引名則爲 idx_字段名 。
說明: pk_ 即 primary key; uk_ 即 unique key
2、規範(10餘條)
序號 | 規範 | 說明 | 例子 |
---|---|---|---|
1 | 【強制】業務上具有唯一特性的字段,即使是多個字段的組合,也必須建成唯一索引。 | 不要以爲唯一索引影響了 insert 速度,這個速度損耗可以忽略,但提高查找速度是明 顯的; 另外,即使在應用層做了非常完善的校驗控制,只要沒有唯一索引,根據墨菲定律,必然有髒數據產生 | 節能環保打標表 UNIQUE INDEX uk_config_brand_spec_auth (config_id , brand_id , specification (255), auth_code (255)) USING BTREE, 區劃限價設置表(牧謙) CREATE UNIQUE INDEX uni_district ON db_item.zcy_district_category_price (category_id,config_id,district_id); |
2 | 【強制】超過三個表禁止 join。 | 需要 join 的字段,數據類型必須絕對一致; 多表關聯查詢時,保證被關聯的字段需要有索引。 即使雙表 join 也要注意表索引、 SQL 性能。 | 商品庫不存在join |
3 | 【強制】在 varchar 字段上建立索引時,必須指定索引長度,沒必要對全字段建立索引,根據實際文本區分度決定索引長度即可 | 索引的長度與區分度是一對矛盾體,一般對字符串類型數據,長度爲 20 的索引,區分度會高達 90%以上,可以使用 count(distinct left(列名, 索引長度))/count(*)的區分度來確定 | 屬性值表 create index idx_name on db_item.parana_property_value (name(100)) |
4 | 【強制】頁面搜索嚴禁左模糊或者全模糊,如果需要請走搜索引擎來解決。 | 索引文件具有 B-Tree 的最左前綴匹配特性,如果左邊的值未確定,那麼無法使用此索引 | 屬性值表 INDEX idx_name (name (20)) USING BTREE SQL:AND name LIKE CONCAT(#{name},’%’) |
5 | 【推薦】如果有 order by的場景,請注意利用索引的有序性。 order by 最後的字段是組合索引的一部分,並且放在索引組合順序的最後,避免出現 file_sort(文件排序)的情況,影響查詢性能。 | 正例: where a=? and b=? order by c; 索引: a_b_c 反例: 索引中有範圍查找,那麼索引有序性無法利用,如: WHERE a>10 ORDER BY b; 索引a_b 無法排序。 | spu庫(奕銘):IDX_category_status_createdAt(category_id,status,created_at) sql:WHERE category_id = 4619 and status = 3 order by created_at DESC LIMIT 0, 500 |
6 | 【推薦】利用覆蓋索引來進行查詢操作,避免回表。覆蓋索引: | 如果一本書需要知道第 11 章是什麼標題,會翻開第 11 章對應的那一頁嗎?目錄瀏覽一下就好,這個目錄就是起到覆蓋索引的作用。 | 能夠建立索引的種類分爲主鍵索引、唯一索引、普通索引三種,而覆蓋索引只是一種查詢的一種效果,用 explain 的結果, extra 列會出現: using index。 |
7 | 【推薦】利用延遲關聯或者子查詢優化超多分頁場景。 | MySQL 並不是跳過 offset 行,而是取 offset+N 行,然後返回放棄前 offset 行,返回N 行,那當 offset 特別大的時候,效率就非常的低下,要麼控制返回的總頁數,要麼對超過特定閾值的頁數進行 SQL 改寫 | 先快速定位需要獲取的 id 段,然後再關聯:SELECT a.* FROM 表 1 a, (select id from 表 1 where 條件 LIMIT 100000,20 ) b where a.id=b.id |
8 | 【推薦】 SQL 性能優化的目標:至少要達到 range 級別, 要求是 ref 級別, 如果可以是consts最好 | 1) consts 單表中最多隻有一個匹配行(主鍵或者唯一索引),在優化階段即可讀取到數據。2) ref 指的是使用普通的索引(normal index) 。3) range 對索引進行範圍檢索 | 反例:explain 表的結果, type=index,索引物理文件全掃描,速度非常慢,這個 index 級別比較 range 還低,與全表掃描是小巫見大巫 |
9 | 【推薦】建組合索引的時候,區分度最高的在最左邊。 | 存在非等號和等號混合時,在建索引時,請把等號條件的列前置。如: where c>? and d=? 那麼即使 c 的區分度更高,也必須把 d 放在索引的最前列, 即索引 idx_d_c。 | 如果 where a=? and b=? ,如果 a 列的幾乎接近於唯一值,那麼只需要單建 idx_a索引即可。5.7提供自動順序優化** |
10 | 【推薦】 防止因字段類型不同造成的隱式轉換, 導致索引失效 | 例子: | |
11 | 【參考】創建索引時避免有如下極端誤解 | 1) 寧濫勿缺。 認爲一個查詢就需要建一個索引。 2) 寧缺勿濫。 認爲索引會消耗空間、嚴重拖慢更新和新增速度。 3) 抵制惟一索引。 認爲業務的惟一性一律需要在應用層通過“先查後插”方式解決。 | 唯一索引踩坑: |
CheckList
1 :三個字段聯合索引時,如果中間的字段使用了範圍查詢或者模糊查詢,最後一個字段還會用到索引麼?
用得到
2:在order by時,索引是如何使用的
待補充
3:新建一張表,如何界定其索引的數量,有沒有選擇或者公式
根據業務場景
4:能不能再詳細介紹下字符串前綴索引
5、 字符串如何加索引?
6、什麼是覆蓋索引?
select ID from T where k between 3 and 5,這時只需要查ID的值,而ID的值已經在k索引樹上了,因此可以直接提供查詢結果,不需要回表。也就是說,在這個查詢裏面,索引k已經“覆蓋了”我們的查詢需求,我們稱爲覆蓋索引。
7、如果查詢順序和聯合索引的順序不一致,優化器會自動做優化
即查詢語句的where裏面各個判斷調換順序沒關係的
8、對索引進行函數操作或者表達式計算也會導致索引的失效。