MySQL的show index 選擇率

show index from tbl_name\G;

裏面的每個字段信息各代表什麼呢？

DROP TABLE IF EXISTS t;

CREATE TABLE t(

a int not null,

b varchar(2000) ,

c int not null,

d int,

e varchar(200),

primary key(a),

key idx_b(b),

key idx_c(c),

key idx_c_b(c,b),

unique key(d),

key idx_e(e(10))

)engine=innodb;

mysql>show index from t;

+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

| t | 0 | PRIMARY | 1 | a | A | 0 | NULL | NULL | | BTREE | | |

| t | 0 | d | 1 | d | A | 0 | NULL | NULL | YES | BTREE | | |

| t | 1 | idx_b | 1 | b | A | 0 | 191 | NULL | YES | BTREE | | |

| t | 1 | idx_c | 1 | c | A | 0 | NULL | NULL | | BTREE | | |

| t | 1 | idx_c_b | 1 | c | A | 0 | NULL | NULL | | BTREE | | |

| t | 1 | idx_c_b | 2 | b | A | 0 | 191 | NULL | YES | BTREE | | |

| t | 1 | idx_e | 1 | e | A | 0 | 10 | NULL | YES | BTREE | | |

+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

7 rows in set (0.00 sec)

#說明

TABLE：索引所在的表名

Non_unique:非唯一的索引，必須要唯一，例如上面定義到主鍵a，unique d 都是顯示是0

Key_name:索引的名字

Seq_in_index:索引中該列的位置，如idx_c_b 的聯合索引

Column_name:索引列的名稱

Collation:列是以什麼方式存在在索引中索引中的，可以是A或是NULL，B+樹索引總是A，即是排序的。如果使用了Heap存儲引擎，並且建立了Hash索引，這裏就會顯示NULL了

因爲Hash根據hash桶存放索引數據的，而不是對數據進行排序。

Cardinalilty:這個值非常關鍵，表示索引中唯一值的數目的估計值。Cardinality表的行數應儘可能接近1（爲什麼？怎麼計算這個值？），下面會對這個字段進行詳細的說明：

Sub_part:是否是列的部分索引，例如上面的idx_e就顯示10，表示只對e列的前10個字符進行索引。如果索引整個列，則該字段爲NULL。(idx_b,idx_c_b爲什麼只索引191個呢？)

Packed:關鍵字如何被壓縮。若沒有，則顯示爲NULL

Null:是否索引的列含有NULL值，例如看到的idx_b,就表示可以有NULL值，所以顯示YES，而主鍵和定義了c列就不允許有NULL值

Index_type:索引的類型，InnoDB存儲引擎只支持B+樹索引，所以這裏顯示的都是BTREE。

Comment:註釋

Index_comment:索引註釋

////////////////////////////////////////

Cardinalilty:因爲單詞的意思爲：基數、基準的意思

並不是在所有的查詢條件中出現的列都需要添加索引，對於什麼時候添加B+樹索引，一般情況下，在訪問表中很少的一部分數據時使用B+樹索引纔有意義。對於性別字段、地區字段、

類型字段，它們可取值的範圍很小，成爲低選擇性。

e.g:

select * from stu where sex='F';

按性別進行查詢時，可取值的範圍一般只有'M','F'。因此上述得到結果可能是表50%的數據。這時添加索引完全沒有必要。

相反，如果某個字段的取值範圍比較廣，幾乎沒有重複，即屬於高選擇性，則使用索引比較合適。

那怎麼樣看索引是否有高選擇率呢？

一是通過show index結果中的列Cardinalilty來觀察，此值表示索引中不重複記錄數量的預估值（是通過採用來進行計算的），這個值不是一個精確值。Cardinalilty/table_row_counts儘可能的接近1

InnoDB存儲引擎內部對更新Cardinalilty信息的策略爲：

1.表中1/16的數據已發生變化就需要更新信息

2.stat_modified_counter>2 000 000 000 (20億)

也是就是當計數器stat_modified_counter發生變化的次數大於20億時，需要更新Cardinalilty信息。

第二種方法可以用SQL語句來進行計算是否是高選擇率：

DROP TABLE IF EXISTS t_car;

CREATE TABLE t_car(

id BIGINT NOT NULL AUTO_INCREMENT ,

mem_id BIGINT NOT NULL,

status TINYINT(1),

dept_no INT NOT NULL,

PRIMARY KEY(id),

KEY idx_mem_id(mem_id),

KEY idx_status(status),

KEY idx_dept_no(dept_no)

)ENGINE=innodb;

insert into t_car values(NULL,1,1,101);

insert into t_car values(NULL,2,0,102);

insert into t_car values(NULL,3,1,103);

insert into t_car values(NULL,4,1,104);

insert into t_car values(NULL,5,0,105);

insert into t_car values(NULL,6,1,106);

insert into t_car values(NULL,7,1,107);

insert into t_car values(NULL,8,0,108);

insert into t_car values(NULL,9,1,109);

insert into t_car values(NULL,10,1,110);

insert into t_car

select NULL,id,status,dept_no from t_car; -- 多多執行幾次

mysql>select count(*) from t_car;

+----------+

| count(*) |

+----------+

| 20480 |

+----------+

1 row in set (0.10 sec)

mysql>update t_car set mem_id=id;

Query OK, 20460 rows affected (3.43 sec)

Rows matched: 20480 Changed: 20460 Warnings: 0

mysql>show index from t_car;

+-------+------------+-------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

+-------+------------+-------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

| t_car | 0 | PRIMARY | 1 | id | A | 20108 | NULL | NULL | | BTREE | | |

| t_car | 1 | idx_status | 1 | status | A | 10054 | NULL | NULL | YES | BTREE | | |

+-------+------------+-------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

4 rows in set (0.00 sec)

root@localhost[zjkj]:04:07:14>select count(distinct(id))/count(*) as id_select,count(distinct(status))/count(*) as status from t_car;

+-----------+--------+

| id_select | status |

+-----------+--------+

| 1.0000 | 0.0001 |

+-----------+--------+

1 row in set (0.16 sec)

#說明id列的選擇率較高，適合建立索引，而status列選擇性較低，因此status列上不適合建立索引。

這也是爲什麼Cardinality表的行數應儘可能接近1越好的緣故了。

MySQL的show index 選擇率

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

nodejs學習06——小案例

評估統計算法在銀行僞造鈔票檢測中的價值

C# Xmlserializer 程序集內存泄露

Java ThreadPoolShutdown

5月21日相聚上海張江！與文心大模型一起共建大模型產業應用生態圈

OpenLDAP高可用架構實戰

LDAP簡介

博客彙總

LDAP及phpLDAPAdmin部署

容量預估/規劃及故障演練

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結