众所周知MySQL 联合索引遵循最左前缀匹配原则,在少数情况下也会不遵循(有兴趣,可以翻一下上篇文章)。
创建 联合索引的时候,建议优先把区分度高的字段放在第一列。
至于如何计算分化程度,可以遵循以下方式。
[En]
As for how to count the degree of differentiation, you can follow the following way.
创建一个测试表以测试:
[En]
Create a test table to test:
CREATE TABLE test
(
id
int NOT NULL AUTO_INCREMENT COMMENT '主键',
a
int NOT NULL,
b
int NOT NULL,
c
int NOT NULL,
PRIMARY KEY (id
)
) ENGINE=InnoDB COMMENT='测试表';
统计每个字段的区分度:
select
count(distinct a)/count(*),
count(distinct b)/count(*),
count(distinct c)/count(*)
from test;
数值越高,分化程度越高,以第一列为主。
[En]
The higher the value, the higher the degree of differentiation, giving priority to the first column.
很多人不知道 联合索引在B+树中是怎么存储的?我简单画一下。
比如在( a
, b
)字段上面创建联合索引,存储结构类似下面这样:
叶子节点存储全部数据,用顺序指针相连,数据都是先按 a
字段排序, a
字段的值相等时再按 b
字段排序。
a
字段的值是全局有序的,分别有1,1,1,2,2,2。
b
字段的值是全局无序的,分别有1,3,5,1,3,5,只有在 a
字段的值相等时才呈现出局部有序。
所以在进行SQL查询的时候,如果where条件中没有 a
字段,只有 b
字段,是无法用到索引的,像下面这样:
select * from test where b=1;
像有些文章上面说的,在( a
, b
)两个字段上创建联合索引,就会创建两个索引,分别是( a
)和( a
, b
),这其实是一种不恰当的表述,虽然结果是对的。
让我们来做几个联合指数的经典面试问题,看看你掌握得有多好。
[En]
Let’s do a few classic interview questions of the joint index and try how well you have mastered it.
第一题:
下面这条SQL,该怎么创建 联合索引?
SELECT * FROM test WHERE a = 1 and b = 1 and c = 1;
你以为的答案是( a
, b
, c
),其实答案是6个,abc三个的排列组合,( a
, b
, c
)、( a
, c
, b
)、( b
, a
, c
)、( b
, c
, a
)、( c
, a
, b
)、( c
, b
, a
)。
MySQL优化器为了适应索引,会调整条件的顺序。
此外,面试官还说,高度差异化的领域被放在了前面,这是一个很大的好处。
[En]
Add to the interviewer that the highly differentiated fields are put at the front, which is a big bonus.
第二题:
下面这条SQL,该怎么创建 联合索引?
SELECT * FROM test WHERE a = 1 and b > 1 and c = 1;
考察的知识点是: 联合索引遇到范围匹配会停止,不会再匹配后面的索引字段。
所以答案应该是:( a
, c
, b
)和 ( c
, a
, b
)。
当创建( a
, c
, b
)和 ( c
, a
, b
)索引的时候,查询会用到3个字段的索引,效率更高。
怎么判断是用到了3个字段的索引,而不是只用到前两个字段的索引呢?
有一种非常简单的方法来查看执行计划的索引长度。
[En]
There is a very simple way to look at the index length of the execution plan.
由于int类型的字段占4个字节,3个字段长度刚好是12个字节。
第三题:
下面这条SQL,该怎么创建 联合索引?
SELECT * FROM test WHERE a in (1,2,3) and b > 1;
答案是( a
, b
)。in条件查询会被转换成等值查询,可以验证一下:
您可以使用两个字段查看索引。
[En]
You can see the index using two fields.
所以我们在平时做开发,尽量想办法把范围查询转换成in条件查询,效率更高。
文章持续更新,可以微信搜一搜「 一灯架构 」第一时间阅读更多技术干货。
Original: https://www.cnblogs.com/yidengjiagou/p/16615287.html
Author: 一灯架构
Title: 三道MySQL联合索引面试题,淘汰80%的面试者,你能答对几道
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/504962/
转载文章受原作者版权保护。转载请注明原作者出处!