MySQL45讲之优化器选错索引

2023年5月24日下午4:03 • 数据库 • 阅读 108

前言

本文简要介绍了优化器选择索引的依据，以及如何人为地引导优化器选择较好的执行方案。

[En]

This paper briefly introduces the basis for the optimizer to select the index and the ways to artificially guide the optimizer to choose a better execution scheme.

为什么会出现选错索引

可能是统计索引基数信息错误，导致优化器错选索引，也可能是 MySQL的 bug。

选择依据

优化器根据扫描的行记录的数量、返回表的次数、是否创建临时表以及是否对其进行排序来选择索引。

[En]

The optimizer selects the index based on the number of scanned row records, the number of times the table is returned, whether to create a temporary table, and whether to sort it.

索引扫描行数。通过取样的方式统计索引列上不同的值数量，取 N张数据页，统计页面上不同值的数量，然后估算总的不同数量（基数 cardinality），这也称之为索引的”区分度”。可以通过 SHOW INDEX FROM table_name来查看每个索引的基数。

对于这条执行语句 SELECT * FROM t WHERE a BETWEEN (1, 10000) AND b BETWEEN (50000, 100000) ORDER BY b LIMIT 1，从扫描行数上考虑，应该选择 a上的索引，但通过 MySQL执行计划发现，实际选择了 b索引。因为优化器考虑了需要根据 b排序，选择 b索引扫描获取记录可以避免再排序。但是，使用 a索引的查询耗时远比使用 b索引耗时低。

如何避免选错索引

1、强制使用索引

使用 force Index(a)强制 SQL执行时采用某个索引，比如 SELECT * FROM t force Index(a) WHERE a BETWEEN (1, 10000) AND b BETWEEN (50000, 100000) ORDER BY b LIMIT 1。

2、重新计算基数

因为 MySQL取样估计基数可能存在比较大的误差，导致优化器选择低效的执行方案。为了避免这个统计信息的问题，可以使用 Analyze TABLE t来重新统计信息。

3、选择更合适的索引或者删除误用的索引

提问

表结构
CREATE TABLE t (
  id int(11) NOT NULL,
  a int(11) DEFAULT NULL,
  b int(11) DEFAULT NULL,
  PRIMARY KEY (id),
  KEY a (a),
  KEY b (b)
) ENGINE=InnoDB;

创建过程，插入 100000 条数据
delimiter ;;
create procedure idata()
begin
  declare i int;
  set i=1;
  while(i

如果在执行事务 B之前不开启事务 A，那么语句 explain select * from t where a between 10000 and 20000;扫描行数约为 10000行；当开启事务 A，则扫描行数约为 37000行，这是为什么呢？

解释：
不开启事务 A扫描行数为 10000行，因为 MySQL采用的是标记删除的方法，在 purge线程还未执行之前，索引树和表数据并没有清除。当新插入 100000行数据时，因为主键和已经删除的相同，所以会直接复用之前删除的空间，所以优化器抽样判断扫描的行数是 10000行。

开启事务 A扫描行数为 37000行，因为事务 A开启了一致性读，于是新插入数据时，不能复用已经删除的空间，必须开辟新的空间存储，使得索引数据页的数据更加密集，从而优化器抽样判断扫描行数是 37000行。

Original: https://www.cnblogs.com/flowers-bloom/p/select-error-index.html
Author: flowers-bloom
Title: MySQL45讲之优化器选错索引

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/508167/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

在RAC上部署OGG并配置OGG高可用

简介由于业务系统要与大数据平台进行对接，需要将Oracle DB的数据同步到异构数据库上，故选用也不得不用上了Goldengate方案然鹅，OGG在RAC上的HA配置一直众说纷纭…

数据库 2023年6月16日
0078
Hello Word

编写代码 public class hello{ public static void main(String[] args){ System.out.print("H…

数据库 2023年6月11日
0049
Linux–>软件包管理

rpm用于互联网下载包的打包和安装工具，它包含在某些Linux分发版本中。它生成具有.RPM扩展名的文件。 RPM是RedHat Package Manager(RedHat软件…

数据库 2023年6月14日
0074
spark报错：WARN util.Utils: Service ‘SparkUI’ could not bind on port 4040. Attempting port 4041.4042等错误

spark报错：warn util.utils::service ‘sparkUI’ can not bind on part 4040.Attemptin…

数据库 2023年6月14日
0067
ERROR 1396 (HY000): Operation ALTER USER failed for ‘root’@’localhost’

发现网上很多帖子都是互相抄袭的，关键是不能解决执行后的问题，在这里分享我的解决方案。 [En] Found a lot of posts on the Internet are c…

数据库 2023年5月24日
0079
08 聚集函数

聚集函数count max min sum avgcount(*)会统计null行，count列名则不会分组group by 过滤分组havingwhere能做的having都能…

数据库 2023年6月16日
0087
MySQL<=>是什么鬼

类似于相等比较 =运算符官网描述 NULL-safe equal. This operator performs an equality comparison like the …

数据库 2023年6月9日
0093
2022-8-29 javaweb 第一天 servlet/tomcat

软件架构 1、C/S架构：客户端 / 服务器——–QQ，Typora，腾讯会议。 2、B/S架构：浏览器 / 服务器——…

数据库 2023年6月14日
0074
1. SQL

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

数据库 2023年6月16日
0075
[springmvc]从前端获取参数以及显示

6.接收请求参数以及数据回显接收普通参数参数名与前端传递的参数名相同时前端表单名name=name $Title$ username: 后端收到的参数名String name…

数据库 2023年6月16日
0090
一次较波折的MySQL调优

春节假期的一天，阳光明媚，春暖花开，恰逢冬奥会开幕，想着这天一定是生肖吉日，就能顺风顺水了。没想到，我遇到了一位客户，有点波折。 [En] Spring Festival holi…

数据库 2023年5月24日
0063
Python学习笔记（十一）– Django API RESTful

（1）路由；（2）视图类（提供给用户访问相当于原来的视图函数）；（3）序列化类（提供给视图类使用，把对象序列化成Json）注意：使用rest_framework，需先 setti…

数据库 2023年6月16日
0074
MySQL学习笔记-day03

唯一性约束修饰的字段具有唯一性，不能重复。但可以为NULL。 drop table if exists t_user; create table t_user( id int, u…

数据库 2023年5月24日
0062
English words chapter 20220927

本文来自博客园，作者：ukyo–BlackJesus，转载请注明原文链接：https://www.cnblogs.com/ukzq/p/16736392.html Or…

数据库 2023年6月11日
0074
Map–部分方法

1.Map.values()方法：获取Map集合中的所有键值对象获取 Map 集合中的所有键值对象，这些键值对象将存放在另一个集合对象中 2.getOrDefault() 方法 …

数据库 2023年6月16日
0078
CentOS 7 Golang 安装

可去官网下载tar包，这里提供一个1.16的安装地址： curl -#LO https://studygolang.com/dl/golang/go1.16.linux-amd64…

数据库 2023年6月9日
00111

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

MySQL45讲之优化器选错索引

前言

为什么会出现选错索引

选择依据

如何避免选错索引

提问

大家都在看