MySQL优化之索引解析

2023年5月24日上午11:34 • 数据库 • 阅读 73

索引的本质

MySQL索引或者说其他关系型数据库的索引的本质就只有一句话， 以空间换时间。

索引的作用

索引关系型数据库为了加速对表中行数据检索的（ 磁盘存储的） 数据结构

索引的分类

数据结构上面的分类

HASH 索引
等值匹配效率高
不支持范围查找
树形索引
二叉树，递归二分查找法，左小右大
平衡二叉树，二叉树到平衡二叉树，主要原因是左旋右旋
1. 缺点1，IO次数过多
2. 缺点2，IO利用率不高，IO饱和度
多路平衡查找树（B-Tree）
1. 特点，大大的减少了树的高度
B+树
1. 特点，采用左闭合的比较方式
2. 根节点支节点没有数据区，只有叶子结点才包含数据区（说白了就是即便在根节点和子节点已经定位到，因为没有数据区的原因也不会停留，会一直找到叶子结点为止。）
3. 当我们搜索13这条数据时，在根节点和子节点都能定位，但是一直会找到叶子结点。 二叉树平衡二叉树，B树对比
  
  如图显示如果是自增主键情况下：二叉树显然不适合做关系型数据库索引（和全表扫描没什么区别）。平衡二叉树呢，虽然解决了这种情况，但是同样会导致这棵树， 又瘦又高，这同样会造成上文所提到 查询IO次数过多以及 IO利用率不高。 B树呢，显然已经解决了这两个问题，所以下文来解释，为什么在这种情况下MySQL还用了B+树，又做了那些增强。

B树和B+树比较

B+树在B树上面的优化
IO效率更高（B树每个节点都会保留数据区，而B+树则不会，假设我们查询一条数据要遍历三层，那么显然B+树查询中IO消耗更小）
范围查找效率更高（如图，B+树已经形成了一个天然链表形式，只需要根据最结尾的链式结构查找）
基于索引的数据扫描效率更高。

索引类型的分类

索引类型可分为两类:
主键索引
辅佐索引(二级索引)
1. 唯一性索引
2. 复合索引
3. 普通索引
4. 覆盖索引
  
  主键索引相对来说性能是最好的，但是对于SQL优化，其实大多时候我们都在辅佐索引上面做一些改进和补充。

B+树在储存引擎层面落地

我们创建两个表分别为test_innodb（采用InnoDB作为储存引擎）test_myisam（采用MyISAM作为储存引擎）下图是两张表磁盘落地的相关文件，这两个储存引擎在B+树磁盘落地式截然不同的。

B+树在MyISAM落地

*.frm文件是表格骨架文件比如这个表中的id字段name字段是什么类型的存储在这里
*.MYD（D=data）则储存数据
*.MYI （I=index）则储存索引

比如现在执行如下sql语句，那么在MyISAM中他就是先在test_myisam.MYI中查找到103然后拿到0x194281这个地址然后再去test_myisam.MYD中找到这个数据返回。

SELECT id,name from test_myisam where id =103

* 如果test_myisam表中，id为主键索引，name也是一个索引，那么在test_myisam.MYI中则会有两个平级的B+树，这也导致MyISAM引擎中 主键索引和二级索引是没有主次之分的，是平级关系。因为这种机制在MyISAM引擎中，有可能使用多个索引，在InnoDB中则不会出现这种情况。

B+树在InnoDB落地

InnoDB不像MyISAM来独立一个MYD 文件来存储数据，它的数据直接存储在 叶子结点关键字对应的数据区在这保存这一个id列所有行的详细记录。
InnoDB 主键索引和辅助索引关系我们现在执行如下SQL语句,他会先去找辅助索引，然后找到辅助索引下101的主键，再去回表（二次扫描）根据主键索引查询103这条数据将其返回。

SELECT id,name from test_myisam where name ='zhangsan'

这里就有一个问题了，为什么不像MyISAM在辅助索引下直接记录磁盘地址，而是要多此一举再去回表扫描主键索引，这个问题在下面相关面试题中回答，记一下这个问题是这里来的。

相关面试题

为什么MySQL选择B+树作为索引结构

这个就不说了，上文应该讲清楚了。
B+树在MyISAM和InnoDB落地区别。

这个可以总结一下，MyISAM落地数据储存会有三个类型文件，.frm文件是表骨架文件，.MYD（D=data）则储存数据，.MYI （I=index）则储存索引，MyISAM引擎中 主键索引和二级索引平级关系，在MyISAM引擎中，有可能使用多个索引，InnoDB则相反， 主键索引和二级索有严格的主次之分在InnoDB一条语句只能用一个索引要么不用。
如何判断一条sql语句是否使用了索引。

可以通过执行计划来判断可以在sql语句前explain/ desc
set global optimizer_trace=’enabled=on’ 打开执行计划开关他将会把 每一条查询sql执行计划记录在information_schema 库中OPTIMIZER_TRACE表中
为什么主键索引最好选择自增列？

[En]

Why is it best to choose self-incrementing columns for primary key indexes?*
自增列，数据插入时整个索引树是只有右边在增加的，相对来说索引树的变动更小。
为什么不建议频繁变化的列使用索引？

[En]

Why is it not recommended to use indexes for columns that change frequently?*
和上一个问题原因一样，当一个索引经常发生变化，那么就意味这，这个缩印树也要经常发生变化。4
为何不建议对重复率较高的栏目建立索引？

[En]

Why is it not recommended to build an index for columns with high repetition?*
这个原因是因为离散性，比如说，一张一百万数据的表，其中一个字段代表性别，0代表男1代表女，把这字段加了索引，那么在索引树上，将会有大量的重复数据。而我们常见的索引建立一般都是驱动型的。其目的是，尽可能的 删减数据的查询范围，这个显然是不匹配的。
什么是联合索引

联合索引是一个包含了多个功效的索引，他只是一个索引而不是多个，其次，单列索引是一种特殊的联合索引联合索引的创立要遵循最左前置原则（最常用列>离散度>占用空间小）
什么是覆盖索引

通过索引项信息可直接返回所需要查询的索引列，该索引被称之为覆盖索引，说白了就是 不需要做回表操作，可以从二级索引中直接取到所需数据。
什么是ICP机制

索引下推，简单点来说就是，在sql执行过程中，面对where 多条件过滤时，通过 一个索引，完成数据搜索和过滤条件其，特点能减少io操作。
在InnoDB表中不可能没有主键对还是不对原因是什么？
首先这句话是对的，但是情况有三种:
1. 就是在你手动显式指定这一个字段为主键时候，会以这一个字段为聚集索引。
2. 在没有显式指定主键时候有两种情况：
3. 他会寻找第一个UK（unique key）作为主键索引组织索引编排。
4. 如果既没有指定主键也没有UK的情况下，此时会以rowId（在InnoDB表中每一个记录都会有一个隐藏（6byte）的rowId）为聚集索引。
什么是回表操作在InnoDB 中基于辅助索引查询的内容，从辅助索引中无法直接获取，需要基于主键索引的二次扫描的操作叫做回表操作。
为什么在InnoDB 中辅助索引叶子结点数据区记录的是主键索引的值而不是像MyISAM中去记录磁盘地址。
这个原因其实很简单，因为主键索引的数据结构是会经常发生变化的，如果在辅助索引数据区记录磁盘地址，那么假设我们有10个辅助索引，当我们主键索引结构发生变化后，还要一个个去通知辅助索引，且主键索引结构是经常发生变化的，增删都有可能影响他的
数据结构。

版权归属：泪梦红尘
本文链接： https://www.bss2.com/archives/mysql-opt-index

Original: https://www.cnblogs.com/lmhcblog/p/16009320.html
Author: 泪梦红尘blog
Title: MySQL优化之索引解析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/505560/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

三分钟入门 InnoDB 存储引擎中的表锁和行锁

各位对 “锁” 这个概念应该都不是很陌生吧，Java 语言中就提供了两种锁：内置的 synchronized 锁和 Lock 接口，使用锁的目的就是管理对共…

数据库 2023年6月6日
0079
AQS源码探究之竞争锁资源

AQS源码探究—竞争锁资源我们进入ReentrantLock源码中查看其内部类 Sync 对AQS进行扩展公共方法并定义抽象方法的抽象类 FaireSync 实现公平…

数据库 2023年6月11日
0074
idea提交代码到get

1、从get上拉下来的代码就有一个master，在写代码的时候可以拉一个分支，分支名称随意 2、更新master 如上截图选择master checkout切换到master分支 …

数据库 2023年6月9日
0089
Burpsuite安装SQLmap操作

Burpsuite安装SQLmap插件步骤：安装准备： Burpsuite工具、SQLmap工具、python解释器 1.打开burpsuite插件； 2.找到CO2插件； 3….

数据库 2023年6月9日
0084
fiddler的mock数据与二次开发示例

fiddler的使用记录 fiddler了解上官网下载工具，然后安装使用，https://www.telerik.com/fiddler，如果对该工具不熟悉，还有直白的教程，看过…

数据库 2023年6月6日
00102
Cobar提出的一种在分库场景下对Order By / Limit 的优化

搜索关注微信公众号”捉虫大师”，后端技术分享，架构设计、性能优化、源码阅读、问题排查、踩坑实践。本文已收录 https://github.com/lkxia…

数据库 2023年5月24日
00102
mac(m1)配置my.cnf

今天开始学习了数据库，在安装MySQL之后启动一直报错，然后在网上找了很多解决方法，最后用以下方法解决对于习惯了windows的小伙伴来说，直接去安装目录里边修改my.ini就可…

数据库 2023年5月24日
0088
JDK自带线程池学习

JDK自带线程池线程池的状态线程有如下状态 RUNNING状态：Accept new tasks and process queued tasks SHUTDOWN状态：Don…

数据库 2023年6月11日
0099
mybatis 拦截器

1.mybatis拦截器介绍拦截器可在mybatis进行sql底层处理的时候执行额外的逻辑，最常见的就是分页逻辑、对结果集进行处理过滤敏感信息等。 public Paramete…

数据库 2023年6月16日
0064
visual studio 2015 IOS开发连接mac时提示错误couldn’t connect to xxxx, please try again的一个方法

本人使用虚拟机MAC。原本使用虚拟机中的VS2015连接正常没有问题。但是当把MAC的虚拟机文件COPY到另一个机器上，提示”couldn’t conne…

数据库 2023年6月14日
0079
基于Redis&MySQL接口幂等性设计

基于Redis&MySQL接口幂等性设计欲把相思说似谁，浅情人不知。幂等性即多次调用接口或方法不会改变业务状态，可以保证重复调用的结果和单次调用的结果一致。前端重复提…

数据库 2023年6月14日
0070
05-ElasticSearch高级搜索

* package com.coolman.hotel.test; import com.coolman.hotel.pojo.HotelDoc; import com.faste…

数据库 2023年6月16日
0080
【SQL实战】一条SQL统计全国各地疫情分布情况

— 疫情表，三个字段：城市/地区省份当前确诊人数DROP TABLE IF EXISTS yiqing;CREATE TABLE datacenter.yiqing…

数据库 2023年5月24日
0089
Linux下搭建git分布式管理

VMware 虚拟机中搭建步骤一、 1.查一下ip 2.和Xshell连接起来 3.看是否连接上 4.这就ok了 5.输入 yum install git yum install…

数据库 2023年6月6日
0082
第17章触发器

第17章触发器在实际开发中，我们经常会遇到这样的情况：有 2 个或者多个相互关联的表，如 商品信&#x…

数据库 2023年6月6日
00113
巧用自定义注解，一行代码搞定审计日志

任何一个软件系统，都不可避免的会碰到【信息安全】这个词，尤其是对于刚入行的新手，比如我，我刚入行的时候，领导让我做一个数据报表导出功能，我就按照他的意思去做，至于谁有权限操作导出…

数据库 2023年6月14日
0058

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30