MySQL优化之索引解析

索引的本质

MySQL索引或者说其他关系型数据库的索引的本质就只有一句话, 以空间换时间

索引的作用

索引关系型数据库为了 加速对表中行数据检索的( 磁盘存储的) 数据结构

索引的分类

数据结构上面的分类

  • HASH 索引
  • 等值匹配效率高
  • 不支持范围查找
  • 树形索引
  • 二叉树,递归二分查找法,左小右大
  • 平衡二叉树,二叉树到平衡二叉树,主要原因是左旋右旋
    1. 缺点1,IO次数过多
    2. 缺点2,IO利用率不高,IO饱和度
  • 多路平衡查找树(B-Tree)
    1. 特点,大大的减少了树的高度
  • B+树
    1. 特点,采用左闭合的比较方式
    2. 根节点支节点没有数据区,只有叶子结点才包含数据区(说白了就是即便在根节点和子节点已经定位到,因为没有数据区的原因也不会停留,会一直找到叶子结点为止。)
    3. 当我们搜索13这条数据时,在根节点和子节点 都能定位,但是一直会找到叶子结点。 MySQL优化之索引解析二叉树平衡二叉树,B树对比

      如图显示如果是自增主键情况下: 二叉树显然不适合做关系型数据库索引(和全表扫描没什么区别)。 平衡二叉树呢,虽然解决了这种情况,但是同样会导致这棵树, 又瘦又高,这同样会造成上文所提到 查询IO次数过多以及 IO利用率不高。 B树呢,显然已经解决了这两个问题,所以下文来解释,为什么在这种情况下MySQL还用了B+树,又做了那些增强。

MySQL优化之索引解析
B树和B+树比较

MySQL优化之索引解析
  • B+树在B树上面的优化
  • IO效率更高(B树每个节点都会保留数据区,而B+树则不会,假设我们查询一条数据要遍历三层,那么显然B+树查询中IO消耗更小)
  • 范围查找效率更高(如图,B+树已经形成了一个天然链表形式,只需要根据最结尾的链式结构查找) MySQL优化之索引解析
  • 基于索引的数据扫描效率更高。

索引类型的分类

  • 索引类型可分为两类:
  • 主键索引
  • 辅佐索引(二级索引)
    1. 唯一性索引
    2. 复合索引
    3. 普通索引
    4. 覆盖索引

      主键索引相对来说性能是最好的,但是对于SQL优化,其实大多时候我们都在辅佐索引上面做一些改进和补充。

B+树在储存引擎层面落地

  • 我们创建两个表分别为test_innodb(采用InnoDB作为储存引擎)test_myisam(采用MyISAM作为储存引擎)下图是两张表磁盘落地的相关文件,这两个储存引擎在B+树磁盘落地式截然不同的。 MySQL优化之索引解析

B+树在MyISAM落地

  • *.frm文件是表格骨架文件比如这个表中的id字段name字段是什么类型的存储在这里
  • *.MYD(D=data)则储存数据
  • *.MYI (I=index)则储存索引

MySQL优化之索引解析
  • 比如现在执行如下sql语句 ,那么在MyISAM中他就是先在test_myisam.MYI中查找到103然后拿到0x194281这个地址然后再去test_myisam.MYD中找到这个数据返回。
SELECT id,name from test_myisam where id =103

MySQL优化之索引解析
* 如果test_myisam表中,id为主键索引,name也是一个索引,那么在test_myisam.MYI中则会有两个平级的B+树,这也导致MyISAM引擎中 主键索引和二级索引是没有主次之分的,是平级关系。因为这种机制在MyISAM引擎中,有可能使用多个索引,在InnoDB中则不会出现这种情况。

B+树在InnoDB落地

MySQL优化之索引解析

MySQL优化之索引解析
  • InnoDB不像MyISAM来独立一个MYD 文件来存储数据,它的数据直接存储在 叶子结点关键字对应的数据区在这保存这一个id列所有行的详细记录。
  • InnoDB 主键索引和辅助索引关系 我们现在执行如下SQL语句,他会先去找辅助索引,然后找到辅助索引下101的主键,再去回表(二次扫描)根据主键索引查询103这条数据将其返回。
SELECT id,name from test_myisam where name ='zhangsan'

这里就有一个问题了,为什么不像MyISAM在辅助索引下直接记录磁盘地址,而是要多此一举再去回表扫描主键索引,这个问题在下面相关面试题中回答,记一下这个问题是这里来的。

MySQL优化之索引解析

相关面试题

  • 为什么MySQL选择B+树作为索引结构

    这个就不说了,上文应该讲清楚了。

  • B+树在MyISAM和InnoDB落地区别。

    这个可以总结一下,MyISAM落地数据储存会有三个类型文件 ,.frm文件是表骨架文件,.MYD(D=data)则储存数据 ,.MYI (I=index)则储存索引,MyISAM引擎中 主键索引和二级索引平级关系,在MyISAM引擎中,有可能使用多个索引,InnoDB则相反, 主键索引和二级索有严格的主次之分在InnoDB一条语句只能用一个索引要么不用。

  • 如何判断一条sql语句是否使用了索引。

    可以通过执行计划来判断 可以在sql语句前explain/ desc
    set global optimizer_trace=’enabled=on’ 打开执行计划开关他将会把 每一条查询sql执行计划记录在information_schema 库中OPTIMIZER_TRACE表中

  • 为什么主键索引最好选择自增列?
    [En]

    Why is it best to choose self-incrementing columns for primary key indexes?*

    自增列,数据插入时整个索引树是只有右边在增加的,相对来说索引树的变动更小。

  • 为什么不建议频繁变化的列使用索引?
    [En]

    Why is it not recommended to use indexes for columns that change frequently?*

    和上一个问题原因一样,当一个索引经常发生变化,那么就意味这,这个缩印树也要经常发生变化。4

  • 为何不建议对重复率较高的栏目建立索引?
    [En]

    Why is it not recommended to build an index for columns with high repetition?*

    这个原因是因为离散性,比如说,一张一百万数据的表,其中一个字段代表性别,0代表男1代表女,把这字段加了索引,那么在索引树上,将会有大量的重复数据。而我们常见的索引建立一般都是驱动型的。其目的是,尽可能的 删减数据的查询范围,这个显然是不匹配的。

  • 什么是联合索引

    联合索引是一个包含了多个功效的索引,他只是一个索引而不是多个, 其次,单列索引是一种特殊的联合索引 联合索引的创立要遵循最左前置原则(最常用列>离散度>占用空间小)

  • 什么是覆盖索引

    通过索引项信息可直接返回所需要查询的索引列,该索引被称之为覆盖索引,说白了就是 不需要做回表操作,可以从二级索引中直接取到所需数据。

  • 什么是ICP机制

    索引下推,简单点来说就是,在sql执行过程中,面对where 多条件过滤时,通过 一个索引,完成数据搜索和过滤条件其,特点能减少io操作。

  • 在InnoDB表中不可能没有主键对还是不对原因是什么?
  • 首先这句话是对的,但是情况有三种:
    1. 就是在你手动显式指定这一个字段为主键时候,会以这一个字段为聚集索引。
    2. 在没有显式指定主键时候有两种情况:
    3. 他会寻找第一个UK(unique key)作为主键索引组织索引编排。
    4. 如果既没有指定主键也没有UK的情况下,此时会以rowId(在InnoDB表中每一个记录都会有一个隐藏(6byte)的rowId)为聚集索引。
  • 什么是回表操作 在InnoDB 中基于辅助索引查询的内容,从辅助索引中无法直接获取,需要基于主键索引的二次扫描的操作叫做回表操作。
  • 为什么在InnoDB 中辅助索引叶子结点数据区记录的是主键索引的值而不是像MyISAM中去记录磁盘地址。
  • 这个原因其实很简单,因为主键索引的数据结构是会经常发生变化的,如果在辅助索引数据区记录磁盘地址,那么假设我们有10个辅助索引,当我们主键索引结构发生变化后,还要一个个去通知辅助索引,且主键索引结构是经常发生变化的,增删都有可能影响他的
    数据结构。

版权归属: 泪梦红尘
本文链接: https://www.bss2.com/archives/mysql-opt-index

Original: https://www.cnblogs.com/lmhcblog/p/16009320.html
Author: 泪梦红尘blog
Title: MySQL优化之索引解析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/505560/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 常用API(Java)

    Object 场景:当我们使用toString方法想要输出对象变量时,官方提供的toString方法会直接输出对象所在的地址,而不是我们想要的对象变量,所以我们要把toString…

    数据库 2023年6月16日
    093
  • gitlab-runner浅谈——【此作业已阻塞,因为该项目没有分配任何可用Runner】解决方法

    作为gitlab的初学者,只能简单记录下自己遇到的问题。不求甚解 安装 下载最新的二进制文件 (参考官网) Download the binary for your system …

    数据库 2023年6月11日
    0146
  • 使用clipboard.js复制文字+图片到微信后图片不显示问题处理

    使用clipboard.js复制文字 +图片,粘贴到微信不显示图片,而QQ可以。 解决方案: 图片链接使用http,不要使用https。 使用clipboard.js实现复制功能 …

    数据库 2023年6月14日
    0113
  • vue入门(一)

    模板语法 插值语法 功能:用于解析标签体内容 写法:{{xxx}},xxx是js表达式,且可以直接读取到data中的所有属性。 指令语法 功能:用于解析标签(包括:标签属性、标签内…

    数据库 2023年6月6日
    090
  • 滑动窗口

    滑动窗口,记录左边界,通过map避免字符重复。 class Solution { public int lengthOfLongestSubstring(String s) { i…

    数据库 2023年6月11日
    078
  • 获取字典中values值中最大的数,返回对应的keys

    1.字典中键值对的获取 print(data.values()) # 查看字典的值 print(data.keys()) # 查看字典的key 2.对字典中的值进行排序 sorte…

    数据库 2023年6月16日
    075
  • SpringMvc(四)- 下载,上传,拦截器

    1、图片下载 图片下载:将服务器端的文件以流的形式写到客户端,通过浏览器保存到本地,实现下载; 1.1 图片下载步骤 1.通过session获取上下文对象(session.getS…

    数据库 2023年6月16日
    069
  • Mysql 手册

    MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQ…

    数据库 2023年5月24日
    0122
  • JVM-堆

    堆 JAVA技术交流群:737698533 堆核心概述 此内存区域的唯一目的就是存放对象实例 一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域。 Java堆区在JV…

    数据库 2023年6月16日
    0110
  • MIT 6.824 Lab2D Raft之日志压缩

    书接上文Raft Part C | MIT 6.824 Lab2C Persistence。 实验准备 实验代码: git://g.csail.mit.edu/6.824-gola…

    数据库 2023年6月14日
    0155
  • 面试记录

    JVM线程属于用户态还是内核态 当进程运行在ring3级别时为用户态,ring0级别时为内核态 有些操作需要有内核权限才能进行,那么有三种由用户态切换到内核态的情况: 系统调用:操…

    数据库 2023年6月16日
    0107
  • MySQL实战45讲 18

    18 | 为什么这些SQL语句逻辑相同,性能却差异巨大? 在 MySQL 中,有很多看上去逻辑相同,但性能却差异巨大的 SQL 语句。对这些语句使用不当的话,就会不经意间导致整个数…

    数据库 2023年6月14日
    082
  • MySQL中实现中文转拼音

    — 插入数据 INSERT INTO t_base_pinyin ( pin_yin_, code_ ) VALUES ( "a", 20319 ),( &q…

    数据库 2023年5月24日
    073
  • MySQL中实现中文转拼音

    — 插入数据 INSERT INTO t_base_pinyin ( pin_yin_, code_ ) VALUES ( "a", 20319 ),( &q…

    数据库 2023年6月14日
    0102
  • The user specified as a definer(‘mysql.infochema’@”localhost’) does not exist

    最近将之前用的 mysql5.5 升级到了 mysql8.0,第一天还能正常使用,几天没用后,登录发现报错:The user specified as a definer (&#8…

    数据库 2023年6月6日
    084
  • mybatis-延迟加载

    本文主要介绍下mybatis的延迟加载,从原理上介绍下怎么使用、有什么好处能规避什么问题。延迟加载一般用于级联查询(级联查询可以将主表不能直接查询的数据使用自定义映射规则调用字表来…

    数据库 2023年6月16日
    074
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球