MySQL 回表

2023年6月14日下午2:21 • 数据库 • 阅读 76

MySQL 回表

五花马，千金裘，呼儿将出换美酒，与尔同销万古愁。

一、简述

回表，顾名思义就是回到表中，也就是先通过普通索引扫描出数据所在的行，再通过行主键ID 取出索引中未包含的数据。所以回表的产生也是需要一定条件的，如果一次索引查询就能获得所有的select 记录就不需要回表，如果select 所需获得列中有其他的非索引列，就会发生回表动作。即基于非主键索引的查询需要多扫描一棵索引树。

二、InnoDB 引擎有两大类索引

要弄明白回表，首先得了解 InnoDB 两大索引，即聚集索引（clustered index）和普通索引（secondary index）。

聚集索引（clustered index ）

InnoDB 聚集索引的叶子节点存储行记录，因此，InnoDB 必须要有且只有一个聚集索引。

如果表定义了主键，则Primary Key 就是聚集索引；
如果表没有定义主键，则第一个非空唯一索引（Not NULL Unique ）列是聚集索引；
否则，InnoDB 会创建一个隐藏的row-id 作为聚集索引；

普通索引（secondary index ）

普通索引也叫二级索引，除聚簇索引外的索引都是普通索引，即非聚簇索引。

InnoDB的普通索引叶子节点存储的是主键（聚簇索引）的值，而MyISAM的普通索引存储的是记录指针。

三、回表示例

数据准备

先创建一张表 t_back_to_table ，表中id 为主键索引即聚簇索引，drinker_id 为普通索引。

CREATE TABLE t_back_to_table (

id INT PRIMARY KEY,

drinker_id INT NOT NULL,

drinker_name VARCHAR ( 15 ) NOT NULL,

drinker_feature VARCHAR ( 15 ) NOT NULL,

INDEX ( drinker_id )

) ENGINE = INNODB;

再执行下面的 SQL 语句，插入四条测试数据。

INSERT INTO t_back_to_table ( id, drinker_id, drinker_name, drinker_feature )

VALUES

( 1, 2, '广西-玉林', '喝到天亮' ),

( 2, 1, '广西-河池', '白酒三斤半啤酒随便灌' ),

( 3, 3, '广西-贵港', '喝到晚上' ),

( 4, 4, '广西-柳州', '喝酒不吃饭' );

NO回表case

使用主键索引id ，查询出id 为3 的数据。

EXPLAIN SELECT * FROM t_back_to_table WHERE id = 3;

执行 EXPLAIN SELECT * FROM t_back_to_table WHERE id = 3，这条SQL 语句就不需要回表。

因为是根据主键的查询方式，则只需要搜索 ID 这棵B+树，树上的叶子节点存储了行记录，根据这个唯一的索引，MySQL 就能确定搜索的记录。

回表case

使用 drinker_id 这个索引来查询drinker_id = 3 的记录时就会涉及到回表。

SELECT * FROM t_back_to_table WHERE drinker_id = 3;

因为通过 drinker_id 这个普通索引查询方式，则需要先搜索drinker_id 索引树(该索引树上记录着主键ID的值)，然后得到主键ID 的值为3 ，再到 ID 索引树搜索一次。这个过程虽然用了索引，但实际上底层进行了两次索引查询，这个过程就称为回表。

回表小结

对比发现，基于非主键索引的查询需要多扫描一棵索引树，先定位主键值，再定位行记录，它的性能较扫一遍索引树更低。
在应用中应该尽量使用主键查询，这里表中就四条数据，如果数据量大的话，就可以明显的看出使用主键查询效率更高。
使用聚集索引（主键或第一个唯一索引）就不会回表，普通索引就会回表。

四、索引存储结构

InnoDB 引擎的聚集索引和普通索引都是B+Tree 存储结构，只有叶子节点存储数据。

新的B+树结构没有在所有的节点里存储记录数据，而是只在最下层的叶子节点存储，上层的所有非叶子节点只存放索引信息，这样的结构可以让单个节点存放更多索引值，增大Degree 的值，提高命中目标记录的几率。
这种结构会在上层非叶子节点存储一部分冗余数据，但是这样的缺点都是可以容忍的，因为冗余的都是索引数据，不会对内存造成大的负担。

聚簇索引

id 是主键，所以是聚簇索引，其叶子节点存储的是对应行记录的数据。

聚簇索引存储结构

如果查询条件为主键（聚簇索引），则只需扫描一次B+树即可通过聚簇索引定位到要查找的行记录数据。

如：

SELECT * FROM t_back_to_table WHERE id = 1;

查找过程：

聚簇索引查找过程

普通索引

drinker_id 是普通索引（二级索引），非聚簇索引的叶子节点存储的是聚簇索引的值，即主键ID的值。

普通索引存储结构

如果查询条件为普通索引（非聚簇索引），需要扫描两次B+树。

第一次扫描先通过普通索引定位到聚簇索引的值。
第二次扫描通过第一次扫描获得的聚簇索引的值定位到要查找的行记录数据。

如：

SELECT * FROM t_back_to_table WHERE drinker_id = 1;

（1）第一步，先通过普通索引定位到主键值id=1；

（2 ）第二步，回表查询，再通过定位到的主键值即聚集索引定位到行记录数据。

普通索引查找过程

五、如何防止回表

既然我们知道了有回表这么回事，肯定就要尽可能去防微杜渐。最常见的防止回表手段就是索引覆盖，通过索引打败索引。

索引覆盖

为什么可以使用索引打败索引防止回表呢？因为其只需要在一棵索引树上就能获取SQL所需的所有列数据，无需回表查询。

例如：SELECT * FROM t_back_to_table WHERE drinker_id = 1;

如何实现覆盖索引？

常见的方法是将被查询的字段，建立到联合索引中。

解释性SQL的explain的输出结果Extra字段为Using index时表示触发了索引覆盖。

No覆盖索引case1

继续使用之前创建的 t_back_to_table 表，通过普通索引drinker_id 查询id 和 drinker_id 列。

EXPLAIN SELECT id, drinker_id FROM t_back_to_table WHERE drinker_id = 1;

explain分析：为什么没有创建覆盖索引Extra字段仍为Using index，因为drinker_id 是普通索引，使用到了drinker_id 索引，在上面有提到普通索引的叶子节点保存了聚簇索引的值，所以通过一次扫描B+树即可查询到相应的结果，这样就实现了隐形的覆盖索引，即没有人为的建立联合索引。（drinker_id 索引上包含了主键索引的值）

No覆盖索引case2

继续使用之前创建的 t_back_to_table 表，通过普通索引drinker_id 查询id 、drinker_id 和drinker_feature 三列数据。

EXPLAIN SELECT id, drinker_id, drinker_feature FROM t_back_to_table WHERE drinker_id = 1;

explain分析：drinker_id 是普通索引其叶子节点上仅包含主键索引的值，而drinker_feature 列并不在索引树上，所以通过drinker_id 索引在查询到id和drinker_id 的值后，需要根据主键id 进行回表查询，得到drinker_feature 的值。此时的Extra列的NULL表示进行了回表查询。

覆盖索引case

为了实现索引覆盖，需要建组合索引 idx_drinker_id_drinker_feature(drinker_id,drinker_feature)

#删除索引 drinker_id

DROP INDEX drinker_id ON t_back_to_table;

#建立组合索引

CREATE INDEX idx_drinker_id_drinker_feature on t_back_to_table(drinker_id,drinker_feature);

继续使用之前创建的 t_back_to_table 表，通过覆盖索引idx_drinker_id_drinker_feature 查询 id 、drinker_id 和drinker_feature 三列数据。

EXPLAIN SELECT id, drinker_id, drinker_feature FROM t_back_to_table WHERE drinker_id = 1;

explain分析：此时字段drinker_id 和drinker_feature 是组合索引idx_drinker_id_drinker_feature ，查询的字段id、drinker_id 和drinker_feature 的值刚刚都在索引树上，只需扫描一次组合索引B+树即可，这就是实现了索引覆盖，此时的Extra字段为Using index表示使用了索引覆盖。

六、索引覆盖优化SQL 场景

适合使用索引覆盖来优化SQL的场景如全表count查询、列查询回表和分页查询等。

全表count查询优化

#首先删除 t_back_to_table 表中的组合索引

DROP INDEX idx_drinker_id_drinker_feature ON t_back_to_table;

EXPLAIN SELECT COUNT(drinker_id) FROM t_back_to_table

explain分析：此时的Extra字段为Null 表示没有使用索引覆盖。

使用索引覆盖优化，创建drinker_id 字段索引。

#创建 drinker_id 字段索引

CREATE INDEX idx_drinker_id on t_back_to_table(drinker_id);

EXPLAIN SELECT COUNT(drinker_id) FROM t_back_to_table

explain分析：此时的Extra字段为Using index表示使用了索引覆盖。

列查询回表优化

前文在描述索引覆盖使用的例子就是列查询回表优化。

例如：

SELECT id, drinker_id, drinker_feature FROM t_back_to_table WHERE drinker_id = 1;

使用索引覆盖：建组合索引 idx_drinker_id_drinker_feature on t_back_to_table(drinker_id,drinker_feature)即可。

分页查询优化

#首先删除 t_back_to_table 表中的索引 idx_drinker_id

DROP INDEX idx_drinker_id ON t_back_to_table;

EXPLAIN SELECT id, drinker_id, drinker_name, drinker_feature FROM t_back_to_table ORDER BY drinker_id limit 200, 10;

explain分析：因为drinker_id 字段不是索引，所以在分页查询需要进行回表查询，此时Extra为U sing filesort 文件排序，查询性能低下。

使用索引覆盖：建组合索引idx_drinker_id_drinker_name_drinker_feature

#建立组合索引 idx_drinker_id_drinker_name_drinker_feature (drinker_id,drinker_name,drinker_feature)

CREATE INDEX idx_drinker_id_drinker_name_drinker_feature on t_back_to_table(drinker_id,drinker_name,drinker_feature);

再次根据 drinker_id 分页查询：

EXPLAIN SELECT id, drinker_id, drinker_name, drinker_feature FROM t_back_to_table ORDER BY drinker_id limit 200, 10;

explain分析：此时的Extra字段为Using index表示使用了索引覆盖。

五花马

千金裘

呼儿将出换美酒

与尔同销万古愁

Original: https://www.cnblogs.com/taojietaoge/p/16167188.html
Author: 涛姐涛哥
Title: MySQL 回表

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/611858/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

MySQL高可用安装

MySQL HA部署环境准备创建本地yum源确认关闭 SELinux 防火墙设置 MySQL安装使用 root 用户操作创建相关的用户组和用户上传/解压介质设置自启动 …

数据库 2023年5月24日
00105
vue2框架基础

一、什么是vue? vue是一个优秀的前端框架，他与Angular.js、React.js成为前端三大主流框架。他是一套构建用户界面的框架，只关注视图层，可以完成大型项目的开发，框…

数据库 2023年6月14日
0088
lvs负载均衡

Lvs 一.Lvs简介二. 体系结构三. Lvs管理工具 1. ipvs 2. ipvsadm 四.lvs工作模式及原理 1.NAT模式 2. DR模式 3.TUN模式（隧道模…

数据库 2023年6月14日
0095
Java根据Freemarker模板生成Word文件

准备模板模板 + 数据 = 模型 1、将准备好的Word模板文件另存为.xml文件（PS：建议使用WPS来创建Word文件，不建议用Office） 2、将.xml文件重命名为.f…

数据库 2023年6月14日
0098
mysql @rownum := @rownum+1 方式获取行号

MySQL： mysql中没有获取行号的函数，因此需要通过一些自定义语句来进行获取。通常做法是，通过定义用户变量@rownum来保存表中的数据。通过赋值语句@rownum：=@ro…

数据库 2023年6月16日
0081
深入浅出分析 HashMap

作者：炸鸡可乐原文出处：www.pzblog.cn 一、摘要在集合系列的第一章，咱们了解到，Map的实现类有HashMap、LinkedHashMap、TreeMap、Ident…

数据库 2023年6月14日
0072
MySQL存储引擎

一、MySQL体系结构 1. 连接层顶层是多个客户端和链路服务，主要完成一些类似的连接处理、授权认证、以及相关的安全解决方案。该服务器还将为每个客户提供安全保护 [En] The…

数据库 2023年5月24日
0075
xtrabackup2版本和xtrabackup8版本对比

导语在使用xtrabackup8版本对mysql8版本进行备份恢复搭建从库的时候，继续使用xtrabackup2版本的方式，从xtrabackup_binlog_info 文件中找…

数据库 2023年6月16日
00117
如何制作验证码

推导步骤1：在img标签的src属性里放上验证码的请求路径 补充1.img的src属&amp…

数据库 2023年6月14日
0088
mysql绿色版在windows系统中的启动

1、下载mysql免安装版例如：mysql-5.7.11-winx64 2、修改配置文件，my-default.ini名称改为：my.ini，文件里面的参数配置： [mysqld…

数据库 2023年6月11日
0073
23种设计模式之备忘录模式

文章目录概述备忘录模式的优缺点备忘录模式的结构和实现 * 模式结构模式实现总结概述备忘录模式（Memento Pattern）保存一个对象的某个状态，以便在适当的时…

数据库 2023年6月6日
0088
一张图弄懂sql的连接查询

无意中看到一张图，非常直观的表现出了sql连接查询的结果集，对连接查询的理解十分有帮助，所以收藏了下来。其中红色部分为可以查询出的数据，白色部分为不能查询出的数据 Origina…

数据库 2023年6月14日
0099
JavaScript进阶内容——BOM详解

JavaScript进阶内容——BOM详解在上一篇文章中我们学习了DOM，接下来让我们先通过和DOM的对比来简单了解一下BOM 首先我们先来复习一下DOM：文档对象模型 DOM…

数据库 2023年6月14日
00152
简单的使用java操作hdfs

一：创建maven项目导入maven org.apache.hadoop hadoop-hdfs 2.7.6 org.apache.hadoop hadoop-common 2….

数据库 2023年6月11日
0089
linux根目录无法查看文件执行ls卡死无反应执行df -h 也同样没反应的处理方法

问题现象： 1、执行 df -h 卡死没反应，执行 df -hl 可以正常显示； 2、执行  ll / 或 ls /&…

数据库 2023年6月11日
0092
CSS速学！！

padding：内边距缩写：缩写： padding:值; 上下左右的内边距一样 padding:值1 值2; 值1代表上下内边距，值2代表左右内边距 padding:值1 值2 …

数据库 2023年6月16日
0078

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31