MySQL中的全表扫描和索引树扫描

2023年5月24日上午10:57 • 数据库 • 阅读 112

引言

在学习mysql时，我们经常会使用explain来查看sql查询的索引等优化手段的使用情况。在使用explain时，我们可以观察到，explain的输出有一个很关键的列，它就是 type属性，type表示的是扫描方式，代表 MySQL 使用了哪种索引类型，不同的索引类型的查询效率是不一样的。

在type这一列，有如下一些可能的选项：

system：系统表，少量数据，往往不需要进行磁盘IO
const：常量连接
eq_ref：主键索引(primary key)或者非空唯一索引(unique not null)等值扫描
ref：非主键非唯一索引等值扫描
range：范围扫描
index：索引树扫描
ALL：全表扫描(full table scan)

在上面列出的7种选项中，前面五种我就不详细讲了，可以参考Mysql Explain之type详解这篇文章。我当时对于前五种属性是比较容易就理解了的，但是对于后面两种即索引树扫描和全表扫描我还是存在一些疑问。

索引树扫描我们是比较熟悉的，它就是会遍历聚簇索引树，底层是一颗B+树，叶子节点存储了所有的实际行数据。其实，全表扫描也是扫描的聚簇索引树，因为聚簇索引树的叶子节点中存储的就是实际数据，只要扫描遍历聚簇索引树就可以得到全表的数据了。

那么，索引树扫描和全表扫描有什么不同呢？

[En]

So what’s the difference between index tree scanning and full table scanning?

下面将用一个例子来详细分析这两种扫描方法的区别。

[En]

The following will use an example to analyze the difference between the two scanning methods in detail.

实例

我们建立一张 t_article表：

create table t_article(
    t_article_id int primary key auto_increment,
    t_title varchar(40),
);

在我们创建的 t_article表中，只有两个字段，一个是主键 t_article_id，另一个是普通字段 t_title。

我们知道，InnoDB会将聚簇索引默认建立在主键上，而聚簇索引树中的叶子节点就存储了整张表的行数据。

接着，我们分别设计两个sql查询case：

走主键索引

explain SELECT t_article_id FROM t_article;

走全表扫描：

explain SELECT t_title FROM t_article;

以上两个查询都没有where查询，按理来说底层的sql执行情况应该是差不多的。

结果分析

我们可以来看看上面两种查询的结果，在查询时使用explain语句输出sql执行的详细信息。

走索引扫描

id select_type table partitions type possible_keys key key_len ref rows filtered Extra 1 SIMPLE t_article index PRIMARY 4 2 100 Using index

走全表扫描

id select_type table partitions type possible_keys key key_len ref rows filtered Extra 1 SIMPLE t_article ALL 2 100

从以上两个查询结果中我们可以发现，走主键索引的查询和走全表的查询是不一样的。我们前面也提到了，InnoDB的索引是使用B+树来实现的，而主键索引中存储了整张表的数据，那全表扫描时其实也是扫描的主键索引。那为什么这两种查询会不一样呢？按理来说都是查询的主键索引，它们应该是一样的。

事实上，两者之间存在一些细微的差异。

[En]

In fact, there are some detailed differences between the two.

比如，第一个查询，它的优化手段是使用索引树扫描，也就是type中显示的index属性，而且它还使用了覆盖索引，即Extra列中的Using index属性。之所以第一个查询能够使用这两种优化手段，其实是因为select查询的结果列只包含主键，而主键的值是可以直接在遍历聚簇索引树时确定，也不需要回表查询了。

对于第二个查询，它也没有使用where进行过滤，而且它的select结果列包含的是普通列，并不是主键或者其他索引列，所以它会走全表扫描。而全表扫描其实底层也是扫描的聚簇索引树，也就是底层的B+树。这种全表扫描与索引树扫描有一个明显区别，那就是，全表扫描不仅仅需要扫描索引列，还需要扫描每个索引列中指向的实际数据，这里包含了所有的非索引列数据。

之前的分析可能仍有些生硬难懂。具体地说，让我们更直观地看看下面的图片：

[En]

The previous analysis may still be a little blunt and difficult to understand. Specifically, let’s take a more intuitive look at the following picture:

图片源自:从数据页的角度看 B+ 树

从上面的图我们可以看到，对于索引扫描来讲，它只需要读取叶子节点的所有key，也就是索引的键，而不需要读取具体的data行数据；而对于全表扫描来说，它无法仅仅通过读取索引列获得需要的数据，还需要读取具体的data数据才能获取select中指定的非索引列的具体值。所以，全表扫描的效率相比于索引树扫描相对较低一点，但是差距不是很大。

参考

【mysql】全表扫描过程 & 聚簇索引区别和联系
 从数据页的角度看 B+ 树

Original: https://www.cnblogs.com/GarrettWale/p/16271622.html
Author: Garrett_Wale
Title: MySQL中的全表扫描和索引树扫描

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/505383/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

面试题: 字符串转整型终结者

随着代码手感增强, 想为这个问题写个终结者系列. 缅怀下曾经的自己. 我们审视下这个问题, 整数字符串转成整数. 那么意味着有效字符仅有 “+-0123456789&#…

数据库 2023年6月9日
0086
[springmvc]拦截器功能

11.拦截器只会拦截controller的请求，对于静态资源不处理被spring代理的拦截器实现只需要两步： 1.实现一个拦截器类 package com.spring.con…

数据库 2023年6月16日
0075
Linux–>网络配置

虚拟机NAT网络关系图在Linux中查看网络配置 ifconfig ping 测试主机之间网络连通性测试当前服务器是否可以连接目的主机 ping 目&am…

数据库 2023年6月14日
0079
Dubbo源码(五)-服务目录

前言本文基于Dubbo2.6.x版本，中文注释版源码已上传github：xiaoguyu/dubbo 今天，来聊聊Dubbo的服务目录（Directory）。下面是官方文档对服…

数据库 2023年6月11日
0088
开源之夏 2022 重磅来袭，欢迎报名 RadonDB 社区项目

“开源之夏（英文简称 OSPP）” 是中科院软件所 “开源软件供应链点亮计划” 指导下的一项面向高校学生的暑期活动，由中国科学院软件…

数据库 2023年5月24日
0093
十一章配置文件参数化

把Spring配置文件中需要经常修改的字符串信息,转移到一个更小的配置文件中 1. 小配置文件(.properties) 2. 好处 : 利于维护 1.配置文件参数化开发步骤已数…

数据库 2023年6月14日
0069
Collection

ArrayList底层使用了数组存储 LinkedList底层使用双向链表 HashSet底层是一个HashMap支持，HashMap底层物理实现一个Hash表 LinkedHas…

数据库 2023年6月14日
0079
异步线程里的日志不好追踪？小支一招，轻松搞定！

众所周知，通过唯一的链路id来追踪一次请求的所有日志，对于排查生产问题来说，会是非常给力的。这个比较容易实现。我之前的博客也有多次提及 ▄︻┻┳═一 https://www.cnb…

数据库 2023年6月9日
0078
Spark学习(3) SparkSQL

什么事sparkSQL Spark SQL是Spark用来处理结构化数据的一个模块，它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用, 它是将Spark…

数据库 2023年6月16日
0080
Windows界面个人常用快捷键

分享一下个人常用快捷键。说明：字母排序规则遵循字母表(a->z) 快捷键介绍 windows+d 由当前应用直接返回桌面，再按一次回到应用 windows+e 打开文件资…

数据库 2023年6月14日
0098
jmeter并发设置的原理

简介广义并发绝对并发简介性能测试过程中是否需要进行同步定时器的设置，需要根据实际情况来考虑。举个栗子来讲是我们的双十一秒杀活动，这时候就必须实现请求数量达到一定数…

数据库 2023年6月6日
0069
UniApp文件上传（SpringBoot+Minio）

UniApp文件上传（SpringBoot+Minio）一、Uni文件上传（1）、文件上传的问题 UniApp文件上传文档 uni.uploadFile({ url: ‘htt…

数据库 2023年6月6日
0083
dns服务之bind配置内网解析部分子域名，其它子域名转发

bind配置内网解析部分子域名，其它子域名转发。以下以m.xxx.com和admin.xxx.com由内网dns解析，其它*.xxx.com转发给外网dns解析为例配置。文件/et…

数据库 2023年6月14日
0094
工具 | 如何对 MySQL 进行 TPC-C 测试？

作者：丁源 RadonDB 测试负责人负责 RadonDB 云数据库、容器化数据库的质量性能测试，迭代验证。对包括云数据库以及容器化数据库性能和高可用方案有深入研究。 |背景根据…

数据库 2023年5月24日
0091
MySQL8.0其他新特性

MySQL8.0其他新特性 MySQL8.0新特性概述 MySQL8.0新增特性 MySQL8.0移除的旧特性新特性1：窗口函数窗口函数的分类 MySQL8.0版本开始支持窗口…

数据库 2023年5月24日
0070
haproxy服务部署

haproxy haproxy 一、haproyx是什么二、负载均衡类型三、部署haproxy 1.源码部署haproxy 2.Haproxy搭建http负载均衡一、hapr…

数据库 2023年6月14日
0098

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

MySQL中的全表扫描和索引树扫描

引言

实例

结果分析

参考

大家都在看