【转】一条 SQL 的执行过程详解

2023年5月24日下午3:23 • 数据库 • 阅读 124

MySQL 体系架构

– 连接池组件

1、负责与客户端的通信，是半双工模式，这就意味着某一固定时刻只能由客户端向服务器请求或者服务器向客户端发送数据，而不能同时进行。

2、验证用户名和密码是否正确（数据库 MySQL 的 user 表中进行验证），如果错误返回错误通知 Access denied for user 'root'@'localhost'（using password：YES）；如果正确，则会去 MySQL 的权限表查询当前用户的权限。

– 缓存组件

也称为查询缓存，存储的数据是以键值对的形式进行存储，如果开启了缓存，那么在一条查询 SQL 语句进来时会先判断缓存中是否包含当前的 SQL 语句键值对，如果存在直接将其对应的结果返回，如果不存在再执行后面一系列操作。如果没有开启则直接跳过。

show  variables  like  'have_query_cache'; # 查看缓存配置：
show  variables  like  'query_cache_type'; # 查看是否开启
show  variables  like  'query_cache_size'; # 查看缓存占用大小
show  status  like  'Qcache%'; # 查看缓存状态信息

缓存失效场景

查询语句不一致。前后两条查询 SQL 必须完全一致；
查询语句中含有一些不确定的值时，则不会缓存。比如 now()、current_date()、curdate()、curtime()、rand()、uuid() 等；
不使用任何表查询。如 select ‘A’；
查询 mysql、information_schema 或 performance_schema 数据库中的表时，不会走查询缓存；
在存储的函数、触发器或事件的主体内执行的查询

[En]

queries executed within the body of a stored function, trigger, or event*
如果表更改，则使用该表的所有高速缓存查询都变为无效并从缓存中删除，这包括使用 MERGE 映射到已更改表的表的查询。一个表可以被许多类型的语句改变，如 insert、update、delete、truncate table、alter table、drop table、drop database。

通过上面的失效场景可以看出缓存是很容易失效的，所以如果不是查询次数远大于修改次数的话，使用缓存不仅不能提升查询效率还会拉低效率（每次读取后需要向缓存中保存一份，而缓存又容易被清除）。所以在 MySQL5.6 默认是关闭缓存的，并且在 8.0 直接被移除了。当然，如果场景需要用到，还是可以使用的。

开启

在配置文件（linux 下是安装目录的 cnf 文件，windows 是安装目录下的 ini 文件）中，增加配置： query_cache_type = 1

&#x6307;&#x5B9A; SQL_NO_CACHE&#xFF0C;SQL_CACHE &#x540C;&#x7406;&#x3002;
SELECT  SQL_NO_CACHE  *  FROM  student  WHERE age > 20;

– 分析器

对客户端传来的 SQL 进行分析，这将包括预处理与解析过程，并进行关键词的提取、解析，并组成一个解析树。具体的解析词包括但不局限于 select/update/delete/or/in/where/group by/having/count/limit 等，如果分析到语法错误，会直接抛给客户端异常： ERROR:You have an error in your SQL syntax.。

select *  from user where userId = 1234;

在分析器中就通过语义规则器将 select from where 这些关键词提取和匹配出来，MySQL 会自动判断关键词和非关键词，将用户的匹配字段和自定义语句识别出来。这个阶段也会做一些校验：比如校验当前数据库是否存在 user 表，同时假如 user 表中不存在 userId 这个字段同样会报错： unknown column in field list.。

– 优化器

进入优化器说明 SQL 语句是符合标准语义规则并且可以执行。优化器会根据执行计划选择最优的选择，匹配合适的索引，选择最佳的方案。比如一个典型的例子是这样的：

表 T，对 A、B、C 列建立联合索引 —— (A,B,C)，在进行查询的时候，当 SQL 查询条件是： select xx where B=x and A=x and C=x。很多人会以为是用不到索引的，但其实会用到，虽然索引必须符合最左原则才能使用，但是本质上，优化器会自动将这条 SQL 优化为： where A=x and B=x and C=x，这种优化会为了底层能够匹配到索引，同时在这个阶段是自动按照执行计划进行预处理，MySQL 会计算各个执行方法的最佳时间，最终确定一条执行的 SQL 交给最后的执行器。

优化器会根据扫描行数、是否使用临时表、是否排序等来判断是否使用某个索引，其中扫描行数的计算可以通过统计信息来估算得出，而统计信息可以看作是索引唯一数的数量，可以使用部分采样来估算，具体就是选择 N 个数据页，统计这些页上数据的不同值，得到一个平均值，然后乘以这个索引的页面数，就得到了。但是因为索引数据会变化，所以索引的统计信息也会变化。当变更的数据行数超过 1/M 的时候，就会重新计算一次统计信息。

关于统计信息可以选择是否持久化：：通过 innodb_stats_persistent，设置为 on 的时候，表示统计信息会持久化存储。这时，默认的 N 是 20，M 是 10。设置为 off 的时候，表示统计信息只存储在内存中。这时，默认的 N 是 8，M 是 16。

没有使用最优索引如何优化：：
1、虽然会自动更新统计信息，但是但是不能保证统计信息是最新值，这就可能导致优化器选择了不同的索引导致执行变慢，所以可以通过 analyze table 表名 来重新计算索引的统计信息;

2、在表名后面添加 force index(索引名) 语句来强制使用索引（不建议）;

3、将 SQL 进行修改成优化器可以选最优索引的实现方式；

4、新建一个最优索引或者删除优化器误用的索引；

– 执行器

执行器会调用对应的存储引擎执行 SQL，主流的是 MyISAM 和 Innodb。

写操作执行过程

读操作执行过程

在 MySQL 5.6 之后引入了索引下推（Index Condition Pushdown），所以在查询操作上会有一个 Index Filter 和 Table Filter 的过程，查询的流程图大致可以用下面这张图来概括：

SQL执行顺序

原文链接：https://www.cnblogs.com/mengxinJ/p/14045520.html

Original: https://www.cnblogs.com/jmcui/p/15799516.html
Author: JMCui
Title: 【转】一条 SQL 的执行过程详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/507870/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

绿色安装MySQL5.7版本—-配置my.ini文件注意事项

简述绿色安装MySQL5.7版本以及配置my.ini文件注意事项前言由于前段时间电脑重装，虽然很多软件不在C盘，但是由于很多注册表以及关联文件被删除，很多软件还需要重新配置甚至…

数据库 2023年5月24日
00128
AspNetCoreapi 使用 Docker + Centos 7部署

好久没有更新文章了，前段时间写了一系列的文章放到桌面了，想着修修改改，后来系统中勒索病毒了还被公司网络安全的抓到是我电脑，后来装系统文章给装丢了。然后好长一段时间没有写了。今天记…

数据库 2023年6月11日
00124
English words1004

本文来自博客园，作者：ukyo–BlackJesus，转载请注明原文链接：https://www.cnblogs.com/ukzq/p/16754120.html Or…

数据库 2023年6月11日
00114
Activiti 7 源码学习

启动分析源码版本是 7.1.0.M6 首先从 ProcessEngineAutoConfiguration 开始 ProcessEngineAutoConfiguration 是…

数据库 2023年6月14日
00114
DM变更表空间存放路径

1、变更前置条件（1）、数据库服务器提供dmdba用户权限（2）、目标路径有足够的空间可以使用（3）、数据库可以重启 2、变更实施过程 2.1、变更前备份变更表空间目录需要对…

数据库 2023年6月11日
00193
python中set()函数的用法

set() 函数创建一个无序不重复元素集，可进行关系测试，删除重复数据，还可以计算交集、差集、并集等。 set([iterable]) iterable — 可迭代对象…

数据库 2023年6月11日
00102
高并发组件了解

消息队列 A服务和多个服务耦合，内部维护对多个服务发送数据的接口，那么这些接口如果有的挂了，有的不需要了，那么还得修改A内部的代码，如果使用MQ，A发送消息就好，不必考虑那么多事情…

数据库 2023年6月16日
0082
DistSQL 深度解析：打造动态化的分布式数据库

一、背景自 ShardingSphere 5.0.0 版本发布以来，DistSQL 为 ShardingSphere 生态带来了强大的动态管理能力，通过 DistSQL，用户可以…

数据库 2023年6月16日
0086
第十章对象的生命周期

1.什么是生命周期对象创建存活销毁的完整的过程 2.为什么学习对象的生命周期在以前通过new创建对象,调用对象,则该对象存活,直到被JVM的垃圾回收机制回收现在由Spri…

数据库 2023年6月14日
00121
Java并发编程之美

简介《Java并发编程之美》分为三部分，第一部分为Java 并发编程基础篇，主要讲解Java 并发编程的基础知识、线程有关的知识和并发编程中的其他相关概念，这些知识在高级篇都会有…

数据库 2023年6月6日
00135
2_Git

一. 引言在单人开发过程中, 需要进行版本管理, 以利于开发进度的控制在多人开发过程中, 不仅需要版本管理, 还需要进行多人协同控制二. 介绍 Git是一个开源的分布式版本…

数据库 2023年6月11日
00130
操作系统（学习笔记）

操作系统（学习笔记） PCB=process control block=进程控制块，用于存储进程相关信息，以便进程切换； GDT=global descriptor table=…

数据库 2023年6月14日
00114
面试记录

JVM线程属于用户态还是内核态当进程运行在ring3级别时为用户态，ring0级别时为内核态有些操作需要有内核权限才能进行，那么有三种由用户态切换到内核态的情况：系统调用：操…

数据库 2023年6月16日
00129
Node安装与卸载命令汇总

nvm(MAC管理node版本) 安装最新稳定版node： nvm install stable 安装指定版本： nvm install <version></v…

数据库 2023年6月9日
0095
牛客SQL刷题第三趴——SQL大厂面试真题

结果，保留了两位小数，并根据播放进度以相反的顺序进行排序。 [En] As a result, two decimal places are retained and sorted…

数据库 2023年5月24日
00143
Java 多线程学习笔记

多线程在单个程序中同时运行多个线程完成不同的工作，称为多线程（提升整体处理性能）线程是程序的最小单位，相对独立的可调用单元，是 CPU 最小基本单位；在同一个程序中不同的线程…

数据库 2023年6月11日
00111

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【转】 一条 SQL 的执行过程详解