【转】一条 SQL 的执行过程详解

2023年6月13日下午7:40 • Linux • 阅读 112

MySQL 体系架构

– 连接池组件

1、负责与客户端的通信，是半双工模式，这就意味着某一固定时刻只能由客户端向服务器请求或者服务器向客户端发送数据，而不能同时进行。

2、验证用户名和密码是否正确（数据库 MySQL 的 user 表中进行验证），如果错误返回错误通知 Access denied for user 'root'@'localhost'（using password：YES）；如果正确，则会去 MySQL 的权限表查询当前用户的权限。

– 缓存组件

也称为查询缓存，存储的数据是以键值对的形式进行存储，如果开启了缓存，那么在一条查询 SQL 语句进来时会先判断缓存中是否包含当前的 SQL 语句键值对，如果存在直接将其对应的结果返回，如果不存在再执行后面一系列操作。如果没有开启则直接跳过。

show  variables  like  'have_query_cache'; # 查看缓存配置：
show  variables  like  'query_cache_type'; # 查看是否开启
show  variables  like  'query_cache_size'; # 查看缓存占用大小
show  status  like  'Qcache%'; # 查看缓存状态信息

缓存失效场景

查询语句不一致。前后两条查询 SQL 必须完全一致；
查询语句中含有一些不确定的值时，则不会缓存。比如 now()、current_date()、curdate()、curtime()、rand()、uuid() 等；
不使用任何表查询。如 select ‘A’；
查询 mysql、information_schema 或 performance_schema 数据库中的表时，不会走查询缓存；
在存储的函数，触发器或事件的主体内执行的查询；
如果表更改，则使用该表的所有高速缓存查询都变为无效并从缓存中删除，这包括使用 MERGE 映射到已更改表的表的查询。一个表可以被许多类型的语句改变，如 insert、update、delete、truncate table、alter table、drop table、drop database。

通过上面的失效场景可以看出缓存是很容易失效的，所以如果不是查询次数远大于修改次数的话，使用缓存不仅不能提升查询效率还会拉低效率（每次读取后需要向缓存中保存一份，而缓存又容易被清除）。所以在 MySQL5.6 默认是关闭缓存的，并且在 8.0 直接被移除了。当然，如果场景需要用到，还是可以使用的。

开启

在配置文件（linux 下是安装目录的 cnf 文件，windows 是安装目录下的 ini 文件）中，增加配置： query_cache_type = 1

&#x6307;&#x5B9A; SQL_NO_CACHE&#xFF0C;SQL_CACHE &#x540C;&#x7406;&#x3002;
SELECT  SQL_NO_CACHE  *  FROM  student  WHERE age > 20;

– 分析器

对客户端传来的 SQL 进行分析，这将包括预处理与解析过程，并进行关键词的提取、解析，并组成一个解析树。具体的解析词包括但不局限于 select/update/delete/or/in/where/group by/having/count/limit 等，如果分析到语法错误，会直接抛给客户端异常： ERROR:You have an error in your SQL syntax.。

select *  from user where userId = 1234;

在分析器中就通过语义规则器将 select from where 这些关键词提取和匹配出来，MySQL 会自动判断关键词和非关键词，将用户的匹配字段和自定义语句识别出来。这个阶段也会做一些校验：比如校验当前数据库是否存在 user 表，同时假如 user 表中不存在 userId 这个字段同样会报错： unknown column in field list.。

– 优化器

进入优化器说明 SQL 语句是符合标准语义规则并且可以执行。优化器会根据执行计划选择最优的选择，匹配合适的索引，选择最佳的方案。比如一个典型的例子是这样的：

表 T，对 A、B、C 列建立联合索引 —— (A,B,C)，在进行查询的时候，当 SQL 查询条件是： select xx where B=x and A=x and C=x。很多人会以为是用不到索引的，但其实会用到，虽然索引必须符合最左原则才能使用，但是本质上，优化器会自动将这条 SQL 优化为： where A=x and B=x and C=x，这种优化会为了底层能够匹配到索引，同时在这个阶段是自动按照执行计划进行预处理，MySQL 会计算各个执行方法的最佳时间，最终确定一条执行的 SQL 交给最后的执行器。

优化器会根据扫描行数、是否使用临时表、是否排序等来判断是否使用某个索引，其中扫描行数的计算可以通过统计信息来估算得出，而统计信息可以看作是索引唯一数的数量，可以使用部分采样来估算，具体就是选择 N 个数据页，统计这些页上数据的不同值，得到一个平均值，然后乘以这个索引的页面数，就得到了。但是因为索引数据会变化，所以索引的统计信息也会变化。当变更的数据行数超过 1/M 的时候，就会重新计算一次统计信息。

关于统计信息可以选择是否持久化：：通过 innodb_stats_persistent，设置为 on 的时候，表示统计信息会持久化存储。这时，默认的 N 是 20，M 是 10。设置为 off 的时候，表示统计信息只存储在内存中。这时，默认的 N 是 8，M 是 16。

没有使用最优索引如何优化：：
1、虽然会自动更新统计信息，但是但是不能保证统计信息是最新值，这就可能导致优化器选择了不同的索引导致执行变慢，所以可以通过 analyze table 表名 来重新计算索引的统计信息;

2、在表名后面添加 force index(索引名) 语句来强制使用索引（不建议）;

3、将 SQL 进行修改成优化器可以选最优索引的实现方式；

4、新建一个最优索引或者删除优化器误用的索引；

– 执行器

执行器会调用对应的存储引擎执行 SQL，主流的是 MyISAM 和 Innodb。

写操作执行过程

读操作执行过程

在 MySQL 5.6 之后引入了索引下推（Index Condition Pushdown），所以在查询操作上会有一个 Index Filter 和 Table Filter 的过程，查询的流程图大致可以用下面这张图来概括：

SQL执行顺序

原文链接：https://www.cnblogs.com/mengxinJ/p/14045520.html

Original: https://www.cnblogs.com/jmcui/p/15799516.html
Author: JMCui
Title: 【转】一条 SQL 的执行过程详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/609001/

转载文章受原作者版权保护。转载请注明原作者出处！

Linux

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Linux at命令详解

大家好，我是良许。在生活中，我们有太多的场景需要使用闹钟，比如早上7点起床，下午4点开会，晚上8点购物，等等。 [En] In life, we have too many sc…

Linux 2023年5月27日
00106
SQL错题集

查找最晚入职员工的所有信息查找入职员工时间排名倒数第三的员工所有信息获取所有部门中当前员工薪水最高的相关信息，给出dept_no, emp_no以及其对应的salary 从ti…

Linux 2023年6月14日
0089
podman的基本用法

podman的基本设置和使用运行示例容器列出正在运行的容器检查正在运行的容器测试 httpd 服务器查看容器的日志查看容器的 pid 检查点容器恢复容器迁移容器停…

Linux 2023年6月13日
0077
搭建Nginx七层反向代理

基于https://www.cnblogs.com/Dfengshuo/p/11911406.html这个基础上，在来补充下七层代理的配置方式。简单理解下四层和七层协议负载的区别吧…

Linux 2023年6月8日
00111
powershell 编写的tui界面脚本《电壳别名宝》

中文名：《电壳别名宝》 English name：《Power Alias》 powershell 编写的tui界面脚本。用途：保存容易记住的别名（支持中文），保存linux…

Linux 2023年5月27日
00127
DNS 查询原理详解

你可能会问，难道 DNS 服务器（比如 1.1.1.1）保存了世界上所有域名（包括二级域名、三级域名）的 IP 地址？当然不是。DNS 是一个分布式系统，1.1.1.1 只是用户…

Linux 2023年6月8日
0061
Python函数的必选参数、默认参数、可变参数、关键字参数和命名关键字参数

必选参数 def function(args_name): print (args_name) function("参数调用") ~$ 参数调用跟在函数名口号…

Linux 2023年6月7日
0070
CentOS 8 上安装和配置 nginx

1、检查yum上的nginx版本 yum info nginx 2、安装nginx yum install nginx 3、将服务设置为每次开机启动 sudo systemctl …

Linux 2023年5月27日
00103
supervisord 进程管理利器

Supervisor概述 supervisor是一个 Client/Server模式的系统，允许用户在类unix操作系统上监视和控制多个进程，或者可以说是多个程序。superv…

Linux 2023年6月14日
00106
小白上手Linux系统Redis安装与部署教程

一：Redis的安装 1.首先需要下载linux版的redis，官网地址：http://redis.io/download。 2.创建文件夹 mkdir+文件名 3.用ftp将压缩…

Linux 2023年6月13日
00131
ICMP 协议仿真及ping命令用途

1、实验目的加深对 IPv4 协议首部各定义域的理解，掌握路由表的结构和基本配置命令，熟悉 ICMP 的调试操作。 2、实验原理 IPv4 协议定义，网络层协议的相关 RFC 定…

Linux 2023年6月8日
00110
Java动态脚本Groovy读取配置文件

前言：请各大网友尊重本人原创知识分享，谨记本人博客：南国以南i 核心涉及： @Value：作用是通过注解将常量、配置文件中的值、其他bean的属性值注入到变量中，作为变量的初始值…

Linux 2023年6月14日
0074
位图实现

位图就是用每个字节中的bit位代表一组资源的映射。例如：一个字节有8位，在操作系统中可以用一个bit位代表一个4K的页，那一个字节就可以代表8页32K内存。可以利用位图进行资源…

Linux 2023年6月7日
0072
Unity编译时找不到AndroidSDK的问题 | Unable to list target platforms(转载)

现象在用 Unity 编译 Android 平台的应用时，遇到 Unable to list target platforms 的问题。错误提示详细错误描述如下： Error…

Linux 2023年6月7日
00106
urandom和random区别

linux中提供了 /dev/urandom 和 /dev/random 两个特殊设备来提供随机数。那么这两个文件有什么区别呢？要回答这个问题，先需要了解熵这个概念。熵linux…

Linux 2023年6月7日
0076
Sharding-jdbc 5.1.2案例

简介 sharding-jdbc案例，版本5.1.2 springboot + mybatis-plus + sharding-jdbc 项目地址：sharding-jdbc-ex…

Linux 2023年6月7日
00100

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【转】 一条 SQL 的执行过程详解