MySQLB+树

2023年5月24日上午10:56 • 数据库 • 阅读 100

书名《MySQL是怎样运行的：从根儿上理解MySQL》。

这本书真的很好。如果你想学习，我建议你去😊看看。

[En]

This book is really good. I suggest you check out 😊 if you want to learn.

本文是基于我的认识上将InnoDB的结构进行的回想，查缺补漏。

InnoDB记录结构

InnoDB是以页来存储数据的，一个页的大小为16KB。

InnoDB行格式有COMPACT行格式和Redundant行格式，以及MySQL默认的Dynamic行格式。

COMPACT行格式

变长字段的长度，按列逆序存放，c3,c2,c1列存储。
null字段是否为null，表示一些可以为null的字段，具体占用大小具体字段多少，每个可以为null的字段占一位。同样是按列逆序存放，高位用0填充。
delete_mask 表示删除位，如果删除置1。1位
min_rec_mask 表示非叶子节点的最小值
n_owned 表示每页中最小节点拥有user record数量
heap_no 表示当前记录在堆中的数量
record_type 表示当前记录的类型，可以为普通记录0，索引记录1
next_record 表示下一个数据的指针
隐藏列的信息
row_id 表示当这个表中没有主键时会自动添加一个row_id充当其区别。但是当表中存在主键就会被其替代，不会出现。
transation_id 事务ID
roll_pointer 回滚指针
列的值，定长的就会直接用一定长度占用，没有占用的用0填充。不定长的就会被指定长度，然后占用其长度的位置。

补充：但是当我们指定的表是不定长的字符集时，会导致一些定长的列也会被列入不定长的列中，但是它会占用最小的空间。比如utf8是1-3字节不定长，char(10)如果没有用超过10个字节的话，最终还是会占用最低10个字符，不够用0填充，原因会产生碎片。

ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. This includes storage overhead, check the manual. You have to change some columns to TEXT or BLOBs。

它还显示，行表列表的最大大小为65535字节。当我们声明整列时，所有列的空间大小(包括列的固定间隔(固定长度+不定长度))，每列根据长度为1个字节或2个字节，每列不能为空或可以为空(根据列的空间来确定其长度)。因此，当我们声明大小时，我们需要判断它的大小，如果它大于65535字节，我们需要调整列的属性的大小。

[En]

It also shows that the maximum size of a row table list is 65535 bytes. When we declare the entire column, the space size of all columns * (including column fixed space (fixed length + indefinite length), each column according to the length of 1 byte or 2 bytes, each column can not be empty or can be empty (according to the column space to determine its length) * . So when we declare the size, we need to judge its size, and if it is greater than 65535 bytes, we need to resize the properties of the column.

mysql> create table varchar_demo(
    ->  c varchar(65532)
    -> ) CHarset=ascii row_format=compact;
Query OK, 0 rows affected (0.04 sec)

mysql> create table varchar_demo_01(
    ->  c varchar(65533)
    -> ) CHarset=ascii row_format=compact;
ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. This includes storage overhead, check the manual. You have to change some columns to TEXT or BLOBs

我们使用的是ASCII字符集只占一个字节，可以发现65532字节 + 判断空的1个字节 + 长度2个字节刚好是65535字节，当我们试图多加一个字节时就会报错。

Dynamic行格式：

其实和compact行格式差不多，但是它会在数据溢出时全部以引用的方式来引用，而不像compact一样留有768字节在原页中，然后剩余的使用引用的方式。

我们插入一条数据就是形成这样一种记录结构，我们想要快速找到数据，我们要学习数据页。

[En]

We insert a piece of data is the formation of such a record structure, we want to quickly find the data, we have to learn the data page.

InnoDB数据页结构

File-Header :
存储了校验和用来验证数据页进行更新的主要部分。首先呢更新操作会直接将其头部这个File-Header覆盖，然后进行覆盖操作后，如果中途断电，覆盖失败，没有进行覆盖到File-Tailer，此时进行验证，发现头和尾的值值不一样，就会判定为更新失败。
下一页和上一页的引用。用来形成页之间的双向链表
页的类型是索引页还是数据页。
infimum+supremum。也是一种数据行的形式，是页中固有的两个行。
Page Directory 页目录，就是存储页中槽的地方。

首先，我们来介绍一下在数据页面上加速查询数据的方法。

[En]

First of all, let’s introduce the method of speeding up querying data on the data page.

数据插入后会和最小页和最大页形成一个单向链表，并且数据是按主键的大小插入位置的。（主键建议自增，不然会增加开销）
然后会进行分组，最小页单独一组，后续4-8行一组，当数据插入组数量变多会出现组分裂为两个组，每组的最后一个数据行作为槽的引用，槽中存储数据行的引用和主键的值。
槽中的每个键值就存储的是引用和主键值，然后我们就二分查找主键值即可。

通过这种方式，可以根据槽中存储的每组最大值快速找到我们的数据行。

[En]

In this way, our data rows can be quickly found according to the maximum value of each group stored in the slot.

添加一个知识点：就是B+树中删除数据行并不会将其从地址中去除，可能就是把引用释放一下，然后就只是将其删除标记标记一下，下次有数据加入的时候就会直接将其占用。

B+树索引

索引是对每一页进行重新编目。

[En]

Indexing is the re-cataloguing of each page.

将每页的最小的主键作为key和页的索引作为值。当请求key就可以用二分的方法获得这个主键可能所在的页。

因为一个数据页的索引可以作为一个数据行，对于多个数据页的索引，即多个数据，也可以分组成一个索引页，如果数据很多，可以是多级索引页。这一数字将呈指数级增长。

[En]

For the index of a data page can be used as a data row, for the index of multiple data pages, that is, multiple data, they can also be grouped and grouped into an index page, and if there is a lot of data, they can be multi-level index pages. the number will grow exponentially.

在表创建时，会为主键创建一个聚簇索引。也就是向上面的B+树一样，叶子节点存储的是数据页，非叶子节点存储的是索引页。

但是我们也可以创建索引，对于列再创建一个B+树即创建二级索引。

MySQL就会再维护一个B+树，此时叶子节点的数据行就是索引指定的列和主键组成的（我们会在进行一次回文，即拿着主键去聚簇索引中找数据）；

索引节点指定列和页索引，但当指定的列有多个重复值时，它将成为指定的列+主键+页索引，以防止混淆多个页索引值。

[En]

The index node specifies the column and page index, but when the specified column has multiple duplicate values, it becomes the specified column + primary key + page index to prevent multiple page index values from being confused.

MyISAM索引方案

即数据存放在文件中，然后全部都拿着数据的引用和主键拼在一起。即数据是数据，索引就是索引。不像B+树一样，叶子节点是存放数据行，这个存储引擎则是全部都是索引行，直接拿着地址文件中找数据。

Original: https://www.cnblogs.com/duizhangz/p/16282409.html
Author: 大队长11
Title: MySQLB+树

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/505373/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Vmware 虚拟机连接外网和设置固定IP

NAT 模式（地址转换模式）在NAT模式中，主机网卡直接与虚拟NAT设备相连，然后虚拟NAT设备与虚拟DHCP服务器一起连接在虚拟交换机VMnet8上，虚拟机借助NAT功能，通过…

数据库 2023年6月14日
00103
MySQL45讲之IO性能提升

本文介绍 MySQL 的 binlog 和 redo log 写入机制和刷盘策略，以及如何提升 MySQL 的 IO 性能。 binlog 的写入机制 binlog 的写入流程是：…

数据库 2023年5月24日
0078
English words1004

本文来自博客园，作者：ukyo–BlackJesus，转载请注明原文链接：https://www.cnblogs.com/ukzq/p/16754120.html Or…

数据库 2023年6月11日
0082
【黄啊码】使用think-queue产生大量日志文件怎么办？

有时候某些原因程序出错，会有大量日志生成，最好调整下日志，单独出来。在配置文件config/queue.php开头添加： use think\facade\Log;Log::ini…

数据库 2023年6月16日
0092
Java面试题(二)–MySQL

1 存储引擎 1、简单描述一个Mysql的内部结构？ MySQL的基本架构示意图：大体来说，MySQL可以分为 server层和存储引擎层两部分。 ① server层包括连接器、…

数据库 2023年6月16日
0089
Python–paramiko

paramiko包含两个核心组件：SSHClient和SFTPClient。 SSHClient的作用类似于Linux的ssh命令，是对SSH会话的封装，该类封装了传输(Trans…

数据库 2023年6月9日
0091
Debezium的基本使用（以MySQL为例）

GreatSQL社区原创内容未经授权不得随意使用，转载请联系小编并注明来源。 GreatSQL是MySQL的国产分支版本，使用上与MySQL一致。一、Debezium介绍摘自官…

数据库 2023年5月24日
00109
MyBatis + SpringMVC 总结

创建 MyBatis 的主配置文件（mybatis-config.xml）：环境，事务管理，数据源给类取别名配置支持懒加载创建接口以及接口的映射文件（UserMapper，U…

数据库 2023年6月11日
00102
MIB MODULE HOST-RESOURCES-MIB

Textual Conventions Name: BooleanSyntax: Enumerated Name: KBytesSyntax: Integer Range Name…

数据库 2023年6月11日
0099
PHP array_values()

array_values array_values() 函数返回一个包含给定数组中所有键值的数组，但不保留键名。示例： function arrayValues() { $dat…

数据库 2023年6月14日
00134
H3C设备关于开启端口方法及端口显示状态查看方法

1、通过控制线登录到设备命令行： 2、备注：1、LINK状态为ADM说明是手动关闭的端口如需要开启需要手动开启 2、LINK状态为DOWN 说明接口没有接线或线没有插好 3、LI…

数据库 2023年6月9日
00144
数据库持久化+JDBC数据库连接

数据持久化就是将内存中的数据模型转换为存储模型，以及将存储模型转换为内存中的数据模型的统称。数据模型可以是任何数据结构或对象模型，存储模型可以是关系模型、XML、二进制流等。 …

数据库 2023年6月16日
00126
外卖项目

项目介绍：本项目，瑞吉外卖是专门为餐饮企业，餐厅，饭店定制的一款软件产品，包括系统管理，后台和移动端应用两部分，其中系统管理后台主要提供给餐饮企业内部员工使用，可以对餐厅的菜品，…

数据库 2023年6月16日
00114
MySQL实战45讲 3

03 | 事务隔离：为什么你改了我还看不见？事务 Transaction TRX 事务就是要保证一组数据库操作，要么全部成功，要么全部失败。 MySQL 原生的 MyISAM …

数据库 2023年6月16日
0096
VScode 添加jvm 启动参数 VScode 添加main方法参数

问题场景. 本地环境使用的是 jdk 17 我需要在vscode 上运行一个jdk1.8 的项目结果报错 : module java.base does not “o…

数据库 2023年6月14日
0088
zabbix

1. zabbix介绍 2. zabbix特点 3. zabbix配置文件 4. 部署zabbix zabbix介绍 zabbix是一个基于WEB界面的提供分布式系统监视以及网络监…

数据库 2023年6月14日
0084

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

MySQLB+树

大家都在看