Mysql 的Innodb引擎和Myisam数据结构和区别

2023年6月16日上午6:23 • 数据库 • 阅读 91

先大体看一下MySQL的SQL layer层的一个架构流程：

对一些关键模块做一下简单的描述:

初始模块：初始一些参数，比如初始myinit配置文件（在安装的根目录下）里的一些参数。
连接管理模块：启动监听，监听连接请求
连接进程模块：可以理解为线程池
用户模块：检验用户，令牌和权限
命令分发器：处理不同类型的请求
查询缓存模块：做缓存处理，做查询的cache,可以理解为一个Map，查询语句为key，结果值为value
日志记录模块
命令解析器（parser）：对于不同类型的sql语句进行处理分发，select：查询优化器，dml：表变更模块，ddl：表维护模块，rep：复制模块（主从复制），status：状态模块。
访问控制：
表管理模块：
存储引擎接口：和Storage Engines打交道

直接来到Storage Engines，这讲的最多的就是引擎了，如：

Myisam、Innodb、Faicon、Memory、Archive等等引擎

而我们常用的是Innodb和Myisam这两种，这两种索引最直接的区别，可以从采用对应引擎而生成的数据表文件，进行对比。比如：采用Innodb引擎生成表A，采用Myisam索引生成表B。

现在可以从Mysql安装目录/data/数据库名，这个目录下看到有5个文件：

A.frm : 表定义文件

A.ibd ：数据和索引都存储在这个文件

B.frm ：表定义文件

B.myd ：数据文件

B.myi ：索引文件

显然，两者从文件上体验出来的区别就是，Myisam是把数据和索引分开存储在两个不同的文件里。（那其本质里的区别是什么？急啥）

且看，衡量一个索引的标准是什么？

就是，IO渐进复杂度，翻译成人话就是：当数据越来越多的时候，索引是否依然高效，即查询依然那么快。

一个索引是否高效在某种程度上取决于其采用的索引结构。

Hash索引：

对索引字段做Hash计算，落到不同槽里面，有个明显的缺点是，无法做范围查询，例如 select * from data where id >1

Fulltext索引：

全文搜索索引，比如字段的值是：abcdefghijk，它就会再生成一列abcde* ,用于前缀的模糊全文搜索。

R-Tree索引：

引用的场景主要是空间索引，比如说，美团上订电影票，就可以选择3km范围内的影院，结果就搜出来了。

B-Tree索引：

这个索引就是我要重点讲的索引，因为Innodb和Myisam采用的是B+ Tree 索引，而B+ Tree是从B-Tree基础上演变而来。

那B-Tree是怎么样的呢？如图：

每个节点上有一个索引（上方的数字，id的值），和索引对应的数据（下方蓝色：id, name）

而B+Tree：

上方白色的数字都为索引的key，而data全放在下面。（居于此结构，如果想知道它是怎么根据key从上到下找到对应的data的，我提供一个非常好玩的web工具，去玩一下琢磨一下。https://www.cs.usfca.edu/~galles/visualization/Algorithms.html）

虽然Innodb和Myisam都是采用B+Tree索引，但是它们是有区别的，如图：

前面已经说了，Myisam引擎方式的，会把索引和数据分开存储在两个文件中，一个文件负责数据的插入、更新等，另一个负责索引的维护。如图，索引中白色的key为索引的值，下面浅绿色为data：对应数据的地址。如果多个索引就，就多个这种模式，如图，以name为索引，也是一样。

而Innodb:如图：

上面也提到，Innodb是把数据和索引都放在同一个文件里的，那索引和数据共存的形式是：如图，白色中的为key，即使索引，当从上到下找到对应的key之后，key下面存放的就是整条对应的数据了，而不是想Myisam那样存放的是数据对应的地址了。

那么问题来了，Innodb多个索引的话，是一种什么样的存在呢，还是如上图右方，增加字段name为索引：它就会建立一个副索引树，同样的结构，白色key索引存放的是name字段对应的值，而蓝色方的data存放的是主索引树的key。

举个例子，当id和name都作为索引的时候，执行select * from table where name = ‘james’ ，

第一步会先在副索引找到key为james的data为1，1是主索引的key。

第二步再到主索引找到key为对1的数据。（select * from table where id= 1）

多提一句，像这种索引的方式叫”聚集索引”，理解为key和data都绑定在一起了。

而Myisam的那种索引的方式叫做”非聚集索引”。

对于B+Tree这种索引，讨论一下uuid和自增id。

Uuid是32位的，毋庸置疑，相对于自增id，uuid的存储空间是较大的。而且uuid为索引时，其要进行较复杂的运算，最终确定索引的key要插入到哪个位置。

而自增id，它符合每次加1的规则，而且规矩已经确定了，它不要做过多的运算，直接从左到右进行横向的扩展（插入），这样性能就有了差别，如图（B+Tree树的高度是固定的，为4层）：

即使是这样，uuid依然在一些项目依然有它市场：

自增id虽然有多个优点，但实际大型项目中却很少采用自增长id的，这是为什么呢？因为uuid几乎保证了不同数据库的不同表的id唯一，可以进行数据切分合并，而自增长id只能保证一个数据库中的一张表的id唯一，进行数据库合并的话并然会因主键冲突而失败，这是一个硬伤。

而且有博主说：分布式架构，意味着需要多个实例中保持一个表的主键的唯一性。这个时候普通的单表自增ID主键就不太合适，因为多个mysql实例上会遇到主键全局唯一性问题

再谈谈组合索引的一些小问题

组合索引是有顺序的，叫做最左原则。什么意思呢。举个例子：

name、age、weight 这3个字段组成组合索引，name排在第1位，那么查询语句where 后面必须要有name=”value”这个条件，否则此索引是不起作用的，这叫最左原则。

再引用网上的一个例子：

索引的好处就是：

提高检索效率
降低排序成本，索引对应的字段是会有一个自动排序功能的，默认是升序asc。

Every coin has two sides，它缺点是

更新索引的IO量。

就是说，当插入一条数据的时候，除了插入数据的本身，还要插入该数据对应索引信息的节点，如果对应的表是多个索引的，就插入多个数据对应的索引信息节点。而且这些都是以文件类型存储在硬盘上的。

调整索引所致的计算量，

这个又是怎么理解呢，举个例子，像B-tree索引，在插入索引之前，都要进行计算，该索引要申请多少的空间，插入到哪个位置。

占用存储空间。

竟然索引有坏有好，什么时候需要索引，什么时候不需要？

适合：

较频繁的作为查询条件的字段应该创建索引

不适合：

字段值的唯一性太差不适合单独做索引
更新非常频繁的字段不是
不会出现在where句中的字段不适合。

Original: https://www.cnblogs.com/incognitor/p/16403979.html
Author: 無名之徒
Title: Mysql 的Innodb引擎和Myisam数据结构和区别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/620954/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Atlas快速入门

之前的公司在数据中台的项目上调研决定启用了Atlas作为我们数据血缘管理的工具，让我给大家写了一份Atlas快速入门的文档，所以在这里我将这篇文档以一个纯新手视角的方式再一次优化，…

数据库 2023年6月11日
0098
3 访问修饰符public，private，protected以及不写(默认)时的区别

private 私有的，只对本类公开。 default 类的成员不写访问修饰符时默认为default，默认对于同一个包中的其它类相当于公开(public)，对于不是同一个包中的其它…

数据库 2023年6月6日
0094
Ansible Playbook概览

Ansible playbook 执行需要三步路执行： 1.编写playbook 2.定义主机清单文件 3.设置运行环境，写入配置文件 1.编写playbook Playbook使…

数据库 2023年6月14日
0076
CentOs安装Nginx

安装 gcc pcre pcre-devel zlib OpenSSL 安装安装 nginx 需要先将官网下载的源码进行编译，编译依赖 gcc 环境，如果没有 gcc 环境，则需…

数据库 2023年6月11日
0087
分享封装好的异步Mysql动态的库(DyNetMysql.dll) + 项目源码

在做C++项目时，经常会用到Mysql数据库，Mysql接口提供给我们的数据是相当原始的，如：字段名、字段类型，字段长度等等，一般情况我们都想一种更方便获得数据如： XXXStr…

数据库 2023年6月14日
0082
IntelliJ IDEA 断开svn连接

1 设置菜单 2 进入pluglns 菜单，点击 browse repositonries….. 3 搜索 svn disconnect，然后安装插件 4 安装插件后，…

数据库 2023年6月6日
00160
ECMAScript版本知识点汇总

ECMAScript版本知识点汇总 ES5 btoa、atob 对参数进行base64格式编码、解码 /** * btoa() * base64编码 * @param {strin…

数据库 2023年6月11日
00100
jar工具常用命令

参考链接：https://www.ibm.com/developerworks/cn/java/j-jar/index.html Original: https://www.cnb…

数据库 2023年6月9日
0073
Linux快速安装流量监控工具（实用版）

前言： Linux流量监控工具，在此我推荐两种分别为： 1、nload（推荐）因为个人看着舒服点😂 2、iftop 以上两种任选其一即可，在此对两种都有介绍和安装教程，我写了，大家…

数据库 2023年6月16日
0084
leetcode 1110. Delete Nodes And Return Forest 删点成林(中等)

一、题目大意给出二叉树的根节点 root，树上每个节点都有一个不同的值。如果节点值在 to_delete 中出现，我们就把该节点从树上删去，最后得到一个森林（一些不相交的树构成…

数据库 2023年6月16日
00102
BASE64处理文件

Base64: Base64是一种编码方式，基于64个ASCII字符来表示二进制数据，Base64将8个bit为一个单位的字节数据拆分为以6个bit为一个单位的二进制片段，每6个b…

数据库 2023年6月9日
0094
深入浅出的分析 Hashtable

作者：炸鸡可乐原文出处：www.pzblog.cn 一、摘要在集合系列的第一章，咱们了解到，Map 的实现类有 HashMap、LinkedHashMap、TreeMap、Ide…

数据库 2023年6月14日
0088
Java8Stream流

Stream流呢，以前我也有所了解，像一些面试题中也出现过，Java8的新特性，有一块就是这个Stream操作集合，而且在看一些项目中也使用的比较多。但总感觉自己学的一知半解，所以…

数据库 2023年6月11日
0081
ShardingSphere-Proxy 前端协议问题排查方法及案例

ShardingSphere-Proxy 是 Apache ShardingSphere 的接入端之一，其定位为透明化的数据库代理。ShardingSphere-Proxy 实现了…

数据库 2023年6月16日
0086
MyBatis详解

😀搭建 MyBatis mysql mysql-connector-java 8.0.29 org.mybatis mybatis 3.5.7 junit junit 4.12 t…

数据库 2023年6月14日
0081
链表的知识总结

链式结构内存不连续的，而是一个个串起来的，每个链接表的节点保存一个指向下一个节点的指针。 ⭐ 链式结构包含：node（节点）还有value（值），由于内存不连续的，那么对于数据的插…

数据库 2023年6月16日
0094

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Mysql 的Innodb引擎和Myisam数据结构和区别

大家都在看