适用于顺序磁盘访问的1分钟法则

2023年5月24日上午10:20 • 数据库 • 阅读 98

预备知识梳理

本文中设定 block size 与 page size 大小相等。

什么是 Block

文章的开始先解释一下，磁盘的数据读写是以扇区 (sector) 为单位的，而操作系统从磁盘上读写数据是以块 (block) 为单位的，一个 block 由若干个连续的 sector 组成，使用 block 代替 sector 能够提升读写速度，相应的空间碎片会变得更大，是一种空间换时间的应用。

如何从磁盘上读取一个字节？

移动磁臂到指定的柱面。
移动磁头到指定的磁道。
磁盘旋转到指定的扇区。
加载扇区的数据到内存。
从内存中读取一个字节。

什么是 Page

为了更高效率的利用物理内存，会将其划分为若干个页 (page)，page 和 block 都是操作系统层面的概念，而不是硬件层面，一般来讲二者的大小相等。

什么是 Buffer

有一种特殊的 page 为 buffer page，buffer page 中存在若干个大小相等的 buffer，每个 buffer 对应一个 block，如果 page 和 block 大小相等，那就是一个 buffer page 对应一个 block。

之所以要有 buffer，是因为内存和磁盘的读写速率相差过大，应用从磁盘上读数据时，数据会先批量载入一部分到 buffer 中，应用再从 buffer 中读取数据。

什么是 5 分钟法则

假设 1 个磁盘的价格为 30000 元，支持每秒访问 15 次，那么可以认为每秒访问 1 次磁盘的成本为 2000 元，也就是每秒从磁盘上读取 1 个 block 的成本为 2000 元，记为 2000/block/second。

假设 1 个内存的价格为 5000 元，大小为 4 MB，即该内存上约有 1000 个 page，那么可以认为 1 个 page 的成本约为 5 元，记为 5/page。

假设有 4KB 的数据存储在磁盘上，读取它的频率为 1 秒 10 次。则每秒的成本是 20000 元。如果将它记录在内存中，则每秒的成本是 5 元，因此选择将数据记录在磁盘上是更经济的选择。不难算出，当读取频率为 1 秒 0.0025 次，即 400 秒 1 次时，成本都是 5 元，是经济和不经济的临界点。那么如何计算这个临界点呢？

设：

P：1MB 内存中有多少个 page。
A：磁盘支持每秒访问多少次，即每秒读取多少个 page。
D：磁盘驱动器价格。
M：1MB 内存的成本。
I：数据读取频率为多少秒 1 次。

当：

[\frac{D/A}{I} = \frac{M}{P} ]

对于经济和非紧急的临界点，请替换上述数据：

[En]

For the economic and non-urgent tipping point, replace the above data:

[\frac{30000/15}{I} = \frac{5000/4}{1000/4} ]

得出 I = 400 秒，约等于 5 分钟，即当存储设备价格为上述情况时，访问频率高于 5 分钟 1 次的数据应该记录在内存中，实际应用时，可以将从磁盘读到的数据记录到内存上，并设置 5 分钟的生存时间，如果 5 分钟内再次读取该数据，则刷新生存时间，否则从内存中删除。

最后，我们可以得到生存时间(访问频率)的计算公式如下：

[En]

Finally, we can get the formula for calculating the survival time (access frequency) as follows:

[I = \frac{P \times D}{A \times M} ]

10 年后的 5 分钟法则

上面的 5 分钟法则是 Jim Gary 在 1987 年提出的，10 年后，Jim Gary 又使用了 1997 年的存储器价格进行计算，得出 10 年后的 5 分钟法则依然适用。

我们可以把 P/A 看作技术比率，D/M 看作经济比率，论文中统计了 1980 – 2000 的存储器数据，发现技术比率缩减至十分之一，经济比率放大了十倍，可以看出，虽然存储器一直在发展，但是 5 分钟法则计算得出的结果依旧是稳定的。

磁盘顺序访问

上面提到的 5 分钟法则，是只读取 1 个 block 大小的数据，即随机读取数据。当顺序读取数据时，也就是读取超过 1 个 block 的数据，由于顺序读取不需要移动磁臂磁头、旋转盘面，速度是远远大于随机读取的，因此顺序读取不再适用 5 分钟法则。

如果顺序读取数据后不会再次读取，就不需要记录（缓存）数据到内存，系统只需要足够的 buffer 让磁盘上的数据加载到内存上。一般来说 buffer 的大小不会超过 1MB。

这里的不需要记录到内存是指不需要常驻内存以待后续访问，而通过 buffer 加载磁盘数据到内存是指应用读取数据并处理。

如果顺序读取数据后还会再次读取，例如数据库中的 sort、cube、rollup、join 操作都有这种行为。下面以 sort 为例分析顺序访问操作。

两阶段排序

正常的排序方式是：先读数据，再排序，再写数据。这一过程称为单级分拣。如果数据量太大，无法加载到内存中，则会使用两阶段排序。在第一阶段，将所有数据划分为多个子数据集并分别进行排序；在第二阶段，将所有子排序结果合并，如下所示。

[En]

The normal sort is: read the data first, then sort the data, and then write the data. This process is called * single-stage sorting * . If there is too much data to be loaded into memory, * two-stage sorting * will be used. In the first stage, all the data is divided into several sub-datasets and sorted separately; in the second stage, all the sub-sort results are merged, as shown below.

两阶段分拣的内存要求可用以下公式描述：

[En]

The memory requirements for two-phase sorting can be described by the following formula:

[6 \times buffer_size + \sqrt{3 \times buffer_size \times file_size} ]

推导过程：

第一阶段产生 file_size/memory_size 个子数据集，假设 1MB 内存，10MB 大小数据集，那就划分为 10 个大小为 1MB 的子数据集，刚好可以在内存中排序。
第二阶段归并 memory_size/buffer_size 个子排序结果，一个 buffer 对应一个子数据集，假设 buffer 大小为 256KB，则一次归并 4 个子排序结果，注意这里的 buffer 和文章开始提的 buffer 不一样，这里的 buffer 是应用管理的，文章开始提的 buffer 是操作系统管理的。

在排序的设计中，file_size/memory_size 和 memory_size/buffer_size 应该是相等的。

[\frac{file_size}{memory_size} = \frac{memory_size}{buffer_size} ]

由此可以得出 memory_size 的计算公式：

[memory_size = \sqrt{file_size \times buffer_size} ]

这里的 memory_size 对应上图中 Input Buffer 的大小，公式中更好项外面的 buffer_size 对应上图中 Output Buffer 的大小，常数 3 和 6 取决于特定的排序算法。

1 分钟顺序法则推导

对于相同大小的待排序数据，单级排序的磁盘读写次数是两级排序的一半，但两级排序需要的内存比单级排序少。当内存大小足以进行单阶段排序时，我们是选择单阶段排序还是两阶段排序？

[En]

For the same size of data to be sorted, the number of disk reads and writes of single-stage sorting is half of that of two-stage sorting, but two-stage sorting requires less memory than single-stage sorting. When the memory size is large enough for a single-phase sort, do we choose a single-phase sort or a two-phase sort?

这个问题也是 5 分钟法则公式的一个应用，1997 年的硬件规格如下：

P：128 pages/MB
A：64 access/second/disk
D：2000 $/disk
M：15 $/MB

但是由于排序是顺序访问数据，因此 P/A 技术比率不应该按照硬件参数带入公式，已知磁盘顺序访问的平均速率在 5MB 每秒，如果 P 是 16 pages/MB，那么 A 就是 516 = 80 access/second/disk（访问一次是 1 个block 对应 1 个 page），也就是 P/A 为 0.2，带入公式：0.22000/15 = 26。

计算得到 I = 26，表示 26 秒 1 次的访问频率为盈亏临界值。但是排序既需要读也需要写，IO 成本增加一倍，盈亏临界值应该在 52 秒，近似为 1 分钟。

因此可以得出 一分钟顺序法则：如果数据顺序访问频率高于 1 分钟 1 次，应当使用内存来缓存数据。

举个例子，单阶段排序的计算速度大概在 5GB 每分钟，根据一分钟顺序法则，小于 5GB 的数据应当使用单阶段排序。当数据大小超过了 5GB，则应该使用双阶段排序。

这里解释一下，这里的 5GB 每分钟是计算速度，对于 5GB 及以下的文件，一次性读取全部数据到内存后，1 分钟以内可以排序完成，因此访问频率是高于 1 分钟 1 次；如果是 10 GB 的数据，一次性读取数据后，需要 2 分钟才可以排序完成，因此访问频率是 2 分钟 1 次。还需要注意的是，写回数据的问题是在 26*2 = 56 时体现的。

类似的，该法则也适用于其他顺序操作，例如 group by、rollup、cube、hash join、index build 等等。

总结

对于随机访问的数据，如果访问频率大于5分钟，则缓存到内存中；对于顺序访问的数据，如果访问频率超过每分钟一次，则缓存到内存中。无论是随机的还是顺序的，前提是数据被访问一次以上，否则就不存在缓存问题。

[En]

For randomly accessed data, if the access frequency is more than 5 minutes, it will be cached in memory; for sequentially accessed data, if the access frequency is more than once per minute, it will be cached in memory. Whether random or sequential, the premise is that the data is accessed more than once, otherwise there is no caching problem.

参考论文：The Five-Minute Rule Ten Years Later, and Other Computer Storage Rules of Thumb，论文成文于 1997 年，因此主要理解计算方法。

Original: https://www.cnblogs.com/suqinglee/p/16511074.html
Author: 李素晴
Title: 适用于顺序磁盘访问的1分钟法则

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/505176/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Tomcat总体架构(一)

目录一、Server 二、Connector 和 Container(实际为Engine) 三、Context 四、Host 五、Wrapper 六、Container(真正的C…

数据库 2023年6月11日
00110
猴子吃桃（递归）

递归案例实践分析猴子偷桃题目描述：猴子第一天摘下若干桃子，当即吃了一半，觉得好吃不过瘾，于是又多吃了一个，，第二天又吃了前天剩余桃子数量的一半，觉得好不过瘾，于是又多吃了一个…

数据库 2023年6月16日
00175
Java基础七—Java并发基础

一个类在可以被多个线程安全调用时就是线程安全的。线程安全不是一个非真即假的命题，可以将共享数据按照安全程度的强弱顺序分成以下五类: 不可变、绝对线程安全、相对线程安全、线程兼容和…

数据库 2023年6月6日
00260
Shell第四章《正则表达式》

1.1、名词解释正则表达式（regular expression, RE）是一种字符模式，用于在查找过程中匹配指定的字符。在大多数程序里，正则表达式都被置于两个正斜杠之间；例如/…

数据库 2023年6月14日
00102
Python第二十二天 stat模块 os.chmod方法 os.stat方法 pwd grp模块 os.access()方法

Python第二十二天 stat模块 os.chmod方法 os.stat方法 pwd grp模块 os.access()方法 stat模块描述了os.stat(filename)…

数据库 2023年6月9日
0076
liquibase新增字段注释导致表格注释同时变更bug记录

liquibase是一个用于数据库变更跟踪、版本管理和自动部署的开源工具。它的使用方式方法可以参考官方文档或者其他人的博客，这里不做过多介绍。 1. 问题复现在使用过程中发现了一…

数据库 2023年6月14日
00121
Java中AES加密和解密的方法分享

转自: http://www.java265.com/JavaJingYan/202206/16559759223818.html 下文笔者讲述java代码实现的AES加密和解密的…

数据库 2023年6月11日
00104
JavaScript Date 时间类型 .toISOString() 时差问题

JS中使用 toISOString 方法导致差了8个小时的问题使用 getTimezoneOffset() 返回本地时间与格林威治标准时间 (GMT) 的分钟差。对差的时间进行补…

数据库 2023年6月11日
00103
Spring 学习笔记

Spring 框架是由于软件开发的复杂性而创建的。Spring 使用的是基本的 JavaBean 来完成以前只可能由 EJB 完成的事情。 Spring 一. Spring Fra…

数据库 2023年6月11日
0094
MySQL快速创建800w条测试数据表&深度分页

MySQL快速创建800w条测试数据表&深度分页如果一条一条插入普通表的话，效率太低下，但内存表插入速度是很快的，可以先建立一张内存表，插入数据后，在导入到普通表中。 1…

数据库 2023年6月14日
00114
0x03MySQL的SQL基础

0x03MySQL的SQL基础1.SQL介绍结构化的查询语言，关系型数据库中用的一类语言。SQL标准 89 92 99 03MySQL 2.SQL类常用型2.1 mysql自带的功…

数据库 2023年6月9日
0092
jmeter-跨线程组全局变量

需求：两个线程组(A线程组与B线程组)👉A线程组的变量信息被B线程组引用。操作： 1. A线程组使用登录接口获取token、通过Json提取器获取到登录token, 然后添加&#…

数据库 2023年6月14日
00103
MYSQL/Oracle中常用函数总结

记录在日常工作或者学习中中使用到的函数，以下是做一个备忘~ MySQL：窗口函数：原文地址：https://zhuanlan.zhihu.com/p/92654574 1、窗口…

数据库 2023年6月14日
00120
读取资源文件的几种常用方法

资源文件的读取方法：本地读取资源文件 undefined2. 服务器（Tomcat）通过ServletContext获取： ServletContext servletConte…

数据库 2023年6月16日
00112
idea tags

总结IDEA开发的26个常用设置https://zhuanlan.zhihu.com/p/108172369idea跳转到指定行列快捷键https://blog.51cto.com…

数据库 2023年6月11日
0099
如何识别 SQL Server 的版本

本文介绍如何识别当前的Microsoft SQL Server 版本号和相应的产品或Service Pack 级别。同时介绍如何识别正在使用的SQL Server 具体版本。如何…

数据库 2023年6月11日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

适用于顺序磁盘访问的1分钟法则

预备知识梳理

什么是 Block

什么是 Page

什么是 Buffer

什么是 5 分钟法则

磁盘顺序访问

两阶段排序

1 分钟顺序法则推导

总结

大家都在看