一文搞懂 Redis 架构演化之路

2023年5月28日上午3:05 • Linux • 阅读 77

这种方案就是我们经常听到的 Redis RDB，RDB 采用「 定时快照」的方式进行数据持久化，它的优点是：

持久化文件体积小（二进制 + 压缩）
写盘频率低（定时写入）

缺点也很明显，因为是定时持久化，数据肯定没有 AOF 实时持久化完整，如果你的 Redis 只当做缓存，对于丢失数据不敏感（可从后端的数据库查询），那这种持久化方式是非常合适的。

如果让你来选择持久化方案，你可以这样选择：

业务对于数据丢失不敏感，选 RDB
业务对数据完整性要求比较高，选 AOF

理解了 RDB 和 AOF，我们再进一步思考一下，有没有什么办法， 既可以保证数据完整性，还能让持久化文件体积更小，恢复更快呢？

回顾一下我们前面讲到的，RDB 和 AOF 各自的特点：

RDB 以二进制 + 数据压缩方式存储，文件体积小
AOF 记录每一次写命令，数据最全

我们可否利用它们各自的优势呢？

当然可以，这就是 Redis 的「 混合持久化」。

要想数据完整性更高，肯定就不能只用 RDB 了，重点还是要放在 AOF 优化上。

具体来说，当 AOF 在做 rewrite 时， Redis 先以 RDB 格式在 AOF 文件中写入一个数据快照，再把在这期间产生的每一个写命令，追加到 AOF 文件中。

因为 RDB 是二进制压缩写入的，这样 AOF 文件体积就变得更小了。

因为 AOF 体积进一步压缩，你在使用 AOF 恢复数据时，这个恢复时间就会更短了！

Redis 4.0 以上版本才支持混合持久化。
注意：混合持久化是对 AOF rewrite 的优化，这意味着使用它必须基于 AOF + AOF rewrite。

这么一番优化，你的 Redis 再也不用担心实例宕机了，当发生宕机时，你就可以用持久化文件快速恢复 Redis 中的数据。

但这样就没问题了吗？

仔细想一下，虽然我们已经把持久化的文件优化到最小了，但在 恢复数据时依旧是需要时间的，在这期间你的业务应用无法提供服务，这怎么办？

一个实例宕机，只能用恢复数据来解决，那我们是否可以部署多个 Redis 实例，然后让这些实例数据保持实时同步，这样当一个实例宕机时，我们在剩下的实例中选择一个继续提供服务就好了。

没错，这个方案就是接下来要讲的「主从复制：多副本」。

主从复制：多副本

你可以部署多个 Redis 实例，架构模型就变成了这样：

我们这里把实时读写的节点叫做 master，另一个实时同步数据的节点叫做 slave。

采用多副本的方案，它的优势是：

缩短不可用时间：master 发生宕机，我们可以手动把 slave 提升为 master 继续提供服务
提升读性能：让 slave 分担一部分读请求，提升应用的整体性能

这个方案不错，不仅节省了数据恢复的时间，还能提升性能。

但它的问题在于： 当 master 宕机时，我们需要「手动」把 slave 提升为 master，这个过程也是需要花费时间的。

虽然比恢复数据要快得多，但还是需要人工介入处理。一旦需要人工介入，就必须要算上人的反应时间、操作时间，所以，在这期间你的业务应用依旧会受到影响。

我们是否可以把这个切换的过程，变成自动化？

哨兵：故障自动切换

要想自动切换，肯定不能依赖人了。

现在，我们可以引入一个「观察者」，让这个观察者去实时监测 master 的健康状态，这个观察者就是「哨兵」。

具体如何做？

哨兵每间隔一段时间，询问 master 是否正常
master 正常回复，表示状态正常，回复超时表示异常
哨兵发现异常，发起主从切换

有了这个方案，就不需要人去介入处理了，一切就变得自动化了，是不是很爽？

但这里还有一个问题，如果 master 状态正常，但这个哨兵在询问 master 时，它们之间的网络发生了问题，那这个哨兵可能会「误判」。

这个问题怎么解决？

既然一个哨兵会误判，那我们可以部署多个哨兵，让它们分布在不同的机器上，让它们一起监测 master 的状态，流程就变成了这样：

多个哨兵每间隔一段时间，询问 master 是否正常
master 正常回复，表示状态正常，回复超时表示异常
一旦有一个哨兵判定 master 异常（不管是否是网络问题），就询问其它哨兵，如果多个哨兵（设置一个阈值）都认为 master 异常了，这才判定 master 确实发生了故障
多个哨兵经过协商后，判定 master 故障，则发起主从切换

所以，我们用多个哨兵互相协商来判定 master 的状态，这样，就可以大大降低误判的概率。

哨兵协商判定 master 异常后，这里还有一个问题： 由哪个哨兵来发起主从切换呢？

答案是，选出一个哨兵「领导者」，由这个领导者进行主从切换。

问题又来了，这个领导者怎么选？

想象一下，在现实生活中，选举是怎么做的？

是的，投票。

在选举哨兵领导者时，我们可以制定这样一个选举规则：

每个哨兵都询问其它哨兵，请求对方为自己投票
每个哨兵只投票给第一个请求投票的哨兵，且只能投票一次
首先拿到超过半数投票的哨兵，当选为领导者，发起主从切换

这个选举的过程就是我们经常听到的：分布式系统领域中的「 共识算法」。

什么是共识算法？

我们在多个机器部署哨兵，它们需要共同协作完成一项任务，所以它们就组成了一个「分布式系统」。

在分布式系统领域，多个节点如何就一个问题达成共识的算法，就叫共识算法。

在这个场景下，多个哨兵共同协商，选举出一个都认可的领导者，就是使用共识算法完成的。

这个算法还规定节点的数量必须是奇数个，这样可以保证系统中即使有节点发生了故障，剩余超过「半数」的节点状态正常，依旧可以提供正确的结果，也就是说，这个算法还兼容了存在故障节点的情况。

共识算法在分布式系统领域有很多，例如 Paxos、Raft，哨兵选举领导者这个场景，使用的是 Raft 共识算法，因为它足够简单，且易于实现。

好，到这里我们先小结一下。

你的 Redis 从最简单的单机版，经过数据持久化、主从多副本、哨兵集群，这一路优化下来，你的 Redis 不管是性能还是稳定性，都越来越高，就算节点发生故障，也不用担心了。

Redis 以这样的架构模式部署，基本上就可以稳定运行很长时间了。

…

随着时间的发展，你的业务体量开始迎来了爆炸性增长，此时你的架构模型，还能够承担这么大的流量吗？

我们一起来分析一下：

数据怕丢失：持久化（RDB/AOF）
恢复时间久：主从副本（副本随时可切）
手动切换时间长：哨兵集群（自动切换）
读存在压力：扩容副本（读写分离）
写存在压力： 一个 mater 扛不住怎么办？

可见，现在剩下的问题是，当写请求量越来越大时，一个 master 实例可能就无法承担这么大的写流量了。

要想完美解决这个问题，此时你就需要考虑使用「分片集群」了。

分片集群：横向扩展

什么是「分片集群」？

简单来讲，一个实例扛不住写压力，那我们是否可以部署多个实例，然后把这些实例按照一定规则组织起来，把它们当成一个整体，对外提供服务，这样不就可以解决集中写一个实例的瓶颈问题吗？

所以，现在的架构模型就变成了这样：

现在问题又来了，这么多实例如何组织呢？

我们制定规则如下：

每个节点各自存储一部分数据，所有节点数据之和才是全量数据
制定一个路由规则，对于不同的 key，把它路由到固定一个实例上进行读写

数据分多个实例存储，那寻找 key 的路由规则需要放在客户端来做，具体就是下面这样：

这种方案也叫做「客户端分片」，这个方案的缺点是， 客户端需要维护这个路由规则，也就是说，你需要把路由规则写到你的业务代码中。

如何做到不把路由规则耦合在客户端业务代码中呢？

继续优化，我们可以在客户端和服务端之间增加一个「中间代理层」，这个代理就是我们经常听到的 Proxy，路由转发规则，放在这个 Proxy 层来维护。

这样，客户端就无需关心服务端有多少个 Redis 节点了，只需要和这个 Proxy 交互即可。

Proxy 会把你的请求根据路由规则，转发到对应的 Redis 节点上，而且，当集群实例不足以支撑更大的流量请求时，还可以横向扩容，添加新的 Redis 实例提升性能，这一切对于你的客户端来说，都是透明无感知的。

业界开源的 Redis 分片集群方案，例如 Twemproxy、Codis 就是采用的这种方案。

这种方案的优点在于，客户端无需关心数据转发规则，只需要和 Proxy 打交道，客户端像操作单机 Redis 那样去操作后面的集群，简单易用。

架构演进到目前为止，路由规则无论是客户端来做，还是 Proxy 来做，都是「社区」演进出来的分片解决方案，它们的特点是集群中的 Redis 节点，都不知道对方的存在，只有客户端或 Proxy 才会统筹数据写到哪里，从哪里读取，而且它们都依赖哨兵集群负责故障自动切换。

也就是说我们其实就是把多个孤立的 Redis 节点，自己组合起来使用。

Redis 在 3.0 其实就推出了「官方」的 Redis Cluster 分片方案，但由于推出初期不稳定，所以用的人很少，也因此业界涌现出了各种开源方案，上面讲到的 Twemproxy、Codis 分片方案就是在这种背景下诞生的。

但随着 Redis Cluster 方案的逐渐成熟，业界越来越多的公司开始采用官方方案（毕竟官方保证持续维护，Twemproxy、Codis 目前都逐渐放弃维护了），Redis Cluster 方案比上面讲到的分片方案更简单，它的架构如下。

Redis Cluster 无需部署哨兵集群，集群内 Redis 节点通过 Gossip 协议互相探测健康状态，在故障时可发起自动切换。

另外，关于路由转发规则，也不需要客户端自己编写了，Redis Cluster 提供了「配套」的 SDK，只要客户端升级 SDK，就可以和 Redis Cluster 集成，SDK 会帮你找到 key 对应的 Redis 节点进行读写，还能自动适配 Redis 节点的增加和删除，业务侧无感知。

虽然省去了哨兵集群的部署，维护成本降低了不少，但对于客户端升级 SDK，对于新业务应用来说，可能成本不高，但对于老业务来讲，「升级成本」还是比较高的，这对于切换官方 Redis Cluster 方案有不少阻力。

于是，各个公司有开始自研针对 Redis Cluster 的 Proxy，降低客户端的升级成本，架构就变成了这样：

这样，客户端无需做任何变更，只需把连接地址切到 Proxy 上即可，由 Proxy 负责转发数据，以及应对后面集群增删节点带来的路由变更。

至此，业界主流的 Redis 分片架构已经成型，当你使用分片集群后，对于未来更大的流量压力，也都可以从容面对了！

总结

总结一下，我们是如何从 0 到 1，再从 1 到 N 构建一个稳定、高性能的 Redis 集群的，从这之中你可以清晰地看到 Redis 架构演进的整个过程。

数据怕丢失 -> 持久化（RDB/AOF）
恢复时间久 -> 主从副本（副本随时可切）
故障手动切换慢 -> 哨兵集群（自动切换）
读存在压力 -> 扩容副本（读写分离）
写存在压力/容量瓶颈 -> 分片集群
分片集群社区方案 -> Twemproxy、Codis（Redis 节点之间无通信，需要部署哨兵，可横向扩容）
分片集群官方方案 -> Redis Cluster （Redis 节点之间 Gossip 协议，无需部署哨兵，可横向扩容）
业务侧升级困难 -> Proxy + Redis Cluster（不侵入业务侧）

至此，我们的 Redis 集群才得以长期稳定、高性能的为我们的业务提供服务。

希望这篇文章可以帮你更好的理解 Redis 架构的演进之路。

作者：ryetan，腾讯 CSIG 后台开发工程师

Original: https://www.cnblogs.com/88223100/p/An-article-to-understand-the-evolution-of-Redis-architecture.html
Author: 古道轻风
Title: 一文搞懂 Redis 架构演化之路

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/529180/

转载文章受原作者版权保护。转载请注明原作者出处！

Linux

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

MySQL PXC集群的实现

MHA：一主多从，主节点挂了就提升一个从节点作为主节点。缺点：提升从节点为主节点需要时间，且只有一个节点能进行写操作，所以写的性能不高。双主架构：两个主节点，两个节点都能进行读…

Linux 2023年6月7日
0070
【Leetcode】198. 打家劫舍

你是一个专业的小偷，计划偷窃沿街的房屋。每间房内都藏有一定的现金，影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统，如果两间相邻的房屋在同一晚上被小偷闯入，系统会自动…

Linux 2023年6月6日
0090
Redis和Memcache

redis 和memcached都支持集群 Redis支持的数据类型要丰富得多,Redis不仅仅支持简单的k/v类型的数据，同时还提供String，List,Set,Hash,So…

Linux 2023年5月28日
0084
[转帖]shell学习之shell执行方式及排错

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

Linux 2023年5月28日
0081
高速USB转8串口产品设计-RS485串口

基于480Mbps 高速USB转8路串口芯片CH348，可以为各类主机扩展出8个独立的串口。使用厂商提供的VCP串口驱动程序，可支持Windows、Linux、Android、ma…

Linux 2023年6月7日
00110
select，poll，epoll的区别以及使用方法

I/O多路复用是指：通过一种机制，可以监视多个描述符，一旦某个描述符就绪（一般是读就绪或者写就绪），能够通知程序进行相应的读写操作。原生socket客户端在与服务端建立连接时，…

Linux 2023年6月14日
0089
学习一下 SpringCloud （五）– 配置中心 Config、消息总线 Bus、链路追踪 Sleuth、配置中心 Nacos

（1）相关博文地址：学习一下 SpringCloud （一）– 从单体架构到微服务架构、代码拆分（maven 聚合）: https://www.cnblogs.com/l-y…

Linux 2023年6月14日
00119
Shell第三章《for循环》

语法结构： for 变量名 [ in 取值列&a…

Linux 2023年6月6日
00127
大数据之Hadoop的HDFS存储优化—异构存储（冷热数据分离）

异构存储主要解决，不同的数据，储存在不同类型的硬盘中，达到最佳性能的问题 1）存储类型 RAM_DISK：内存镜像文件系统 SSD：SSD固态硬盘 DISK：普通磁盘，在HDFS中…

Linux 2023年6月8日
0076
[LINUX] 像电影里的黑客一样用 terminal 作为日常开发

1、效果预览 2、具体实现 2.1 定位鼠标位置 2.2 获取屏幕位置 2.3 计算鼠标在哪个窗口 2.4 1920×1080 平铺效果设计 2.5 1280×…

Linux 2023年6月8日
00110
UE4编辑器使用PS4/NS PRO手柄

在Steam里，点击添加非Steam游戏，把Unreal Engine添加进去，进大屏幕模式，设置手柄配置为强制开启即可！网上看到各种教程，都太复杂了………

Linux 2023年6月6日
00109
《卡死你3000》批量文件复制命令详解

卡死你3000简介：名词解释：批量顺序复制文件：从主控机，到从被控机1，被控机2，复制文件。有卡住问题。批量并发复制文件：从主控机，到从被控机1，被控机2，复制文件。使用多线…

Linux 2023年6月13日
00109
pyQt的基本使用

1. 基本窗口 import sys from PyQt5.QtWidgets import QApplication, QWidget if __name__ == ‘__mai…

Linux 2023年6月7日
0097
.Net MVC实现角色-API权限验证的一种方式

阅文时长 | 1.15分钟字数统计 | 1844.8字符主要内容 | 1、引言&背景 2、部分设计分享 3、声明与参考资料『.Net MVC实现角色-API权限验证的一种方…

Linux 2023年6月13日
0088
特殊进制

//0xaaaaaaaa = 10101010101010101010101010101010 (偶数位为1，奇数位为0） //0x55555555 = 1010101010101…

Linux 2023年6月13日
0090
每天一个 HTTP 状态码 203

203 ‘Non-Authoritative Informative’ 直译过来是「非权威信息」的意思… 203 Non-Authoritati…

Linux 2023年6月7日
0091

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

一文搞懂 Redis 架构演化之路

主从复制：多副本

哨兵：故障自动切换

分片集群：横向扩展

总结

大家都在看