MIT 6.824 Lab2D Raft之日志压缩

2023年6月14日下午2:01 • 数据库 • 阅读 147

书接上文Raft Part C | MIT 6.824 Lab2C Persistence。

实验准备

实验代码： git://g.csail.mit.edu/6.824-golabs-2021/src/raft
如何测试： go test -run 2D -race
相关论文：Raft Extended Section 7
实验指导：6.824 Lab 2: Raft (mit.edu)

实验目标

实现 Snapshot、 CondInstallSnapshot、 InstallSnapshot RPC，并修改之前的代码以支持本次实验的内容。

一些提示

不要使用论文中的偏移机制为数据分片，每个分片作为一个快照。而是每次RPC发送全部数据作为一个快照。
丢弃旧日志的全部引用，以便GC回收。
由于保存快照要丢弃部分日志，不能再使用日志长度来作为索引日志的标准。
考虑是否需要持久化 lastIncludeTerm和 lastIncludeIndex。
使用 rf.persister.SaveStateAndSnapshot()持久化快照。

日志压缩

日志序列不断扩张，是无法全部存储在内存中的，对于已经应用到状态机的部分日志，就不再需要维护在Raft中。

但由于仍可能存在部分Follower的日志序列远远落后于Leader，因此这部分日志不能被Leader丢弃，在同步日志时，若Leader中原应被同步的日志在快照中，则将快照发送给Follower。

lastIncluedTerm & lastIncludeIndex

日志压缩后，Raft需要记录额外的两个信息， lastIncludeIndex、 lastIncludeTerm表示快照中最后一个log的index和Term。

此处设计新的log类型如下。

type Log struct {
    Entries []LogEntry
    Base    int
}

需要注意的是， Log.Entries从1开始存储，因此 Log.Entries[0].Term用于存储 lastIncludeTerm， Log.Base表示 Log.Entries[0]的逻辑位置，也是 lastIncludeIndex的值。

本例中，lastIncludeIndex = 4，lastIncludeTerm = 2，snapshot = [1,1,1,2]。

为Log添加相关成员函数。

func (l *Log) size() {
    return l.Base + len(l.Entries)
}

func (l *Log) get(i int) {
    return l.Entries[i-l.Base]
}

func (l *Log) set(i int, e LogEntry) {
    l.[i-l.Base] = e
}

Snapshot()

Snapshot(index int, snapshot []byte)由状态机调用，传入的 index表示 lastIncludeIndex， snapshot由状态机生成，需要Raft保存，用于发送Follower时需要。

func (rf *Raft) Snapshot(index int, snapshot []byte) {
    if index

index <= rf.log.base< code>说明传入的snapshot是一个旧的快照。

InstallSnapshot RPC

首先是 heartbeat()应该新增如下逻辑，当Leader中应被同步到Follower的日志在快照中时，将快照发送给Follower。

if next

sendSnapshot()和发送日志序列类似。

func (rf *Raft) sendSnapshot(id int, peer *labrpc.ClientEnd, args InstallSnapshotArgs) {
    reply := InstallSnapshotReply{}
    ok := peer.Call("Raft.InstallSnapshot", &args, &reply)
    if !ok {
        return
    }

    if reply.Term > rf.currentTerm {
        rf.toFollower(reply.Term)
        return
    }

    rf.nextIndex[id] = args.LastIncludedIndex + 1
    rf.matchIndex[id] = args.LastIncludedIndex
}

InstallSnapshot()和 AppendEntries()类似， args.LastIncludedIndex <= rf.log.base< code>也是一样的，表示一个旧的快照。

func (rf *Raft) InstallSnapshot(args *InstallSnapshotArgs, reply *InstallSnapshotReply) {
    rf.lastRecv = time.Now()

    if args.Term > rf.currentTerm {
        rf.toFollower(args.Term)
    }
    reply.Term = rf.currentTerm

    if args.Term < rf.currentTerm || args.LastIncludedIndex

注意：快照是状态机中的概念，需要在状态机中加载快照，因此要通过applyCh将快照发送给状态机，但是发送后Raft并不立即保存快照，而是等待状态机调用 CondInstallSnapshot()，如果从收到 InstallSnapshot()后到收到 CondInstallSnapshot()前，没有新的日志提交到状态机，则Raft返回True，Raft和状态机保存快照，否则Raft返回False，两者都不保存快照。

如此保证了Raft和状态机保存快照是一个原子操作。当然在 InstallSnapshot()将快照发送给状态机后再将快照保存到Raft，令 CondInstallSnap()永远返回True，也可以保证原子操作，但是这样做必须等待快照发送给状态机完成，但是 rf.applyCh <- applymsg< code>是有可能阻塞的，由于<code>InstallSnapshot()</code>需要持有全局的互斥锁，这可能导致整个节点无法工作。

为什么要保证原子操作？因为负责将commit状态的日志提交到状态机的goroutine不负责快照部分，因此必须是先保存快照，再同步日志。

本系列文章给出的代码为了好读，没有考虑同步问题，正常来讲 applyCh <- applymsg< code>这个操作是需要令起一个goroutine去做的。

如何判断 InstallSnapshot()到 CondInstallSnapshot()之间没有新的日志提交到状态机呢？这里使用 commitIndex来判断，当 lastIncludeIndex <= commitindex< code>时，说明这期间原本没有的快照部分的日志补全了，虽然commit状态并不一定是apply状态，但这里以commit为准，更安全。

func (rf *Raft) CondInstallSnapshot(lastIncludedTerm int, lastIncludedIndex int, snapshot []byte) bool {
    if lastIncludedIndex

需要注意的是，这里截断 rf.log.Entries的方式，如果使用 s = s[i:]这样的方式，依然维持对底层数组全部元素的引用，是无法被GC回收的。

还有一点要注意的是，不要忘记在 Make()中读取持久化的 snapshot，并初始化 lastApplied的值。

最后，为了证明我不是在乱写，附上我的测试结果。

Original: https://www.cnblogs.com/suqinglee/p/15550004.html
Author: 李素晴
Title: MIT 6.824 Lab2D Raft之日志压缩

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/611818/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python-django框架中使用docker和elasticsearch配合实现搜索功能

注意：系统环境为Ubuntu18 一、docker安装 0：如果之前有安装过docker使用以下命令卸载： bash;gutter:true; sudo apt-get remov…

数据库 2023年6月6日
00198
类加载器及其加载原理

概述在之前的文章”类的加载流程”讲了一个Class文件从加载到卸载整个生命周期的过程，并且提到”非数组类在加载阶段是可控性最强的”…

数据库 2023年6月11日
00102
事务的本质和死锁的原理・改

由于一些错误操作和被爬的原因，我重新整理了 上一篇文章https://…

数据库 2023年6月9日
0075
Linux下Oracle单实例配置多监听

Oracle单实例配置多监听一、前言有时候我们项目中需要使用Oracle数据库，同时要需要不同的数据源，而Oracle不像Mysql那样直接建个库即可，Oracle是以账号为单…

数据库 2023年6月16日
00104
万恶的Jackson

一、吐槽已经是凌晨12点了我还是睡不着我所有的实体类时间用的j8的LocalDateTime这就导致一个问题：jackson不能序列化时间，因为它不支持j8的Api，让我添加 j…

数据库 2023年6月6日
0071
jdbc-使用java连接mysql

package com.cqust; import com.mysql.jdbc.Driver; import java.sql.Connection;import java.sq…

数据库 2023年5月24日
0054
SQL语句实战学习

参考：https://zhuanlan.zhihu.com/p/38354000再次感谢作者的整理！！ 1.数据已提前准备好了，已知有如下4张表：学生表：student 成绩表：s…

数据库 2023年6月16日
0075
logstash写入文件慢的问题排查记录

终于找到根本原因了！！！！！ logstash部署到k8s集群内部的，当所在节点的CPU资源被其他应用抢占时，logstash的处理速度就会降低问题现象 logstash从kaf…

数据库 2023年6月9日
0078
Volatile的学习

首先先介绍三个性质可见性可见性代表主内存中变量更新，线程中可以及时获得最新的值。下面例子证明了线程中可见性的问题由于发现多次执行都要到主内存中取变量，所以会将变量缓存到线程…

数据库 2023年6月11日
0059
获取不到数据库连接问题

org.springframework.jdbc.CannotGetJdbcConnectionException: Could not get JDBC Connection; …

数据库 2023年6月11日
0075
Mysql数据库 ALTER 基本操作

背景： ALTER作为DDL语言之一，工作中经常遇到，这里我们简单介绍一下常见的几种使用场景新建两个测试表offices 和 employess CREATE TABLE off…

数据库 2023年6月14日
0072
图数据挖掘！使用图分析+AI进行保险欺诈检测 ⛵

💡 作者：韩信子@ShowMeAI📘 机器学习实战系列：https://www.showmeai.tech/tutorials/41📘 本文地址：https://www.showm…

数据库 2023年6月14日
0071
pg 锁表

select * from pg_catalog.pg_stat_activity where usename =’gis_bd_app’ and wait…

数据库 2023年6月6日
0094
【黄啊码】MySQL入门—6、掌握这些数据筛选技能比你学python还有用-2

大家好！我是黄啊码，上节课我们将了DISTINCT、 FROM 、 GROUP BY、 HAVING 、 ORDER BY 这些筛选数据的技能，是不是总感觉少了些啥？你：啊码，你…

数据库 2023年6月16日
00100
3_MyBatis

一. 引言 1.1 什么是框架? 软件的半成品, 解决了软件开发过程中的普适性问题, 从而简化了开发步骤, 提升了开发效率 1.2 什么是ORM框架? ORM(Object Rel…

数据库 2023年6月11日
0071
Linux远程终端连接工具：SecureCRT

SecureCRT SecureCRT是一款支持 SSH2、SSH1、Telnet、Telnet/SSH、Relogin、Serial、TAPI、RAW 等协议的终端仿真程序 Se…

数据库 2023年6月11日
0094

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30