zookeeper_overview

2023年6月8日下午9:41 • Java • 阅读 64

概述

zk 是一个开源的，分布式协调服务，它的目的就是为了服务于分布式应用。zk 允许分布式应用通过 zk 的节点进行相互协调，常见的有配置同步、分布式锁、微服务注册与发现等等。

zk 本身和它所要协调的分布式应用一样，也是也是在集群中相互复制，以保证 zk 的高可用性。每台服务器都需要相互了解，数据保持一致。只要大多数服务器是可用的，那么整个 zk 集群就是可用的。

zk 具有以下特性

有序的
高可用
高吞吐
低延迟

其中，zk 使用一个 zxid（事务id）来保证每个更新的先后顺序，客户端可以用这个特性来实现同步原语，也就是分布式锁，zk 的高可用是通过 zk 集群的数据一致性来保证的。高吞吐以及低延迟是因为 zk 在内存中维护一套数据映射，通过内存进行读取更新。当然 zk 还会将日志文件以及数据快照持久化，这也同样为高可用提供了一定的支持。

zk 数据模型

znode

zk 中的每个节点都由路径标识，和标准文件系统类似，都是采用 “/” 反斜杠进行进行路径分割。

如下图所示

znode 是我们访问的主要实体，我们需要对它有一个清晰的认识。

zk 中的每个节点都可以拥有子节点以及相关联的数据。这里的数据一般是存储分布式服务的协调数据如：状态信息、配置信息、位置信息等，因此存储在节点上的数据通常很小，在字节到千字节的范围内。

watch（监听）

zk 支持可以在指定的节点上设置监听，当节点更改后，监听会被触发以及删除，客户端会受到一个回调包，告知节点被更改了。

3.6.0 版本支持持久化监听，监听触发后可以不被删除。

数据权限（ACL）

zk 的每个节点都会有一个 acl 列表（访问控制列表）来限制谁可以做什么

临时节点

ZooKeeper 也有临时节点的概念。只要创建znode的会话是存活的，这些 znode 就会存在。当会话结束时，删除znode。由于这种行为，临时节点不允许有子节点。会话的临时列表可以使用 getEphemerals() api 检索。

序列节点–唯一命名

当创建znode时，你也可以请求ZooKeeper在路径的末尾添加一个单调递增的计数器。这个计数器对于父节点是唯一的。如创建了一个节点 /A，在 A 节点使用唯一命名，那么后续创建子节点就会用数字自动递增，如：/A/1, /A/2。这个计数器是靠父节点维护的，这里是 A 节点。

zk 中的时间

zxid：zk 事务 id，每次对 zk状态信息的一个更改都会收到一个事务 id，该 id 是唯一的，zk 会保证事务 id 小的在事务 id 大的之前进行更新，防止出现丢失更新的情况。
版本号：对节点的每次修改都会使得版本号增加，客户端操作一个节点时会带上版本号，如果版本号不一致，那么就会操作失败。这相当于加锁了。
version：修改 znode 数据的次数
cversion：对 znode 子节点修改的次数
aversion：对 znode 的 acl 列表修改的次数
Ticks：配置文件中的一个时间，单位是毫米，zk 中的大部分时间都是以该时间为基本单位。比如会话超时，就是 2 Ticks。
Real time：zk 除了在创建和修改 znode 时会将时间戳放入节点的 stat 结构中，其他任何地方都不会使用现实时间。

stat 结构

zk 节点的信息由一个 stat 结构维护

包含了以下信息：

czxid：该节点创建时候的 zxid
mzxid：该节点最后变更时候的 zxid
pzxid：该节点的子节点最后变更时候的 zxid
ctime ：节点创建时候的时间戳
mtime：节点修改时候的时间戳
version ：znode 数据变更的次数
cversion ：znode 子节点变更的次数
aversion ： znode 的 acl 列表变更的次数
ephemeralOwner：如果该节点是一个临时节点，则为创建该节点的会话id。如果它不是一个临时节点，它将为0。
dataLength ：该节点存储的数据的长度
numChildren：该节点的子节点数

会话（session）

当我们使用客户端连接 zk 服务端的时候就创建了一个会话，在建立连接的过程中，会话状态时 connecting，当通过验证，连接成功的时候，状态进入 connected，如果因为身份验证失败或者会话超时，那么，就进入一个 close 状态。

当我们使用以下代码连接 zk 服务器成功的时候就是建立了一个会话。

ZooKeeper zooKeeper = new ZooKeeper("127.0.0.1:2181", 4000, new Watcher() {
    @Override
    public void process(WatchedEvent watchedEvent) {
        if (Event.KeeperState.SyncConnected == watchedEvent.getState()) {
            System.out.println("watch");
        }
    }
});

zk 服务器会给客户端分配一个 64 位的 session id，同时为了安全考虑，也会配套的创建一套加密密码，当客户端因某种原因。连接到其他的 zk 服务器的时候，需要将 session id 和密码一起发送给 zk 服务器，重新建立连接。

zk 有一个 session 过期时间，默认为 2 Ticks time，当超过这个时间，zk 服务器没有收到客户端的信息（包括心跳），那么就会断开连接，session 就会进入到一个 close 状态。这时候在该会话中建立的所有临时节点都会被删除，同时通知给所有监听了这些节点的客户端。

如果因为连接的 zk 服务器宕机了，或者 session 在 zk 集群中重新分区时，这时候需要与其他 zk 服务器建立 session 连接，如果在超时时间内连接上了，那么状态重新回归 connected，否则，连接过期，这时候 zk 客户端会自动处理重新连接，无需重新创建新的会话对象（new ZooKeeper() ）。

会话通过客户端发送的请求保持活动。如果会话在一段时间内处于空闲状态，该会话将超时，那么客户机将发送一个PING请求以保持会话处于活动状态。这个PING请求不仅允许ZooKeeper服务器知道客户端仍然是活动的，而且它还允许客户端验证它到ZooKeeper服务器的连接仍然是活动的。PING的时间足够保守，以确保有合理的时间检测死连接并重新连接到新服务器。

监听（watch）

定义：在 zk 中监听是一次性的，当对某个节点设置了监听，那么当该节点进行了变更后，客户端就会受到一个回调通知。

所有对节点的读操作都可以设置对该节点的监听： getData(), getChildren(), 以及 exists()

zooKeeper.getData("/", new Watcher() {
    @Override
    public void process(WatchedEvent event) {
        System.out.println(event.getState());
    }
}, new Stat());

zooKeeper.getChildren("/", new Watcher() {
    @Override
    public void process(WatchedEvent event) {

    }
});

zooKeeper.exists("/", new Watcher() {
    @Override
    public void process(WatchedEvent event) {

    }
});

在 zk 3.6.0 版本中，客户端还可以在znode上设置永久的、递归的监听，这些监听在被触发时不会被删除，并递归地触发注册znode以及任何子znode上的更改。

如下，分别是创建持久监听已经持久递归监听

zooKeeper.addWatch("/",AddWatchMode.PERSISTENT);
zooKeeper.addWatch("/",AddWatchMode.PERSISTENT_RECURSIVE);

监听的一些顺序性问题：

客户端在获取到节点的新数据之前，会先拿到对于该节点的监听时间。
监听的顺序和 zk 更新节点的顺序是一致的

一些要注意的点：

标准的监听只触发一次，触发后如果想要对对应的节点继续监听数据，需要再次对该节点添加监听机制
由于标准的监听是一次性的，在获取数据和发送新的监听请求这中间可能可能有多次节点变更，这样会丢失掉一些关于该节点的更新监听

访问控制列表（ACL）

acl 支持以下几种权限

CREATE：可以创建子节点
READ：可以从节点中获取数据和子节点列表
WRITE：可以设置节点的数据
DELETE：可以删除子节点
*ADMIN：可以设置权限

保证

zk 为了能够构建更加复杂的服务，提供了以下保证

顺序一致性：来自客户端的更新将按照发送的顺序执行
原子性：更新要么成功，要么失败，没有部分成功部分失败
单一系统映像：客户端在不同的 zk 服务器中看到的都是相同的视图。即使因为故障转移到其他服务器，也不会看到历史视图。
可靠性：一旦节点被创建或更新，那么它将一直存在，除非它被删除或者更改了。
及时性：保证客户端在一定时间内看到到最近视图

简单的 api

zk 立志于提供一套简单编程接口，因此只支持以下几种 api

create ：创建节点
delete ：删除节点
exists ：判断某个节点是否存在
get data：读取某个节点的数据
set data：为某个节点写入数据
get children：检索节点的子节点列表
sync ：等待数据被同步

实现

每台 zk 服务器都会复制将自己的数据复制一份存为副本。复制的信息包含整个 zk 的内存数据，更新数据被记录到磁盘以实现可恢复性，写入数据在写入内存前会先被序列化到磁盘。

zk 集群中的服务器分为 1 台 leader 和多台 follower。zk 集群中的每台服务器都为客户端提供服务，不同的是 follower 提供读服务，leader 提供读服务和写服务，当 follower 接收到写请求时会转发到 leader 服务器处理，leader 服务器写入数据完后会广播给所有的 follower 进行同步写数据。假如 leader 出现故障，那么会从 follower 中选举一个新 leader 出来。

文章为本人学习过程中的一些个人见解，漏洞是必不可少的，希望各位大佬多多指教，帮忙修复修复漏洞！！！

参考资料

zk 官网

Original: https://www.cnblogs.com/cyrus-s/p/15506553.html
Author: 三木同学
Title: zookeeper_overview

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/589515/

转载文章受原作者版权保护。转载请注明原作者出处！

Java

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Caused by: java.lang.NoSuchMethodError: org.apache.poi.util.TempFile.setTempFileCreationStrategy

1.情景展示使用easyExcel，生成excel文件，报错信息如下： Caused by: java.lang.NoSuchMethodError: org.apache.po…

Java 2023年5月29日
0068
springbean的生命周期

作者：你的雷哥出处：https://www.cnblogs.com/henuliulei/ 本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须在文章页面给出原文连接，否则保…

Java 2023年5月30日
0071
Android开机流程-重新梳理

最近回顾的一些知识，补充了一下。源码标准：API : 29「Android 10.0」 android手机是怎么开机的？ android 的底层是 linux kernel「内核…

Java 2023年6月7日
0059
Spring Cloud Gateway 不小心换了个 Web 容器就不能用了

最近组员修改微服务的一些公共依赖，在某个依赖中需要针对我们微服务使用的 Undertow 容器做一些订制，所以加入了 web 容器 Undertow 的依赖。但是，一般这种底层框架…

Java 2023年6月7日
00129
并发编程之：线程池（一）

大家好，我是小黑，一个在互联网苟且偷生的农民工。池化线程池是在计算机开发中常见的一种池化技术，是为了提高资源的利用率，将一些资源重复利用，避免重复的构建来提高效率。类似字符串…

Java 2023年6月7日
0072
使用memc-nginx和srcache-nginx模块构建高效透明的缓存机制

模块介绍 memc-nginx和srcache-nginx模块均为前淘宝工程师agentzh（章亦春）开发。其中memc模块扩展了Nginx标准的memcache模块，增加了set…

Java 2023年5月30日
0079
Netty服务端接收的新连接是如何绑定到worker线程池的？

更多技术分享可关注我前言原文：Netty服务端接收的新连接是如何绑定到worker线程池的？前面分析Netty服务端检测新连接的过程提到了NioServerSocketCha…

Java 2023年5月30日
0078
JVM-虚拟机栈

运行时数据区-虚拟机栈 JAVA技术交流群:737698533 java虚拟机在执行java程序过程中会把它所管理的内存划分为若干个不同的区域,这些区域各有各的作用,根据java虚…

Java 2023年6月6日
0063
从IO到netty

一、pageCache 1.FileOutputStream与BufferedOutputStream的主要区别 系统&#x8C…

Java 2023年6月9日
0077
《软技能-代码之外的生存指南》读书笔记

《软技能-代码之外的生存指南》读书笔记写在前面最近项目相对松了一些，想静下心来看一些书，买了些DDD的书，记得这本书也是程序员必读的书之一，就凑单也买了纸质的来看看~ 抄录一些…

Java 2023年6月6日
0074
「免费开源」基于Vue和Quasar的前端SPA项目crudapi零代码开发平台后台管理系统实战之元数据导出导入（十五）

基于Vue和Quasar的前端SPA项目实战之元数据导出导入（十五）回顾通过前一篇文章基于Vue和Quasar的前端SPA项目实战之模块管理（十四）的介绍，通过模块管理将具有相…

Java 2023年6月6日
0093
Java数组

数组可以存放多个同一类型的数据，是引用类型一般使用方式先定义并声明 int[] arr = new int[5]; // 默认为值数据类型的值行可以先声明再分配空间…

Java 2023年6月7日
0064
MyBatis关联查询和懒加载错误

今天在写项目时遇到了个BUG。先说一下背景，前端请求更新生产订单状态，后端从前端接收到生产订单ID进行查询，然后就有问题了。先看控制台报错： org.apache.ibatis….

Java 2023年6月8日
0057
利用订阅模式实现缓存更新

1. 引言很多Web项目，都需要和数据库打交道，典型的就是CRUD（读，写，更新，删除）操作。无论是哪种数据库，Asp.Net MVC 作为后端框架的项目，都有很多操作数据库的类…

Java 2023年6月5日
0052
Spring系列6：depends-on干预bean创建和销毁顺序

初始化： depends-on 属性可以显式地强制一个或多个 bean 在使用这个元素的 bean 被初始化之前被初始化。销毁： depends-on 属性指定的那些依赖bean…

Java 2023年6月5日
0037
解决 No IDEA annotations attached to the JDK 1.8和xml文件没有代码提示

Android studio3.3 用着用着突然xml里没有代码联想了，忙着做其他的就没管，写xml的时候就硬写… 然后今天用着突然在class文件上方提示 No ID…

Java 2023年5月30日
0067

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30