详细记录一次stampstime字段引起pxc集群脑裂

2023年5月24日下午3:28 • 数据库 • 阅读 78

事故回顾

运维执行导入sql，导入后收到master2和master3节点宕机的报警；
检查集群状态发现master1进入初始化模式，无法读写；master2和master3已经下线；

处理方法

分别进入3个master节点，发现master2和master3两个节点已经退出；
master1节点可以进入，使用命令show global status like “wsrep_local_state_comment”；查看发现集群进入Initialized状态，集群不能读写；
重启master1节点，重启完成后，节点恢复读写，业务恢复正常；
逐个启动master2和master3节点，恢复集群的状态；
注1：master2和master3数据同步时可能会存在锁表造成集群不可访问，所以建议在业务低峰时恢复业务；
注2：如果master2和master3下线时间过长，可能触发全量同步；
注3：建议将数据库的wsrep_sst_method参数值改为xtrabackup，可用方法有mysqldump、rsync和xtrabackup，前两者在传输时都需要对Donor加全局只读锁(FLUSH TABLES WITH READ LOCK)，xtrabackup则不需要(它使用percona自己提供的backup lock)；

事故原因

业务需求从beta导一个表结构到生产，运维导出时漏加了–skip-tz-utc参数，导致使用了mysqldump的默认值–tz-utc；
导出的sql中会增加一个将session改为utc时区（+00:00）的设置，并将timestamp字段的时间同步减8小时（由+8：00时区改为+00:00）；
将这个sql导入pxc集群时，master1导入成功。当这个操作同步到另外2个pxc节点时，session中的时区设置并不会同步，造成导入sql的时间比实际少了8小时；
我们导入的表默认时间为1970:08:01，时间减少后变成了1970:00:01，超过了cts时区（+08：00）timestamp字段允许的最小值（1970:08:00），建表失败；
master2和3数据跟master1不一致，节点下线。master1发现只有自己最后1个节点存在，认为集群失效，变为初始化状态，pxc集群无法读写；

后续处理与防范

使用脚本操作数据库的导入和导出，避免人为因素导致的集群异常

[En]

Use scripts to operate the import and export of the database to avoid cluster anomalies caused by human factors

调度配置和验证允许脏读，这样当集群出现问题时，数据库至少可以提供查询服务。这需要考虑业务是否支持。

[En]

Scheduling configuration and verification allow dirty reading, so that when something goes wrong with the cluster, the database can at least provide query services. This needs to consider whether the business supports or not.

Original: https://www.cnblogs.com/ly6161/p/xiang-xi-ji-lu-yi-cistampstime-zi-duan-yin-qipxc-j.html
Author: 打个酱油6161
Title: 详细记录一次stampstime字段引起pxc集群脑裂

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/507918/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Go编译过程

一、 Go编译流程二、过程说明词法解析读取Go源文件，将字符序列转换为符号(token)序列，比如将”:=”转换为_Define 代码中的标识符、关键…

数据库 2023年6月14日
0079
MIB MODULE HOST-RESOURCES-MIB

Textual Conventions Name: BooleanSyntax: Enumerated Name: KBytesSyntax: Integer Range Name…

数据库 2023年6月11日
0098
Spark学习(4) Spark Streaming

Apache Flink SparkSteaming Storm 架构介于spark和storm之间，主从结构与sparkStreaming相似，DataFlow Grpah与st…

数据库 2023年6月16日
0086
MySQL InnoDB 锁的二三事

近日, 在一个小型项目中, 遇到了一个触及我知识盲区的bug. 项目用的是MySQL 5.7.25, 其中有一张表 config_data, 包含四个字段, id, name, v…

数据库 2023年6月11日
00116
Java并发编程之AQS以及源码解析

文章目录概览实现思路实现原理 * 源自CLH锁 AQS数据模型 CAS操作主要方法 * 自定义同步器的实现方法 AQS定义的模板方法源码解读 * 等待状态释义 AQS获取…

数据库 2023年6月6日
0077
一文说透 MySQL JSON 数据类型（收藏）

JSON 数据类型是 MySQL 5.7.8 开始支持的。在此之前，只能通过字符类型（CHAR，VARCHAR 或 TEXT ）来保存 JSON 文档。相对字符类型，原生的 JS…

数据库 2023年5月24日
0080
MySQL 的 GRANT和REVOKE 命令

MySQL 的 GRANT和REVOKE 命令 GRANT – 授权将指定 操作对&#x8C…

数据库 2023年5月24日
00125
SpringBoot下配置文件密码加密

一、导入配置文件 csharp;gutter:true; com.github.ulisesbocchio jasypt-spring-boot-starter 3.0.4<…

数据库 2023年6月14日
0078
Linux（CentOS）安装MinIo，详细教程，附防火墙端口开放操作

Linux安装MinIo（已配置开机重启） 1，准备安装目录和文件系统:CentOs #进入安装目录 cd /home/minio #在线下载二进制文件 wget https:/…

数据库 2023年6月11日
0082
ES6中的模块化

历史上，JavaScript一直没有自己模块体系（module），无法将一个大程序拆分成互相依赖的小文件，再用简单的方法拼装起来。其他语言如java、python等都具备这项功能，…

数据库 2023年6月6日
0077
多商户商城系统功能拆解24讲-平台端分销会员

多商户商城系统，也称为B2B2C（BBC）平台电商模式多商家商城系统。可以快速帮助企业搭建类似拼多多/京东/天猫/淘宝的综合商城。多商户商城系统支持商家入驻加盟，同时满足平台自营…

数据库 2023年6月14日
0095
MySQL主从复制

一、概述主从复制是指将主数据库（Master）的DDL和DML操作通过二进制日志传到从库（Slave）服务器中，然后在从库上对这些日志重新执行(也叫重做)，从而使得从库和主库的数…

数据库 2023年5月24日
00107
MySQL主从备库过滤参数分析和测试

测试环境： GTID的主从复制，主库（9900）——》备库（9909），存在测试库表： 9900_db1库：t1、t2、t3、t4、t5表 9900_db2库：t6、t7、t8、t…

数据库 2023年5月24日
0064
Minio的安装与使用

Minio的安装与使用一、Minio介绍 MinIO 是在 Apache License v2.0 下发布的高性能对象存储. 就是说是个存东西的玩意，比较方便配好启动就能访问，也…

数据库 2023年6月6日
00107
员工离职困扰？来看AI如何解决，基于人力资源分析的 ML 模型构建全方案 ⛵

💡 作者：韩信子@ShowMeAI📘 数据分析实战系列：https://www.showmeai.tech/tutorials/40📘 机器学习实战系列：https://www.s…

数据库 2023年6月14日
0092
MySQL实战45讲 3

03 | 事务隔离：为什么你改了我还看不见？事务 Transaction TRX 事务就是要保证一组数据库操作，要么全部成功，要么全部失败。 MySQL 原生的 MyISAM …

数据库 2023年6月16日
0095

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

详细记录一次stampstime字段引起pxc集群脑裂

事故回顾

处理方法

事故原因

后续处理与防范

大家都在看