详细记录一次stampstime字段引起pxc集群脑裂

事故回顾

运维执行导入sql,导入后收到master2和master3节点宕机的报警;
检查集群状态发现master1进入初始化模式,无法读写;master2和master3已经下线;

处理方法

分别进入3个master节点,发现master2和master3两个节点已经退出;
master1节点可以进入,使用命令show global status like “wsrep_local_state_comment”;查看发现集群进入Initialized状态,集群不能读写;
重启master1节点,重启完成后,节点恢复读写,业务恢复正常;
逐个启动master2和master3节点,恢复集群的状态;
注1:master2和master3数据同步时可能会存在锁表造成集群不可访问,所以建议在业务低峰时恢复业务;
注2:如果master2和master3下线时间过长,可能触发全量同步;
注3:建议将数据库的wsrep_sst_method参数值改为xtrabackup,可用方法有mysqldump、rsync和xtrabackup,前两者在传输时都需要对Donor加全局只读锁(FLUSH TABLES WITH READ LOCK),xtrabackup则不需要(它使用percona自己提供的backup lock);

事故原因

业务需求从beta导一个表结构到生产,运维导出时漏加了–skip-tz-utc参数,导致使用了mysqldump的默认值–tz-utc;
导出的sql中会增加一个将session改为utc时区(+00:00)的设置,并将timestamp字段的时间同步减8小时(由+8:00时区改为+00:00);
将这个sql导入pxc集群时,master1导入成功。当这个操作同步到另外2个pxc节点时,session中的时区设置并不会同步,造成导入sql的时间比实际少了8小时;
我们导入的表默认时间为1970:08:01,时间减少后变成了1970:00:01,超过了cts时区(+08:00)timestamp字段允许的最小值(1970:08:00),建表失败;
master2和3数据跟master1不一致,节点下线。master1发现只有自己最后1个节点存在,认为集群失效,变为初始化状态,pxc集群无法读写;

后续处理与防范

使用脚本来操作数据库的导入导出,避免人为因素导致集群异常;
排期配置和验证允许脏读,让集群出问题时,数据库至少能提供查询服务。这个需要考虑业务是否支持;

Original: https://www.cnblogs.com/ly6161/p/xiang-xi-ji-lu-yi-cistampstime-zi-duan-yin-qipxc-j.html
Author: 打个酱油6161
Title: 详细记录一次stampstime字段引起pxc集群脑裂

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/610853/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Windows下的SSH Server

    (请注意,本文内容以杂谈为主,稍微提及了一些在MobaXterm中开启SSH Server可能遇到的情况和解决方法,没有多少干货,请酌情查看,谢谢) 最近比较无聊,使用MobaXt…

    Linux 2023年6月6日
    0104
  • Redis主从复制

    一、主从复制 1、redis为什么还要主从复制? 和Mysql主从复制的原因一样,Redis虽然读取写入的速度都特别快,但是也会产生读压力特别大的情况。为了分担读压力,Redis支…

    Linux 2023年5月28日
    075
  • SSH升级版本–8.2p1

    前期准备 执行yum update openssh先升级下. 反正官方提供的这种升级是没问题的。如果之前手动编译操作过openssh的升级,变更了默认配置文件路径什么的请自行测试。…

    Linux 2023年6月8日
    091
  • 本地连接虚拟机redis,解决redis connection refused: connect问题

    VM VirtualBox安装虚拟机ubuntu16.04 1、redis.conf配置文件中注释 bind 127.0.0.1,重启redis: 2、防火墙关闭(或添加可访问的端…

    Linux 2023年5月28日
    098
  • Jq 手机端输入框防止底部菜单被小键盘弹起

    var winHeight = $(window).height(); //获取当前页面高度 $(window).resize(function () { var thisHeig…

    Linux 2023年6月7日
    086
  • Java8新特性终极指南

    欢迎来到Java学习之Java8新特性终极指南 目录 系列文章目录 @ 目录 系列文章目录 Java语言新特性 Lambda表达式 函数式接口 方法引用 接口的默认方法 重复注解 …

    Linux 2023年6月13日
    0111
  • 【已解决】linux centos7系统磁盘扩容

    第一步要手动加硬盘(我的操作是在20G的基础上加了30G) [reliable@hadoop102 ~]$ su root密码: 查看当前磁盘挂载情况: [root@hadoop1…

    Linux 2023年5月27日
    0104
  • nginx安装配置步骤

    ​ yum install gcc gcc-c++ pcre pcre-devel openssl openssl-devel zlib zlib-devel -y [root@n…

    Linux 2023年6月11日
    091
  • windows下redis配置密码

    redis安装后目录如下: 最简单的启动方式是直接双击redis-server.exe 这样启动会有个问题,一旦你把命令行窗口关闭 redis也会被关闭,所以我们需要把它注册成服务…

    Linux 2023年5月28日
    0103
  • 使用docker 5分钟搭建一个博客(mysql+WordPress)

    一.系统环境 二.前言 三.搭建博客 3.1 创建wordpress和mysql容器 3.2 在wordpress界面设置个人博客信息 3.3 WordPress容器创建命令的简化…

    Linux 2023年6月7日
    0106
  • Hadoop伪分布式的搭建

    1.准备Linux环境1.1 开启网络,ifconfig指令查看ip 1.2 修改主机名为自己名字(hadoop) 1.3修改主机名和IP的映射关系 1.4关闭防火墙 1.5重启L…

    Linux 2023年5月27日
    077
  • Linux下定时自动备份Docker中所有SqlServer数据库

    给出一个备份的范例 #!/bin/bash #设置mssql备份目录 folder=/var/opt/mssql/data/databack/ day=date +%Y%m%d%H…

    Linux 2023年6月14日
    0110
  • Django补充

    django配置文件相关操作 django实际上有两个配置文件 一个是提供给用户可以自定义的基本配置 from 项目名 import settings 一个是全局的系统默认的配置 …

    Linux 2023年6月7日
    0106
  • 搭建Nginx七层反向代理

    基于https://www.cnblogs.com/Dfengshuo/p/11911406.html这个基础上,在来补充下七层代理的配置方式。简单理解下四层和七层协议负载的区别吧…

    Linux 2023年6月8日
    0120
  • Spring Session Redis

    http://www.infoq.com/cn/articles/Next-Generation-Session-Management-with-Spring-Session Or…

    Linux 2023年5月28日
    094
  • ThinkPHP5 远程命令执行漏洞

    一、ThinkPHP介绍 轻量级框架,内部OOP和面向过程代码都存在,是国人自己开发的框架。ThinkPHP是一个快速、兼容而且简单的轻量级国产PHP开发框架,诞生于2006年初,…

    Linux 2023年6月14日
    078
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球