Binlog分析利器-binlog_summary.py

2023年6月11日上午5:51 • 数据库 • 阅读 90

Binlog中，除了具体的SQL，其实，还包含了很多有价值的信息，如，

拿到上面这些信息，我们可以做哪些事情呢？

开发了一个简单的Binlog分析工具-binlog_summary.py，可提取上面这些信息，并在此基础上，进行一些常见分析。

1. 下载地址

2. 参数解析

其中，

-f：Binlog通过mysqlbinlog解析后的文本文件。注意，是文本文件，不是Binlog原始文件。使用mysqlbinlog解析时，建议指定-v（显示Pseudo SQL，即伪SQL）和–base64-output=decode-rows（不会显示Base64的编码结果）这两个参数，这样，生成的文本文件才是最小的，相应地，binlog_summary.py解析起来也是最快的。具体命令如下：

mysqlbinlog --base64-output=decode-rows -v mysql-bin.000001 > /tmp/mysql-bin.000001.txt

–new：工具的分析结果默认是存储在sqlite3数据库中。如果指定了–new，会删除之前创建的sqlite3数据库。注意，在对一个新的Binlog进行分析时需指定该参数。
-c：指定命令的类型。支持的命令类型有：
tps：分析实例的TPS信息。
opr：分析表的操作情况。
transaction：分析事务信息。
–start：开始时间。分析指定时间段的日志。
–stop：结束时间。
–sort：排序条件。当命令类型是transaction时，默认是按照事务的执行顺序输出的，可指定size，按事务大小排序，也可指定time，按事务的持续时间排序。
-e：当命令类型是transaction时，指定该参数会输出每个事务的详细操作信息。
–limit：限制输出的行数。

3. 常见用法

注意，这里的TPS是基于事务的提交时间来统计的。

如此细粒度的TPS信息，只能通过Binlog来获取。一般的监控很难做到这一点。

如果要对TPS进行排序，可通过管道 + sort，如，

其中，-k 3是对第三列进行排序，-n是按照数值（默认是字符）的大小进行排序，也可指定-r参数，反向排序。

这里的NUMS是执行次数。

其中，

TRANS_NAME：事务编号。
BEGIN_TIME：事务开始时间。
COMMIT_TIME：事务提交时间。
BEGIN_LOG_POS：事务的开始位置点。
COMMIT_LOG_POS：事务的结束位置点。
DURATION_TIME：事务的持续时间，单位秒。其中，DURATION_TIME = COMMIT_TIME – BEGIN_TIME。
SIZE：事务的大小，单位字节，其中，SIZE = COMMIT_LOG_POS – BEGIN_LOG_POS。

拿到事务的大小，我们可以粗略地判断这个Binlog中是否存在大事务。如果要进一步分析事务中包含哪些操作，需加上–extend，如，

4. 实现思路

binlog_summary.py是分析Binlog经过mysqlbinlog解析后的文本文件。具体来说，

接下来，再来说说，为什么是分析Binlog经过mysqlbinlog解析后的文本文件，而不是基于MySQL复制协议，直接分析Binlog呢？基于MySQL复制协议，这种方式有个弊端，就是通用性不够，每出一个新的版本，都要进行相应的适配。

基于文本来分析，很多人可能会觉得不高效。

实际测试了下，分析一个1G的Binlog，大概3min，也不算慢。

Original: https://www.cnblogs.com/ivictor/p/15114460.html
Author: iVictor
Title: Binlog分析利器-binlog_summary.py

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/598970/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

达梦产品技术支持培训-day6-DM性能诊断与优化

（本文只作为个人随笔用途，非官方文档，请勿作他用，谢谢） 1、DM8查询优化基本思路 1.1 操作系统性能诊断 linux常用系统监控命令 top 主要关注DMserver 的CP…

数据库 2023年6月11日
0068
ReentrantLock 公平锁源码第0篇

ReentrantLock 0 关于ReentrantLock的文章其实写过的,但当时写的感觉不是太好,就给删了,那为啥又要再写一遍呢最近闲着没事想自己写个锁,然后整了几天出来后…

数据库 2023年6月16日
0075
Could not initialize class org.apache.maven.plugin.war.util.WebappStructureSerializer

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

数据库 2023年6月6日
0078
做自动化测试选择Python还是Java？

你好，我是测试蔡坨坨。今天，我们来聊一聊测试人员想要进阶，想要做自动化测试，甚至测试开发，如何选择编程语言。自动化测试，这几年行业内的热词，也是测试人员进阶的必备技能，更是软件…

数据库 2023年6月11日
0094
How to code like a pro in 2022 and avoid If-Else

高级开发人员如何编写代码： var input = "Dog"; var map = new Dictionary<string, string> …

数据库 2023年6月11日
0063
JavaScript进阶内容——BOM详解

JavaScript进阶内容——BOM详解在上一篇文章中我们学习了DOM，接下来让我们先通过和DOM的对比来简单了解一下BOM 首先我们先来复习一下DOM：文档对象模型 DOM…

数据库 2023年6月14日
00145
【转】IDEA一键部署SpringBoot项目到服务器

原文连接：https://www.cnblogs.com/chanmufeng/p/15926928.html 1. 安装Alibaba Cloud Toolkit插件 2. 配置…

数据库 2023年6月6日
0076
Spring Boot整合Spring Data连接postgreSQL完成简单的CRUD操作

导入jpa依赖和postgresql依赖：编写pojo层数据库实体类Company：编写接口：编写测试类：基本使用教程 Original: https://www.cnbl…

数据库 2023年6月6日
0073
Python–序列化与反序列化

序列化是将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间，对象将其当前状态（存在内存中）写入到临时或持久性存储区（硬盘）。以后，可以通过从存储区中读取或反序列化对象的…

数据库 2023年6月9日
0093
JSP基础知识总结

JSP概述什么是 jsp Servlet 程序输出 html 页面如何创建一个 jsp 动态页面程序如何修改 jsp 文件的默认编码 jsp 的运行原理 jsp 的语法 js…

数据库 2023年6月11日
0092
Typora 开始收费，改用好玩的MarkText

收费…… 可以考虑使用： MarkText 简述MarkText MarkText 这个工具侧重于”命令”，导航栏都被收起来了。有些…

数据库 2023年6月6日
00111
工具 | 常用 PostgreSQL 预防数据丢失方案

作者：张连壮 PostgreSQL 研发负责人从事多年 PostgreSQL 数据库内核开发，对 Citus 有非常深入的研究。 PostgreSQL 本身不具备数据闪回和数据误删…

数据库 2023年5月24日
0068
jenkins-配置python

1. 进入”Dashboard”界面,点击左侧”构建执行状态” 2. 点击列表设置图标 3. 勾选”Environmen…

数据库 2023年6月14日
0058
Win10系统-接口自动化测试持续集成

使用工具：jdk+jmeter+Ant+jenkins jdk-1.8.0_241版本【安装参考链接：https://blog.51cto.com/u_15463439/52268…

数据库 2023年6月14日
0088
达梦数据库_DM8配置实时主备

1、环境说明准备三台机器DM_HD1、DM_HD11、DM_SH，DM_HD1和DM_HD11用来部署主备库，DM_SH用来部署确认监视器。其中DM_HD1和DM_HD11配置两…

数据库 2023年6月11日
00119
Postman安装及汉化

1. 安装postman 各位根据各自需要可以参考下表自行下载，把链接内的”版本号”替换为指定的版本号操作系统下载链接 Windows64位 Windo…

数据库 2023年6月14日
0090

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Binlog分析利器-binlog_summary.py

1. 下载地址

2. 参数解析

3. 常见用法

4. 实现思路

大家都在看