tunm二进制协议在python上的实现

2023年5月23日下午11:59 • Python • 阅读 70

tunm是一种对标JSON的二进制协议, 支持JSON的所有类型的动态组合

支持的数据类型

基本支持的类型 “u8”, “i8”, “u16”, “i16”, “u32”, “i32”, “u64”, “i64”, “varint”, “float”, “string”, “raw”, “array”, “map”

为什么我们需要二进制协议

下图是文本格式JSON与tunm的对比

类型可读可编辑编码速度解码速度数据大小预定义 JSON ✓ ✓ 慢慢大否 tunm x x 快快小否 protobuf x x 快快小是

在高性能的场景下, 或者需要流量传输比较敏感的地方, 通常会选择二进制来代替文本协议来做为通讯的, 如RPC, REST, 游戏等情况。
相对于google protobuf, 它需要比较完善的预定义过程, 就比如客户端版本1, 服务端版本2, 就有比较大的可能造成不兼容, 对需求经常变化的就会比较难与同步。
tunm相对于JSON, 若第一版是

{
    "name": "tunm", "version": 1
}

此时第二版需要加入用户的id, 就可以很方便的变成

{
    "name": "tunm", "version": 2, "id": 1
}

而对客户端1来说, 只是多一个id的字段, 不会有任何的破坏, 做到版本升级而无影响

协议的二进制格式

数据协议分为三部分(协议名称, 字符串索引区, 数据区(默认为数组))
如数据协议名为cmd_test_op, 数据为[“tunm_proto”, {“name”: “tunm_proto”, “tunm_proto”: 1}]

协议的实现(小端对齐)

ByteBuffer具有组装字节流的功能, 比如写入字符串, 写入int, 还有里面存储字符串索引区

class ByteBuffer(object):
    def __init__(self):
        # 字节缓冲区
        self.buffer = bytearray([00]*1024)
        # 写入的位置索引号
        self.wpos = 0
        # 读出的位置索引号
        self.rpos = 0
        # 大小端格式
        self.endianness = "little"
        # 索引的数组及快速查询的字符串索引号
        self.str_arr = []
        self.str_map = {}

@enum.unique
class TP_DATA_TYPE(IntEnum):
    TYPE_NIL = 0,
    TYPE_BOOL = 1,
    TYPE_U8 = 2,
    TYPE_I8 = 3,
    TYPE_U16 = 4,
    TYPE_I16 = 5,
    TYPE_U32 = 6,
    TYPE_I32 = 7,
    TYPE_U64 = 8,
    TYPE_I64 = 9,
    TYPE_VARINT = 10,
    TYPE_FLOAT = 11,
    TYPE_DOUBLE = 12,
    TYPE_STR = 13,
    TYPE_STR_IDX = 14,
    TYPE_RAW = 15,
    TYPE_ARR = 16,
    TYPE_MAP = 17,

@staticmethod
def encode_varint(buffer: ByteBuffer, value):
    '''
    如果原数值是正数则将原数值变成value*2
    如果原数值是负数则将原数值变成-(value + 1) * 2 + 1
    相当于0->0, -1->1, 1->2,-2->3,2->4来做处理
    因为小数值是常用的, 所以保证小数值及负数的小数值尽可能的占少位
    '''
    if type(value) == bool:
        value = 1 if value else 0
    real = value * 2
    if value < 0:
        real = -(value + 1) * 2 + 1

    for _i in range(12):
        # 每个字节的最高位来表示有没有下一位, 若最高位为0, 则已完毕
        b = real & 0x7F
        real >>= 7
        if real > 0:
            buffer.write_u8(b | 0x80)
        else:
            buffer.write_u8(b)
            break

@staticmethod
def encode_str_idx(buffer: ByteBuffer, value):
    '''
    写入字符串索引值, 在数值区里的所有字符串默认会被写成索引值
    如果重复的字符串则会返回相同的索引值(varint)
    '''
    idx = buffer.add_str(value)
    TPPacker.encode_type(buffer, TP_DATA_TYPE.TYPE_STR_IDX)
    TPPacker.encode_varint(buffer, idx)

@staticmethod
def encode_field(buffer: ByteBuffer, value, pattern=None):
    '''
    先写入类型的值(u8), 则根据类型写入类型对应的的数据
    '''
    if not pattern:
        pattern = TPPacker.get_type_by_ref(value)
    if pattern == TP_DATA_TYPE.TYPE_NIL:
        return None
    elif pattern == TP_DATA_TYPE.TYPE_BOOL:
        TPPacker.encode_type(buffer, pattern)
        TPPacker.encode_bool(buffer, value)
    elif pattern >= TP_DATA_TYPE.TYPE_U8 and pattern = TP_DATA_TYPE.TYPE_U16 and pattern

@staticmethod
def encode_proto(buffer: ByteBuffer, name, infos):
    '''
    写入协议名称, 然后写入字符串索引区(即字符串数组), 然后再写入协议的详细数据
    '''
    sub_buffer = ByteBuffer()
    TPPacker.encode_field(sub_buffer, infos)

    TPPacker.encode_str_raw(buffer, name, TP_DATA_TYPE.TYPE_STR)
    TPPacker.encode_varint(buffer, len(sub_buffer.str_arr))
    for val in sub_buffer.str_arr:
        TPPacker.encode_str_raw(buffer, val, TP_DATA_TYPE.TYPE_STR)

    buffer.write_bytes(sub_buffer.all_bytes())

Original: https://www.cnblogs.com/luojiawaf/p/16411608.html
Author: 行稳致远up
Title: tunm二进制协议在python上的实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/499217/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Mybatis完整版详解

一、简介 1.什么是MyBatis MyBatis 是一款优秀的持久层框架它支持自定义 SQL、存储过程以及高级映射。 MyBatis 免除了几乎所有的 JDBC 代码以及设置参…

Python 2023年6月9日
0030
零配置python日志，安装即用

写了很多年的python日志都是使用内置的logging模块来完成的，使用时都需要经过繁琐的配置。有时候，还可能出现丢失日志的情况，直到loguru的出现。【阅读全文】 logu…

Python 2023年11月2日
0049
学习笔记——matplotlib学习

数据可视化何其多，除了Tableau，ECharts，Matplotlib也是神器之一，将枯燥无味的数据形象直观地展示出来，是很有成就感的事情。Matplotlib作为数据科学的的…

Python 2023年9月3日
0040
Python数据分析11——Seaborn绘图

目录 Seaborn介绍 Seaborn安装官方文档 Seaborn绘图风格 sns.axes_style sns.set_style() sns.set sns.despine…

Python 2023年8月30日
0043
CUDA（10.2）＋PyTorch安装加配置详细完整教程

以下均为博主亲测的可靠流程，其中有一些我遇到的问题及解决方法，希望能帮到大家，不再踩坑，也欢迎大家交流遇到的问题和配置方法。 CUDA（10.2）＋PyTorch安装加配置详细完…

Python 2023年10月27日
0042
pandas 数据处理（python数据分析活用pandas库）

1.数据组合 1.1连接 1.1.1添加行 1.1.2添加列 1.1.3不同索引下的连接操作 1.2合并多个数据集 1.2.1一对一合并 1.2.2多对一合并 1.2.3多对多合并…

Python 2023年8月7日
0048
flask-sqlalchemy操作mysql

文章目录 1、简介 2、mysql连接设置 3、模型类字段类型 4、ORM使用方式 * 4.1、先创建模型类，再迁移到数据库 4.2、用原生SQL创建数据库表，再编写模型类作映射 …

Python 2023年8月13日
0049
pygame实现简单的金币旋转效果，不到50行代码哦！

pygame实现简单的金币旋转效果，不到50行代码哦！大家有兴趣了解一下吗？文章目录一、先上个简单的效果吧二、实现逻辑三、核心逻辑代码解析 * （一）加载图像到list列表…

Python 2023年9月25日
0019
matplotlib绘制尖峰栅格图eventplot()

当前有效 matplotlib版本为： 3.4.1。概述 eventplot()函数的作用是在给定位置绘制长度相同的平行线。这种图形通常在神经科学中用于表示神经事件，通常称为尖峰…

Python 2023年9月5日
0037
Python 正则表达式详解（建议收藏！）

目录 match 匹配字符串单字符匹配 . 匹配任意一个字符 \d 匹配数字 \D 匹配非数字 \s 匹配特殊字符，如空白，空格，tab等 \S 匹配非空白 \w 匹配单词、字符…

Python 2023年7月31日
0061
医学影像人工智能实战（一）：医学图像格式（nii和dicom）

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

Python 2023年6月3日
00132
python apply和map方法的区别_python中的apply(),applymap(),map() 的用法和区别

平时在处理df series格式的时候并没有注意 map和apply的差异总感觉没啥却别。不过还是有区别的。下面总结一下： import pandas as pd df1= pd…

Python 2023年8月22日
0055
5个必知必会的 Python 数据合并技巧

大家好，前不久在我们技术交流群有群友提到最近他面试阿里70万总包的数据岗位，对方问 Pandas的 5种数据合并的函数，结果他只答出了 2个。那么，究竟是哪五个呢？今天，我们…

Python 2023年8月18日
0053
YOLOFaceV2笔记

论文地址：2022-CVPR-YOLO-FaceV2: A Scale and Occlusion Aware Face Detector论文代码：https://github.c…

Python 2023年10月9日
0045
如何用python远程探查每天的网页访问记录

Original: https://www.cnblogs.com/123456feng/p/16206960.htmlAuthor: 蚂蚁ailingTitle: 如何用pyth…

Python 2023年5月24日
0087
pandas索引函数loc和iloc的区别

使用pandas进行数据分析的时候，我们经常需要对DataFrame的行或者列进行索引。使用pandas进行索引的方法主要有三种：直接使用行或者列标签、loc函数和iloc函数。 …

Python 2023年8月6日
0045

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

tunm二进制协议在python上的实现

支持的数据类型

为什么我们需要二进制协议

协议的二进制格式

协议的实现(小端对齐)

大家都在看