Python标准库笔记(8) — pprint模块

2023年6月3日上午8:11 • Python • 阅读 136

struct模块提供了用于在字节字符串和Python原生数据类型之间转换函数，比如数字和字符串。

Python版本: 2.x & 3.x

该模块作用是完成Python数值和C语言结构体的Python字符串形式间的转换。
这可以用于处理存储在文件中或从网络连接中存储的二进制数据，以及其他数据源。

1. 模块函数和Struct类

它除了提供一个 Struct类之外，还有许多模块级的函数用于处理结构化的值。这里有个格式符(Format specifiers)的概念，是指从字符串格式转换为已编译的表示形式，类似于正则表达式的处理方式。通常实例化 Struct类，调用类方法来完成转换，比直接调用模块函数有效的多。下面的例子都是使用 Struct类。

2. Packing（打包）和Unpacking（解包）

Struct支持将数据packing(打包)成字符串，并能从字符串中逆向unpacking(解压)出数据。

在本例中，格式指定器(specifier)需要一个整型或长整型，一个两个字节的string,和一个浮点数。格式符中的空格用于分隔各个指示器(indicators)，在编译格式时会被忽略。

import struct

import binascii

values = (1, 'ab'.encode('utf-8'), 2.7)
s = struct.Struct('I 2s f')
packed_data = s.pack(*values)

print('原始值:', values)
print('格式符:', s.format)
print('占用字节:', s.size)
print('打包结果:', binascii.hexlify(packed_data))

output
原始值: (1, b'ab', 2.7)
格式符: b'I 2s f'
占用字节: 12
打包结果: b'0100000061620000cdcc2c40'

这个示例将打包的值转换为十六进制字节序列，用 binascii.hexlify()方法打印出来。

使用 unpack()方法解包。

import struct
import binascii

packed_data = binascii.unhexlify(b'0100000061620000cdcc2c40')

s = struct.Struct('I 2s f')
unpacked_data = s.unpack(packed_data)
print('解包结果:', unpacked_data)

output
解包结果: (1, b'ab', 2.700000047683716)

将打包的值传给 unpack()，基本上返回相同的值(浮点数会有差异)。

3. 字节顺序/大小/对齐

默认情况下，pack是使用本地C库的字节顺序来编码的。格式化字符串的第一个字符可以用来表示填充数据的字节顺序、大小和对齐方式，如下表所描述的:

Character Byte order Size Alignment

本地本地本地

本地 standard none

little-endian（小字节序） standard none

big-endian（大字节序） standard none

network (= big-endian) standard none

如果格式符中没有设置这些，那么默认将使用 @。

本地字节顺序是指字节顺序是由当前主机系统决定。比如：Intel x86和AMD64(x86-64)使用小字节序； Motorola 68000和 PowerPC G5使用大字节序。ARM和Intel安腾支持切换字节序。可以使用 sys.byteorder查看当前系统的字节顺序。

本地大小(Size)和对齐(Alignment)是由c编译器的 sizeof表达式确定的。它与本地字节顺序对应。

标准大小由格式符确定，下面会讲各个格式的标准大小。

示例:

import struct
import binascii

values = (1, 'ab'.encode('utf-8'), 2.7)
print('原始值  : ', values)

endianness = [
    ('@', 'native, native'),
    ('=', 'native, standard'),
    ('', 'big-endian'),
    ('!', 'network'),
]

for code, name in endianness:
    s = struct.Struct(code + ' I 2s f')
    packed_data = s.pack(*values)
    print()
    print('格式符  : ', s.format, 'for', name)
    print('占用字节: ', s.size)
    print('打包结果: ', binascii.hexlify(packed_data))
    print('解包结果: ', s.unpack(packed_data))

output
原始值  :  (1, b'ab', 2.7)

格式符  :  b'@ I 2s f' for native, native
占用字节:  12
打包结果:  b'0100000061620000cdcc2c40'
解包结果:  (1, b'ab', 2.700000047683716)

格式符  :  b'= I 2s f' for native, standard
占用字节:  10
打包结果:  b'010000006162cdcc2c40'
解包结果:  (1, b'ab', 2.700000047683716)

格式符  :  b'< I 2s f' for little-endian
占用字节:  10
打包结果:  b'010000006162cdcc2c40'
解包结果:  (1, b'ab', 2.700000047683716)

格式符  :  b'> I 2s f' for big-endian
占用字节:  10
打包结果:  b'000000016162402ccccd'
解包结果:  (1, b'ab', 2.700000047683716)

格式符  :  b'! I 2s f' for network
占用字节:  10
打包结果:  b'000000016162402ccccd'
解包结果:  (1, b'ab', 2.700000047683716)

4. 格式符

格式符对照表如下:

Format C Type Python type Standard size Notes

pad byte no value

bytes of length 1 1

integer 1 (1),(3)

integer 1 (3)

bool 1 (1)

integer 2 (3)

integer 4 (3)

integer 8 (2), (3)

integer (4)

float 4 (5)

float 8 (5)

bytes

integer (6)

5. 缓冲区

将数据打包成二进制通常是用在对性能要求很高的场景。
在这类场景中可以通过避免为每个打包结构分配新缓冲区的开销来优化。
pack_into()和 unpack_from()方法支持直接写入预先分配的缓冲区。

import array
import binascii
import ctypes
import struct

s = struct.Struct('I 2s f')
values = (1, 'ab'.encode('utf-8'), 2.7)
print('原始值:', values)

print()
print('使用ctypes模块string buffer')

b = ctypes.create_string_buffer(s.size)
print('原始buffer  :', binascii.hexlify(b.raw))
s.pack_into(b, 0, *values)
print('打包结果写入 :', binascii.hexlify(b.raw))
print('解包        :', s.unpack_from(b, 0))

print()
print('使用array模块')

a = array.array('b', b'\0' * s.size)
print('原始值   :', binascii.hexlify(a))
s.pack_into(a, 0, *values)
print('打包写入 :', binascii.hexlify(a))
print('解包     :', s.unpack_from(a, 0))

output
原始值: (1, b'ab', 2.7)

使用ctypes模块string buffer
原始buffer  : b'000000000000000000000000'
打包结果写入 : b'0100000061620000cdcc2c40'
解包        : (1, b'ab', 2.700000047683716)

使用array模块
原始值   : b'000000000000000000000000'
打包写入 : b'0100000061620000cdcc2c40'
解包     : (1, b'ab', 2.700000047683716)

Original: https://www.cnblogs.com/jhao/p/8881058.html
Author: j_hao104
Title: Python标准库笔记(8) — pprint模块

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/564004/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

IQA图像质量评价数据集介绍(LIVE、TID2013、CSIQ、LIVEC、KonIQ-10K)

LIVE数据集 LIVE数据集是最大的可用注释图像质量数据集，由奥斯汀的德克萨斯大学图像和视频工程实验室于2006年建立，整个数据集的参考图片来源于互联网和摄影光盘中收集的29张高…

Python 2023年10月26日
0053
Python Pandas 数据分析工具透视表（pivot table）

数据透视表概念数据透视表是Excel中常用的工具，本片文章的重点不是认识数据透视表，所以找了一片文章，供大家参考。>>>Excel学习笔记-数据透视表透视表操…

Python 2023年8月17日
0058
vscode配置django环境

前言之前有配置好vscode的python环境，现在就来配置一下django的环境安装准备打开vscode的插件中心，安装django插件，注意一定是如图所示的同款插件先安…

Python 2023年8月4日
0041
读时加写锁，写时加读锁，Eureka可真的会玩

大家好，我是三友~~ 在对于读写锁的认识当中，我们都认为读时加读锁，写时加写锁来保证读写和写写互斥，从而达到读写安全的目的。但是就在我翻Eureka源码的时候，发现Eureka在使…

Python 2023年10月22日
0039
Python之Flask与Django后端框架详细对比

一、快速介绍 Django Django是一个Python Web框架，适合时间不多的完美主义者。Django提供了一个功能齐全的Model-View-Controller框架。D…

Python 2023年8月14日
0041
Flink SQL管理平台flink-streaming-platform-web安装搭建

文章都在个人博客网站：https://www.ikeguang.com/ 同步，欢迎访问。最近看到有人在用flink sql的页面管理平台，大致看了下，尝试安装使用，比原生的fl…

Python 2023年10月13日
0039
Python处理csv数据的技巧（pandas为主）

目录查看唯一值设定格式创建空的DataFrame pandas切片指定的行和列 pandas替代值读取和存储数据时，设置索引和表头转置设置路径重命名表头合并表格更…

Python 2023年8月7日
0050
Java 监控直播流rtsp协议转rtmp、hls、httpflv协议返回浏览器

Java 监控直播流rtsp协议转rtmp、hls、httpflv协议返回浏览器需求背景：一：了解音视频流协议：二：方案一 rtsp 转rtmp – 1、下载ng…

Python 2023年10月22日
0034
使用C#编写一个.NET分析器（一）

译者注这是在Datadog公司任职的Kevin Gosse大佬使用C#编写.NET分析器的系列文章之一，在国内只有很少很少的人了解和研究.NET分析器，它常被用于APM（应用性能…

Python 2023年10月22日
0042
Python commandline-config简洁命令行配置工具：一个供用户以Python Dict或JSON格式编写（科研中实验）配置的库，同时可以从命令行中读取参数

本文介绍了一个可以直接用pip安装的python工具包commandline-config，适合经常写python代码跑实验的研究生们，工具可以通过Python原生字典dict（支…

Python 2023年10月31日
0041
新手如何入门Python?都需要学什么?

推荐文章很多小伙伴都发现了，用户自主「申请上首页」的按钮取消了，那博主们写的文章还有上首页曝光的机会吗？我们的回答是”当然有！！！”虽然我们取消了上首页申…

Python 2023年5月24日
0078
Python教程：while 循环用法讲解

1.while 循环 Python 中 while 语句的一般形式： while 判断条件(condition)：执行语句(statements)…… 执行流程图如下： …

Python 2023年8月1日
0028
用python 读取matlab 中的结构体 / 从numpy.void中提取数据

用python 读取matlab 中的结构体 / 从numpy.void中提取数据目录用python 读取matlab 中的结构体 / 从numpy.void中提取数据前言 …

Python 2023年8月26日
0044
scrapy分布式爬虫原理（scrapy_redis）

在学习完scrapy基本知识后，大多数爬虫应用了scrapy框架的异步加多线程后，爬取会有显著提升。但还是局限于一台主机运行，爬取的效率始终有限，因此学习分布式爬虫就是将多台…

Python 2023年10月4日
0033
python用几行代码实现数据的按列去重及合并处理

前言： Pandas模块是Python用于数&a…

Python 2023年8月8日
0044
手把手教你完成Android期末大作业（多功能应用型APP）

版本要求模拟器 API 23及以上待办专注计时音乐天气实现步骤 1.添加依赖 dependencies { implementation ‘com.google.and…

Python 2023年11月9日
0027

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30