在pyton中,通过struct模块来对二进制进行转换,主要包括两大类函数,即用于打包的pack和用于解包的unpack。
其中,struct.pack的输入格式为struct.pack(format, v1, v2, ...),其中format为格式字符串,v1,v2..为将要转成bytes的字符。
例如
>>> import struct >>> struct.pack('i', 15) b'\x0f\x00\x00\x00' >>> struct.pack('iii', 15, 16, 17) b'\x0f\x00\x00\x00\x10\x00\x00\x00\x11\x00\x00\x00' >>> struct.pack('b', 255) #b格式的取值范围是-128到127 struct.error: byte format requires -128 <= number <= 127 >>> struct.pack('B', 200) b'\xc8' >>> struct.pack('B', 71) #128以内可用ASCII表示 b'G'
i代表int,15对应的二进制代码为F000,故其输出为b\x0f\x00\x00\x00。当格式字符串为iii时,说明要将三个数字以整数类型转化为二进制。
其中,格式化字符串中的每个字符都代表一种数据类型,其中整型相关的字符如下,左侧为带符号整型,右侧为无符号整型
C语言类型 | C语言类型 | 标准大小 | ||
---|---|---|---|---|
b | signed char | B | unsigned char | 1 |
h | short | H | unsigned short | 2 |
i | int | I | unsigned int | 4 |
l | long | L | unsigned long | 4 |
q | long long | Q | unsigned long long | 8 |
n | ssize_t | N | size_t |
其他类型
格式 | C 类型 | Python 类型 | 标准大小 |
---|---|---|---|
x | 填充字节 | 无 | |
c | char | 长度为1的字节串 | |
? | _Bool | bool | 1 |
e | float | 2 | |
f | float | float | 4 |
d | double | float | 8 |
s | char[] | 字节串 | |
p | char[] | 字节串 | |
P | void* | 整数 |
struct中提供了获取标准大小的函数,calcsize:
>>> struct.calcsize('B') 1 >>> struct.calcsize('i') 4
除了声明被格式化时的数据类型,struct还可以指定对齐方式,例如
>>> struct.pack("i",15) b'\x0f\x00\x00\x00' >>> struct.pack(">i",15) #小端序 b'\x00\x00\x00\x0f' >>> struct.pack("
其对应字符的含义分别为
@ | = | < | > | ! |
---|---|---|---|---|
本机 | 本机 | 小端 | 大端 | 网络(大端) |
其中默认为@,即本机字节顺序。
在熟悉了pack之后,与之对偶的unpack也就没啥难度了
>>> test = struct.pack("III",125,1255,12555) >>> struct.unpack("III",test) (125, 1255, 12555)
除了pack和unpack,struct模块还提供了C语言风格的一对函数pack_into和unpack_from,二者的声明分别为
struct.pack_into(format, buffer, offset, v1, v2, ...) struct.unpack_from(format, /, buffer, offset=0)
其中buffer表示缓冲流,在pack_into中,将v1,v2...以offset的偏置打包入buffer中;在unpack_from中,将buffer中的数据从offset处依次取出。
struct中封装了用于二进制处理的类Struct,按照以往经验,其pack函数的实现方法很有可能是下面这种
def pack(format,*args): return Struct(format).pack(args)
其中Struct的初始化方法就是输入一个格式化字符串,例如
>>> s = struct.Struct("III") >>> s.pack(1,2,3) b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'
到此这篇关于python二进制转化模块的具体用法的文章就介绍到这了,更多相关python 二进制转化模块内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!