Python 读写文件的二进制数据

概述

Python 读写文件的二进制数据比 C/C++ 语言复杂得多。主要差别在于需要进行 bytes 类型和其它基础数据类型(比如 int/float)的转换。
转换工具在一般情况下都是使用 struct 库。

读出数据

在 open 函数中使用 rb 作为 mode 打开文件,再用 struct.unpack 函数解析 bytes 数据。
具体可以参考 open 函数和 stuct.unpack 函数的说明。
数据文件中二进制数据如下图所示:

Python 读写文件的二进制数据_第1张图片

import struct

# rb 表示以二进制形式打开文件
with open(r"D:\temp\test.raw", mode="rb") as f:
    # 移至指定字节位置
    f.seek(3)
    # 读入 16 个字节
    a = f.read(16)
    # 打印 a 类型 bytes
    print(type(a))
    # 打印 a 内字节数目
    print(len(a))
    # 打印 a 内数据,以 16 进制数显示
    print(a)
    # 16 个字节解析为 4 个 unsigned short 数据和 2 个 unsigned int 数据,字节排序为小端,返回元组
    val_tuple = struct.unpack("<4H2I", a) # 如果解析 1 个数据,则应当读取与数据存储空间大小一致的字节数目,unpack 仍返回元组
    print(val_tuple)
    # 将元组转为 list
    val_list = list(val_tuple)
    print(val_list)

16
b'\x00\x80\x02\x00\x00\xe0\x01\x00\x00\x00\xb0\x04\x00\xf8\x12\xf1'
(32768, 2, 57344, 1, 78643200, 4044552192)
[32768, 2, 57344, 1, 78643200, 4044552192]

另一种仅可用于整数的单个数据转换方式是使用 int.from_bytes 函数。

# rb 表示以二进制形式打开文件
with open(r"D:\temp\test.raw", "rb") as f:
	# 读入 4 个字节
	a = f.read(4)
	# 小端有符号整数
	b = int.from_bytes(a, byteorder='little', signed=True)
	print(b)
	print(type(b))
16

写入数据

在 open 函数中使用 wb 或者 ab 作为 mode 打开文件,再用 struct.pack 函数将数据转化为 bytes 数据后写入。
具体可以参考 open 函数和 stuct.unpack 函数的说明。

import struct

# rb 表示以二进制形式打开文件
with open(r"D:\temp\test_wr.raw", "wb") as f:
	val_list = [32768, 2, 57344, 1, 78643200, 4044552192]
	a = struct.pack("<4H2I", *val_list)  # 注意根据 pack 函数定义,必须用 * 对 list 解包
	print(a)
	f.write(a)
b'\x00\x80\x02\x00\x00\xe0\x01\x00\x00\x00\xb0\x04\x00\xf8\x12\xf1'

完成写入后的文件内数据如下图所示:

Python 读写文件的二进制数据_第2张图片

另一种写入单个整数的数据转换方式是使用 int.to_bytes 函数:

import struct

# 用 ab 进行追加写入
with open(r"D:\temp\test_wr.raw", "ab") as f:
	val = 16
	# 转化为 2 字节大端元符号整数
	a = val.to_bytes(length=2, byteorder='big', signed=False)
	# 写入文件
	f.write(a)

完成写入后的文件内数据如下图所示:

Python 读写文件的二进制数据_第3张图片

你可能感兴趣的:(python)