如何处理二进制文件

实际案例

WAV是一种音频文件的格式,音频文件为二进制文件。WAV文件由头部信息和音频采样数据构成。前44个字节为头部信息,包括声道数、采样频率和PCM位宽等,后面是音频采样数据。

如何处理二进制文件_第1张图片

(注:图片来源于互联网,如若侵权请联系本人立删,谢谢!)

请使用Python分析一个WAV文件头部信息,处理音频数据。

解决方案:

  • open函数以二进制模式打开文件,指定mode参数为'b'
  • 二进制数据可以用readinto读入到提取分配好的buffer中,便于数据处理
  • 解析二进制数据可以使用标准库中的struct模块的unpack方法

注:关于unpack()的参数问题,Python官方文档中并没用明确说明。因此,可查看嘎啦的博文。

具体代码如下:

# -*- coding: utf-8 -*-

import struct
import array

f = open('test.wav', 'rb')
# 读取文件前44个字节的数据
info = f.read(44)

# 解析二进制数据--声道数
print struct.unpack('h', info[22:24])

# WAV文件中data部分的大小 / 数据类型的大小 -> buffer的大小
f.seek(0, 2)
n = (f.tell() - 44) / 2

buf = array.array('h', (0 for _ in xrange(n)))

# 将数据读至buf中
f.seek(44)
f.readinto(buf)

for i in xrange(n):
    # 数据处理,相当于将音频文件的声音变小
    buf[i] /= 8

f.close()

# 创建demo.wav
f = open('demo.wav', 'wb')
# 将test.wav中前44个字节的数据写入文件
f.write(info)
# 将buf中的数据写入文件
buf.tofile(f)

f.close()

你可能感兴趣的:(如何处理二进制文件)