(总结)python 3程序开发指南 (七)文件处理

1。以二进制文件、文本文件、xml文件对数据做持久化,二进制文件的格式存储与加载都是最快的,也非常紧凑。。xml文件分析速度可能会很慢,而文本文件是一个折中。

2.若要进行压缩,我们可以直接使用gzip模块的gzip.open()函数打开文件

3.要处理原始字节可以使用的模块有:bytes和bytearray,尽管bytes或bytearray数据类型的分片返回的是同样的数据类型的对象,但使用项存取操作符[]存取单独的字节时返回的却是整数.只对字符串有意义的方法,比如bytes.upper()。x = b“dfa”.

4.str.encode()返回的是一个bytes对象

5.struct 模块可以实现python对象和二进制形式之间的转换.使用struct.pack()和struct.unpack()函数struct.calcsize()函数以一个格式规范为参数,并返回使用该格式规范的struct 所占据的字节数。

 6.python提供了3种写入XML的方法:手动写入XMl,创建元素树并使用其write()方法,创建DOM并使用其write()方法.XML文件的读入与分析则有4种方法:人工读入并分析XMl,使用元素树,DOM,SAX分析器。

7使用元素树时,要求所有属性必须是文本。我们不必担心对"&","<",">"的处理。对元素树的写入,编码格式严格要求使用"UTF-8"

你可能感兴趣的:((总结)python 3程序开发指南 (七)文件处理)