文件处理之二进制模式

参考这个:
https://www.cnblogs.com/surewing/p/9130453.html
打开文件的方式有上述几种:(参考这个)
https://www.cnblogs.com/wzjbg/p/6383518.html

1.怎么样用Python读一个文件;(自己在桌面建了一个文件叫test123)

f=open(file=‘D:/Users/tufengchao/Desktop/test123’,mode=‘r’,encoding=‘utf-8’)
data = f.read()
f.close()
file是路径
mode 是打开的模式,r-读,w-写,rb-二进制
encoding 编码格式
read() 是读一个文件
close()是读了一个文件然后关闭

1.这里解释一下这个问题,首先我们的文件在硬盘里面是以二进制存储格式,最终读到内存是不是要转换我们能看懂的东西,从二进制转化为我们能看懂的内容,是有个对应的关系的,是按照字符编码来的,这个文件是按照gbk存储的,结果读的时候是按照utf-8来读的,所以在对应的编码表里面找不到对应的关系;
我们平时使用的Word,也是这样的,只是微软帮你转换好了,小白用户是看不到这里面的转换的,直接使用就OK了
2.在Python里面,你一定要记住你自己的文档是什么格式的,读的时候用什么格式的读,你要告诉Python你之前的是什么格式,要以什么格式打开,如果不指定,Python3默认的编码格式就是utf-8,(只要出现上述的报错,就是编码格式错误);
3.如果不知道自己的文件原来的编码格式可以使用pycharm打开,pycharm右下角会自动给你检测的;

python3里面所有的字符都是utf-8的形式,如果在打开一个文件的时候我不知道这个编码怎么办?
那我们就不指定encoding的编码,那么Python3默认就是utf8但是这样也不行,同时我们要改变读的模式,才可以,r就是文本模式,可以直接读取字符串的,如果用户不知道文件的格式的话可以不指定编码格式,同时直接使用rb的模式,就是硬盘怎么存储的你就怎么存到内存,直接以二进制的形式,就可以了;

f=open(file=‘D:/Users/tufengchao/Desktop/test123’,mode=‘r’,encoding=‘utf-8’)
data=f.read()
print(data)
如上述我指定了编码格式会报错binary mode doesn’t take an encoding argument
f=open(file=‘D:/Users/tufengchao/Desktop/test123’,mode=‘r’,)
data=f.read()
print(data)
以上则不会报错
基本二进制就是不给人家看的,例如视频的格式,等等就是二进制的;
基本来说 rb的模式就是不给人看的,就是网络传输用的,硬盘里面存的是什么读出来的就是什么;

你可能感兴趣的:(python文件处理,文件模式)