t:
1,读写的都是以字符串unicode编码为单位的
2,只能针对文本文件
3,必需指定字符编码,即必需指定encoding参数
b:binary模式
1,读写都是以bytes为单位的
2,可以针对所有文件
3,不能指定字符编码,一定不能指定encoding参数
总结:
1,在操作纯文本文件方面t模式帮我们省去了编码和解码的环节,b模式则需要手动的编码和解码,所以此时t模式更为方便
2,针对非文本文件(图片,视频,音频)只能使用b模式
with open(“test.jpg”,“rt”,encoding=“utf-8”) as f:
# f.read()UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xff in position 0: invalid start byte
# 硬盘的二进制读入内存,t模式会将读入内存的二进制进行decode解码操作
with open(“test.jpg”,“rb”) as f:
res=f.read()#硬盘的二进制读入内存,b模式下不做任何转换,直接读入内存
print(res)
print(type(res))
with open(“d.txt”,“rb”) as f:
res=f.read()#硬盘中的utf-8编码的二进制直接读入内存
print(res)
res=res.decode(“utf-8”)
print(res)
with open(“d.txt”,“rt”,encoding=“utf-8”) as f:
res=f.read()#utf-8的二进制转为Unicode再读入内存
print(res)
用wb模式写文本,需要先进行编码成bytes类型
with open(“e.txt”,“wb”) as f:
# f.write(“你好hello”)#TypeError: a bytes-like object is required, not ‘str’
f.write(“你好hello”.encode(“utf-8”))
# f.write(“hello你好”.encode(“gbk”))一个文本中有多种类型的编码存储,在读的时候会报错,读写编码不匹配问题
src_file=input(“源文件的地址:”).strip()
dst_file=input(“复制文件地址:”).strip()
with open(r"{}“.format(src_file),“rb”) as f1,
open(r”{}".format(dst_file),“wb”) as f2:
for line in f1:
f2.write(line)
res=f1.read() # 内存占用过大
f2.write(res)
方式一:以行为单位读取,当一行内容过大的时候,会导致一次性读入内存的数量过大
with open(“test.jpg”,“rb”)as f1:
for line in f1:
print(line)
方拾二:自己控制每次读取的数据量
with open(“test.jpg”,“rb”) as f2:
while True:
res=f2.read(100)
print(res
)
if len(res)==0:
break