文件
文件是保存在持久化存储设备上的一段数据
文件分类
文本文件:打开后会自动解码为字符
二进制文件:内部编码为二进制码,无法通过文字编码解析
byte1 = b'hello' #英文字符字节串
byte2 = "你好".encode
str2 = byte2.decode
读:从文件中获取内容
写:修改文件中的内容
参数:file_name 文件名
access_mode 打开文件的方式,如果不写默认为’r’
buffering 1表示有行缓冲,默认则表示使用系统默认提供的缓冲机制
encoding=‘UTF-8’ 设置打开文件的编码方式,一般Linux下不需要
返回值:成功返回文件操作对象
#打开文件
file_object = open(file_name, access_mode='r', buffering=-1, encoding=None)
功能:打开一个文件,返回一个文件对象。
打开模式 | 效果 |
---|---|
r | 以读方式打开,文件必须存在 |
w | 以写方式打开,文件不存在则创建,存在清空原有内容 |
a | 以追加模式打开,文件不存在则创建,存在则继续写操作 |
r+ | 以读写模式打开 文件必须存在 |
w+ | 以读写模式打开 不存在则创建,存在清空原有内容 |
a+ | 追加并可读模式,文件不存在则创建,存在则继续写操作 |
rb | 以二进制读模式打开 同r |
wb | 以二进制写模式打开 同w |
ab | 以二进制追加模式打开 同a |
rb+ | 以二进制读写模式打开 同r+ |
wb+ | 以二进制读写模式打开 同w+ |
ab+ | 以二进制读写模式打开 同a+ |
file.close()
1.open后每次读取都是从上次结束的位置继续读
2.读取到文件结尾后,如果继续读返回值是空字串
read([size])
功能:来直接读取文件中字符
参数:如果没有给定size参数(默认值为-1)或者size值为负,文件
将被读取直至末尾,给定size最多读取给定数目个字符(字节)
返回值:返回读取到的内容
while True:
data = f.read(1)
#if data == "":
if not data:
break#当读取到结尾,data为空字串的时候结束循环
print(data,end="")
一次读取结束时机:遇到换行会结束,遇到指定字符(字节)个数会结束
readline([size])
功能: 用来读取文件中一行
参数: 如果没有给定size参数(默认值为-1)或者size值为负
表示读取一行,给定size表示最多读取制定的字符(字节)
返回值: 返回读取到的内容
如果读到"\n"自动返回下一行
readlines([size])
功能: 读取文件中的每一行作为列表中的一项
参数: 如果没有给定size参数(默认值为-1)或者size值为负
文件将被读取直至末尾
给定size表示读取到size字符所在行为止。
返回值:返回读取到的内容列表
文件对象本身也是一个可迭代对象,在for循环中可以迭代文件的每一行。
def query_word1(word):
fr = open("dict.txt")# 读打开
#逐行读取
n = len(word)
for line in fr:
if line[:n] == word and line[n] == " ":
return line
def query_word2(word):
fr = open("dict.txt")# 读打开
#逐行读取
for line in fr:
tmp = line.split(' ')#按照空格分割
if tmp[0] > word:
break
elif tmp[0] == word:
return line
write(data)
功能: 把文本数据或二进制数据块的字符(节)串写入到文件中去
参数: 要写入的内容
返回值: 写入的字符(节)个数
如果需要换行要在写入内容中添加\n
writelines(str_list)
功能: 接受一个字符串列表作为参数,将它们写入文件。
参数: 要写入的内容列表
def copy(filename,dir):
fr = open(filename,'rb')
fname = filename.split('\\')[-1]
fw = open(dir+'/'+fname,'wb')
while True:
data = fr.read(1024)
if not data:
break
fw.write(data)
fr.close()
fw.close()
#copy("C:\\Users\\xxx\\Desktop\\xx.png",".")
copy(r"C:\Users\xxx\Desktop\xx.png",".")
"""
def copy(filename,dir):
fr = open(filename,'rb')
fname = filename.split('/')[-1]
fw = open(dir+'/'+fname,'wb')
while True:
data = fr.read(1024)
if not data:
break
fw.write(data)
fr.close()
fw.close()
copy("C:/Users/xxx/Desktop/xx.png",".")
"""
python中的with语句也可以用于访问文件,在语句块结束后会自动释放资源。
with语句格式
with context_expression [as obj]:
with-body
with访问文件
with open('file','r+') as f:
f.read()
注意: with语句块结束后会自动释放f所以不再需要close()
定义
系统自动的在内存中为每一个正在使用的文件开辟一个空间,在对文件读写时都是先将文件内容加载到缓冲区,再进行读写
作用:减少和硬盘的交互次数,提高读写效率
刷新缓冲区条件
1缓冲区被写满
2程序执行结束或者文件对象被关闭
3程序中调用flush()函数
缓冲区设置
类型 | 设置方法 | 注意事项 |
---|---|---|
系统自定义 | buffering=-1 | |
行缓冲 | buffering=1 | 当遇到\n时会刷新缓冲 |
指定缓冲区大小 | buffering>1 | 必须以二进制方式打开 |
fw = open("file.txt","wb",buffering=10)
while True:
msg = input(">>")
if not msg:
break
fw.write(msg.encode())
fw.close()
定义
打开一个文件进行操作时系统会自动生成一个记录,
记录每次读写操作时所处的文件位置,每次文件的读写操作都是从这个位置开始进行的。
1r或者w方式打开,文件偏移量在文件开始位置
2a方式打开,文件偏移量在文件结尾位置
tell()
seek(offset[,whence])
功能: 移动文件偏移量位置
参数: offset 代表相对于某个位置移动的字节数。负数表示向前移动,正数表示向后移动。
whence是基准位置的默认值为0,代表从文件开头算起,1代表从当前位置算起,2代表文件末尾算起
注意:必须以二进制方式打开文件时,基准位置才能是1或者2
import time
log = open("my.log","a+",buffering=1)
#文件偏移量放开头
log.seek(0,0)
#n = 1
#for line in log:
# n += 1
n = len(log.readlines()) + 1
while True:
msg = "%d. %s\n"%(n,time.ctime())
log.write(msg)
time.sleep(2)
n += 1
os模块是Python标准库函数,包含了大量的文件处理函数
os.path.getsize(file)
功能: 获取文件大小
参数: 指定文件
返回值: 文件大小
os.listdir(dir)
功能: 查看文件列表
参数: 指定目录
返回值: 目录中的文件名列表
os.path.exists(file)
功能: 判断文件是否存在
参数: 指定文件
返回值: 布尔值
os.remove(file)
功能: 删除文件
参数: 指定文件