python 内置的 open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程中,都需要使用这个对象;
注意:使用 open() 方法操作文件之后,一定要调用 close() 方法关闭文件;
open() 方法常用形式是接收两个参数,file(文件名)和 mode(打开模式):open(file, mode);
完整的语法格式为:
open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)
参数说明:
file:必须,文件名;
mode:可选,文件打开模式,默认为 r,表示只读;
buffering:设置缓冲;
encoding:设置编码方式,一般使用 utf8;
errors:报错级别;
newline:区分换行符;
closefd:传入的 file 参数类型;
mode 参数的取值有:
模式 | 描述 |
---|---|
t | 文本模式 (默认)。 |
x | 写模式,新建一个文件,如果该文件已存在则会报错。 |
b | 二进制模式。 |
+ | 打开一个文件进行更新(可读可写)。 |
U | 通用换行模式(Python 3 不支持)。 |
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。一般用于非文本文件,如图片、视频等。 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件,如图片、视频等。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,则创建新文件。 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,则创建新文件。一般用于非文本文件,如图片、视频等。 |
w+ | 打开一个文件用于读写。如果该文件已存在,则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,则创建新文件。 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,则创建新文件。一般用于非文本文件,如图片、视频等。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
file.write(str):表示将指定字符串写入文件;
# 打开一个文件,如果文件不存在,则创建;如果存在,则清空文件内容;
fd = open("a.txt", "w")
# 定义一个字符串数据
str = "人生苦短,我用 python"
# 写入文件,返回写入数据的字节数
count = fd.write(str)
print(count)
# 关闭文件对象
fd.close()
打开文件发现写入的中文数据变成了乱码:
解决办法:使用 open() 方法打开文件的时候,指定 encoding 参数,如下:
fd = open("a.txt", "w", encoding="UTF-8")
在文件关闭前,或缓冲区刷新前,字符串的内容存储在缓冲区中,这时在文件中是看不到写入的内容的;
比如上面的代码,如果我在 print(count) 位置打一个断点,调试运行到该位置,此时虽然已经调用了 fd.write() 方法写入数据,但是由于没有调用 close() 方法和 flush() 方法,所以数据还在缓冲区中,所以此时打开文件的时候,发现文件中是空的;
file.flush() 用于刷新缓冲区,表示将缓冲区的数据立刻写入到文件中,同时清空缓冲区;比如在下面的代码中,fd.write(str) 语句后面调用了 flush() 方法刷新缓冲区,此时再调试运行到 print(count) 语句,然后打开文件会发现,数据已经写入到文件中了。一般情况下,文件关闭时,会自动刷新缓冲区。
# 打开一个文件,如果文件不存在,则创建;如果存在,则清空文件内容;
fd = open("a.txt", "w", encoding="UTF-8")
# 定义一个字符串数据
str = "人生苦短,我用 python"
# 写入文件,返回写入数据的字节数
count = fd.write(str)
# 刷新缓冲区
fd.flush()
print(count)
# 关闭文件对象
fd.close()
如果文件打开模式带 b,那写入文件内容时,str (参数)要用 encode 方法转为 bytes 形式,否则报错:TypeError: a bytes-like object is required, not 'str'。
# 以只写方式打开一个文件;打开模式带 b,表示以二进制的方式打开
fd = open("a.txt", "wb")
# 定义一个字符串数据
str = "人生苦短,我用 python"
# 写入文件,写入字符串数据就会报错
count = fd.write(str)
print(count)
# 关闭文件对象
fd.close()
错误如下:
解决办法如下:
# 写入文件,str.encode() 方法用于将字符串转换成 bytes 类型
count = fd.write(str.encode())
file.writelines(seq):向文件中写入一序列的字符串,这一序列字符串可以是由迭代器对象产生的,比如一个字符串列表;
# 打开一个文件,如果文件不存在,则创建;如果存在,则清空文件内容;
fd = open("a.txt", "w", encoding="UTF-8")
# 定义一个字符串列表
list1 = ["how", "are", "you"]
# 将一序列的字符串写入到文件中
fd.writelines(list1)
# 关闭文件对象
fd.close()
file.read([size]):该方法用于从文件中读取指定的字节数;如果未指定 size 参数,则读取所有;
# 打开一个文件,返回文件对象
fd = open("a.txt", "r")
# 读取文件中的所有内容
str = fd.read()
# 读取指定字节大小的数据
#str = fd.read(6)
print(str)
# 关闭文件对象
fd.close()
发现报如下错误:
这是因为文件中含有中文;解决办法是使用 open() 打开文件的时候指定编码格式,如下:
# 打开一个文件,返回文件对象;指定编码格式,解决中文出错的问题
fd = open("a.txt", "r", encoding="UTF-8")
file.readline([size]):该方法表示一次读取一行,包括换行符(\n);如果指定了参数 size,也表示读取指定大小的字节数;
# 打开一个文件,返回文件对象;指定编码格式,解决中文出错的问题
fd = open("a.txt", "r", encoding="UTF-8")
# 读取文件内容
str = fd.readline() # 读取一行,此时文件指针位于第二行的开始
print(str)
str = fd.readline() # 继续读取一行,从当前文件指针的位置开始读取
print(str)
# 关闭文件对象
fd.close()
readlines():该方法用于读取所有行(直到结束符 EOF),并返回列表,该列表可以使用 for .. in .. 结构进行解析;如果碰到结束符 EOF,则返回空字符串;
# 打开一个文件,返回文件对象;指定编码格式,解决中文出错的问题
fd = open("a.txt", "r", encoding="UTF-8")
# 读取文件中的所有行
content = fd.readlines()
# 一次循环输入一行
for line in content:
# 因为读取一行数据的时候,就包括了行尾的换行符,
# 如果 print 输出的时候也换行,那就有两次换行了
print(line, end="")
1、file.fileno():返回一个整形的文件描述符,可用于底层操作系统的 I/O 操作;
2、file.isatty():用于检测文件是否连接到一个终端设备,如果是返回 True,否则返回 False;
# 打开一个文件,返回文件对象
fd = open("a.txt", "r")
print(fd) # fd 是一个对象
# 返回一个整形的文件描述符
fid = fd.fileno()
print("fid = ", fid)
# 检测文件是否连接到一个终端设备
print(fd.isatty()) # False 表示没有连接到终端设备
# 关闭文件对象
fd.close()
输出结果:
3、file.seek(offset[, whence]):用于移动文件指针到指定位置;成功返回新的位置,失败返回 -1;
offset:开始的偏移量,以字节为单位;如果为负数,表示从倒数第几位开始;
whence:可选参数,默认为 0;为 offset 定义一个参数,表示要从哪个位置开始偏移;0 表示从文件开头开始算起,1 表示从当前位置开始算起,2 表示从文件末尾开始算起;
4、file.tell():返回文件的当前位置;
# 以读写方式打开一个文件
fd = open("a.txt", "w+")
fd.write("abcdefg") # 写入数据,文件指针移动到文件末尾
print(fd.tell()) # 返回文件的当前位置
fd.seek(3) # 将文件指针从开始位置移动3个字节,开始位置为 0
print(fd.read()) # 从当前位置开始读取文件
fd.seek(-3, 2) # 将文件指针从末尾向前移动3个字节
print(fd.read(1))
fd.close() # 关闭文件对象
程序运行报错:io.UnsupportedOperation: can't do nonzero end-relative seeks
这是因为没有使用 b 模式打开的文件,只允许从文件头开始计算相对位置,从文件末尾计算就会抛出上面异常;解决是打开文件的时候指定 b 模式,但是以 b 模式打开的文件,写入数据时需要将字符串转换成 bytes 类型:
# 以读写方式打开一个文件;指定 b 模式,表示以二进制的方式进行读写;
fd = open("a.txt", "wb+")
# 写入二进制数据,需要转换成 bytes 类型
fd.write("abcdefg".encode())
print(fd.tell()) # 返回文件的当前位置
fd.seek(3) # 将文件指针从开始位置移动3个字节,开始位置为 0
print(fd.read()) # 从当前位置开始读取文件
fd.seek(-3, 2) # 将文件指针从末尾向前移动3个字节
print(fd.read())
fd.close() # 关闭文件对象
5、file.truncate([size]):从文件开头开始截断,截断 size 个字节;如果没有参数 size,表示从当前位置开始截断,截断之后后面的所有字节都被删除;windows 下的换行代表两个字节大小;
文件内容:
import os
# 以读写的方式打开文件
fd = open("a.txt", "r+", encoding="UTF-8")
# 获取文件大小
print("文件大小:", os.path.getsize("a.txt"))
# 读取一行
line = fd.readline()
print("第一行数据:", line, end="")
# 当前文件指针的位置
print("当前文件指针的位置:", fd.tell())
length = fd.truncate() # 截断,返回截断的字节长度
print("截断长度:", length)
content = fd.read()
print("content:", content)
# 关闭文件
fd.close()
输出结果: