Python学习笔记(十四):文件的读写


打开文件:

python 内置的 open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程中,都需要使用这个对象;

注意:使用 open() 方法操作文件之后,一定要调用 close() 方法关闭文件;

open() 方法常用形式是接收两个参数,file(文件名)和 mode(打开模式):open(file, mode);

完整的语法格式为:

open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)

参数说明:

file:必须,文件名;

mode:可选,文件打开模式,默认为 r,表示只读;

buffering:设置缓冲;

encoding:设置编码方式,一般使用 utf8;

errors:报错级别;

newline:区分换行符;

closefd:传入的 file 参数类型;

mode 参数的取值有:

模式 描述
t 文本模式 (默认)。
x 写模式,新建一个文件,如果该文件已存在则会报错。
b 二进制模式。
+ 打开一个文件进行更新(可读可写)。
U 通用换行模式(Python 3 不支持)。
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。一般用于非文本文件,如图片、视频等。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件,如图片、视频等。
w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,则创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,则创建新文件。一般用于非文本文件,如图片、视频等。
w+ 打开一个文件用于读写。如果该文件已存在,则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,则创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,则创建新文件。一般用于非文本文件,如图片、视频等。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

 

写入文件:

file.write(str):表示将指定字符串写入文件;

# 打开一个文件,如果文件不存在,则创建;如果存在,则清空文件内容;
fd = open("a.txt", "w")

# 定义一个字符串数据
str = "人生苦短,我用 python"

# 写入文件,返回写入数据的字节数
count = fd.write(str)
print(count)

# 关闭文件对象
fd.close()

打开文件发现写入的中文数据变成了乱码:

Python学习笔记(十四):文件的读写_第1张图片

解决办法:使用 open() 方法打开文件的时候,指定 encoding 参数,如下:

fd = open("a.txt", "w", encoding="UTF-8")

在文件关闭前,或缓冲区刷新前,字符串的内容存储在缓冲区中,这时在文件中是看不到写入的内容的;

比如上面的代码,如果我在 print(count) 位置打一个断点,调试运行到该位置,此时虽然已经调用了 fd.write() 方法写入数据,但是由于没有调用 close() 方法和 flush() 方法,所以数据还在缓冲区中,所以此时打开文件的时候,发现文件中是空的;

Python学习笔记(十四):文件的读写_第2张图片

file.flush() 用于刷新缓冲区,表示将缓冲区的数据立刻写入到文件中,同时清空缓冲区;比如在下面的代码中,fd.write(str) 语句后面调用了 flush() 方法刷新缓冲区,此时再调试运行到 print(count) 语句,然后打开文件会发现,数据已经写入到文件中了。一般情况下,文件关闭时,会自动刷新缓冲区。

# 打开一个文件,如果文件不存在,则创建;如果存在,则清空文件内容;
fd = open("a.txt", "w", encoding="UTF-8")

# 定义一个字符串数据
str = "人生苦短,我用 python"

# 写入文件,返回写入数据的字节数
count = fd.write(str)

# 刷新缓冲区
fd.flush()

print(count)

# 关闭文件对象
fd.close()

如果文件打开模式带 b,那写入文件内容时,str (参数)要用 encode 方法转为 bytes 形式,否则报错:TypeError: a bytes-like object is required, not 'str'。

# 以只写方式打开一个文件;打开模式带 b,表示以二进制的方式打开
fd = open("a.txt", "wb")

# 定义一个字符串数据
str = "人生苦短,我用 python"

# 写入文件,写入字符串数据就会报错
count = fd.write(str)
print(count)

# 关闭文件对象
fd.close()

错误如下:

Python学习笔记(十四):文件的读写_第3张图片

解决办法如下:

# 写入文件,str.encode() 方法用于将字符串转换成 bytes 类型
count = fd.write(str.encode())

file.writelines(seq):向文件中写入一序列的字符串,这一序列字符串可以是由迭代器对象产生的,比如一个字符串列表;

# 打开一个文件,如果文件不存在,则创建;如果存在,则清空文件内容;
fd = open("a.txt", "w", encoding="UTF-8")

# 定义一个字符串列表
list1 = ["how", "are", "you"]

# 将一序列的字符串写入到文件中
fd.writelines(list1)

# 关闭文件对象
fd.close()

 

读取文件:

file.read([size]):该方法用于从文件中读取指定的字节数;如果未指定 size 参数,则读取所有;

# 打开一个文件,返回文件对象
fd = open("a.txt", "r")

# 读取文件中的所有内容
str = fd.read()
# 读取指定字节大小的数据
#str = fd.read(6)
print(str)

# 关闭文件对象
fd.close()

发现报如下错误:

Python学习笔记(十四):文件的读写_第4张图片

这是因为文件中含有中文;解决办法是使用 open() 打开文件的时候指定编码格式,如下:

# 打开一个文件,返回文件对象;指定编码格式,解决中文出错的问题
fd = open("a.txt", "r", encoding="UTF-8")

file.readline([size]):该方法表示一次读取一行,包括换行符(\n);如果指定了参数 size,也表示读取指定大小的字节数;

# 打开一个文件,返回文件对象;指定编码格式,解决中文出错的问题
fd = open("a.txt", "r", encoding="UTF-8")

# 读取文件内容
str = fd.readline() # 读取一行,此时文件指针位于第二行的开始
print(str)

str = fd.readline() # 继续读取一行,从当前文件指针的位置开始读取
print(str)

# 关闭文件对象
fd.close()

readlines():该方法用于读取所有行(直到结束符 EOF),并返回列表,该列表可以使用 for .. in .. 结构进行解析;如果碰到结束符 EOF,则返回空字符串;

# 打开一个文件,返回文件对象;指定编码格式,解决中文出错的问题
fd = open("a.txt", "r", encoding="UTF-8")

# 读取文件中的所有行
content = fd.readlines()

# 一次循环输入一行
for line in content:
    # 因为读取一行数据的时候,就包括了行尾的换行符,
    # 如果 print 输出的时候也换行,那就有两次换行了
    print(line, end="")

 

file 对象的一些其他方法:

1、file.fileno():返回一个整形的文件描述符,可用于底层操作系统的 I/O 操作;

2、file.isatty():用于检测文件是否连接到一个终端设备,如果是返回 True,否则返回 False;

# 打开一个文件,返回文件对象
fd = open("a.txt", "r")
print(fd)   # fd 是一个对象

# 返回一个整形的文件描述符
fid = fd.fileno()
print("fid = ", fid)

# 检测文件是否连接到一个终端设备
print(fd.isatty())  # False 表示没有连接到终端设备

# 关闭文件对象
fd.close()

输出结果:

Python学习笔记(十四):文件的读写_第5张图片

3、file.seek(offset[, whence]):用于移动文件指针到指定位置;成功返回新的位置,失败返回 -1;

  • offset:开始的偏移量,以字节为单位;如果为负数,表示从倒数第几位开始;

  • whence:可选参数,默认为 0;为 offset 定义一个参数,表示要从哪个位置开始偏移;0 表示从文件开头开始算起,1 表示从当前位置开始算起,2 表示从文件末尾开始算起;

4、file.tell():返回文件的当前位置;

# 以读写方式打开一个文件
fd = open("a.txt", "w+")

fd.write("abcdefg")     # 写入数据,文件指针移动到文件末尾

print(fd.tell())        # 返回文件的当前位置

fd.seek(3)              # 将文件指针从开始位置移动3个字节,开始位置为 0
print(fd.read())        # 从当前位置开始读取文件

fd.seek(-3, 2)          # 将文件指针从末尾向前移动3个字节
print(fd.read(1))

fd.close()              # 关闭文件对象

程序运行报错:io.UnsupportedOperation: can't do nonzero end-relative seeks

Python学习笔记(十四):文件的读写_第6张图片

这是因为没有使用 b 模式打开的文件,只允许从文件头开始计算相对位置,从文件末尾计算就会抛出上面异常;解决是打开文件的时候指定 b 模式,但是以 b 模式打开的文件,写入数据时需要将字符串转换成 bytes 类型:

# 以读写方式打开一个文件;指定 b 模式,表示以二进制的方式进行读写;
fd = open("a.txt", "wb+")

# 写入二进制数据,需要转换成 bytes 类型
fd.write("abcdefg".encode())

print(fd.tell())        # 返回文件的当前位置

fd.seek(3)              # 将文件指针从开始位置移动3个字节,开始位置为 0
print(fd.read())        # 从当前位置开始读取文件

fd.seek(-3, 2)          # 将文件指针从末尾向前移动3个字节
print(fd.read())

fd.close()              # 关闭文件对象

5、file.truncate([size]):从文件开头开始截断,截断 size 个字节;如果没有参数 size,表示从当前位置开始截断,截断之后后面的所有字节都被删除;windows 下的换行代表两个字节大小;

文件内容:

Python学习笔记(十四):文件的读写_第7张图片

import os

# 以读写的方式打开文件
fd = open("a.txt", "r+", encoding="UTF-8")

# 获取文件大小
print("文件大小:", os.path.getsize("a.txt"))

# 读取一行
line = fd.readline()
print("第一行数据:", line, end="")

# 当前文件指针的位置
print("当前文件指针的位置:", fd.tell())

length = fd.truncate()  # 截断,返回截断的字节长度
print("截断长度:", length)

content = fd.read()
print("content:", content)

# 关闭文件
fd.close()

输出结果:

Python学习笔记(十四):文件的读写_第8张图片

你可能感兴趣的:(python学习笔记)