本文介绍了Python I/O操作,包括文件读取,文件写入等操作。也是Python系列教程的最后一篇(共8篇)。
【Python 基础】一文补齐Python基础知识
【趣学Python:B站四大恶人】一文掌握列表、元组、字典、集合
【Python进阶】一文掌握Python函数用法
【Python进阶】Python面向对象之类与对象详解
【Python进阶】Python面向对象之装饰器与封装
【Python进阶】Python面向对象之继承和多态详解
【Python进阶】Python异常处理和模块
【Python进阶】Python文件(I/O)操作详解
Python内置函数官方文档
使用 open()
函数来打开一个文件
open(file, mode='r', buffering=-1, encoding_=None,
errors=None, newline=None, closefd=True, opener=None)
主要参数说明:
file
:要打开的文件的名字(路径);mode
:是一个可选参数,用于指定打开文件的模式。默认状态为 'r'
,表示只读。返回值
:返回一个对象,这个对象就代表了当前打开的文件;注意:
file_name = 'demo.txt'
file_obj = open(file_name)
/
来代替 \
,或者可以使用 \\
来代替 \
。因为 \
在Python中是转义字符;file_name = 'hello\\demo.txt'
file_name = r'hello\demo.txt'
file_obj = open(file_name)
..
来返回一级目录;file_name = '../hello/demo.txt'
file_obj = open(file_name)
file_name = r'C:\demo.txt'
file_obj = open(file_name)
print(file_obj)
# 打开文件
file_name = 'demo.txt'
file_obj = open(file_name)
read()
方法,用来读取文件中的内容,它会将内容全部保存为一个字符串返回。content = file_obj.read()
close()
方法关闭文件;file_obj.close()
为避免文件打开,忘记关闭占用系统内存的情况,可以使用 with...as...
结构;
在with语句中可以直接使用file_obj来做文件操作
文件只能在 with
中使用,一旦with结束则文件会自动 close()
file_name = 'demo.txt'
try:
with open(file_name) as file_obj :
# 此时这个文件只能在with中使用,一旦with结束则文件会自动close()
print(file_obj.read())
except FileNotFoundError:
print(f'{file_name} 文件不存在~~')
调用 open()
来打开一个文件,可以将文件分成两种类型:
open()
打开文件时,默认是以文本文件的形式打开的,但是 open()
默认的编码为 None
,所以处理文本文件时,必须要指定文件的编码。指定编码之后就可以读取中文文本文件了。
with open(file_name, encoding='utf-8') as file_obj:
如果直接调用 read()
它会将文本文件的所有内容全部都读取出来。如果要读取的文件较大的话,会一次性将文件的内容加载到内存中,容易导致内存泄漏,所以对于较大的文件,不要直接调用 read()
。
那么如何解决?查看一下帮助:
file_name = r'C:\demo.txt'
try:
with open(file_name, encoding='utf-8') as file_obj:
help(file_obj.read)
except FileNotFoundError:
print(f'{file_name}文件不存在!')
输出:
Help on built-in function read:
read(size=-1, /) method of _io.TextIOWrapper instance
Read at most n characters from stream.
Read from underlying buffer until we have n characters or we hit EOF.
If n is negative or omitted, read until EOF.
有输出信息可知:read()
可以接收一个 size
作为参数,该参数用来指定要读取的字符的数量,默认值为 -1
,它会读取文件中的所有字符。我们可以为 size
指定一个值,这样 read()
会读取指定数量的字符,每一次读取都从上次读取到位置开始读取,如果字符的数量小于 size
,则会读取剩余所有的;如果已经读取到了文件的最后了,则会返回“空串”。
注意:文本中的换行字符也会被计数!
file_name = r'D:\AliyunEDU\Part6-Python\03 函数 面向对象 异常处理\demo2.txt'
try:
with open(file_name, encoding='utf-8') as file_obj:
#help(file_obj.read)
content = file_obj.read(-1)
print(f'文本内容为:\n\n{content}\n') # f-字符串格式化
print(f'文本长度为:{len(content)}')
except FileNotFoundError:
print(f'{file_name}文件不存在!')
输出:
文本内容为:
锄禾日当午
汗滴禾下土
谁知盘中餐
粒粒皆辛苦
文本长度为:23
# 前三句各一个换行(回车)
大文件读取:
# 读取大文件的方式
file_name = 'demo.txt'
try:
with open(file_name, encoding='utf-8') as file_obj:
# 定义一个变量,来保存文件的内容
file_content = ''
# 定义一个变量,来指定每次读取的大小
chunk = 100
# 创建一个循环来读取文件内容
while True:
# 读取chunk大小的内容
content = file_obj.read(chunk)
# 设置循环终止条件
# 检查是否读取到了内容
if not content: # content读取完毕会返回空字符串,空字符串为False,取反为True
# 内容读取完毕,退出循环
break
# 查看读取内容
file_content += content
except FileNotFoundError :
print(f'{file_name} 这个文件不存在!')
print(file_content)
分块读取,提高大文件读取效率。
readline()
方法可以用来读取一行内容;
with open(file_name , encoding='utf-8') as file_obj:
# 读取一行内容
print(file_obj.readline(), end='')
readlines()
方法用于一行一行的读取内容,它会一次性将读取到的内容封装到一个列表中返回;
import pprint
import os
file_name = 'demo.txt'
with open(file_name , encoding='utf-8') as file_obj:
# readline()方法可以用来读取一行内容
# print(file_obj.readline())
# print(file_obj.readline(),end='')
# readlines()方法用于一行一行的读取内容
# r = file_obj.readlines()
# pprint.pprint(r[0])
for t in file_obj:
print(t)
open()
打开文件时必须要指定打开文件所要做的操作(读、写、追加);如果不指定操作类型,则默认是读取文件, 而读取文件时是不能向文件中写入的。
读取模式说明:
t
:表示读取文本文件;b
:表示读取二进制文件;open()
文件读取参数说明如下:
r
:表示只读的;rt
功能一样;rb
:读取二进制文件;w
:表示是可写的,使用 w
来写入文件时,如果文件不存在会创建文件,如果文件存在则会截断文件,截断文件指删除原来文件中的所有内容;wt
功能一样;a
:表示追加内容,如果文件不存在会创建文件,如果文件存在则会向文件中追加内容;x
:用来新建文件,如果文件不存在则创建,存在则报错;+
:为操作符增加功能;r+
:即可读又可写,文件不存在会报错;'r+b'
打开文件而不会被截断;w+
:a+
:write()
方法向文件中写入内容,如果操作的是一个文本文件的话,则 write()
需要传递一个字符串作为参数,该方法会可以分多次向文件中写入内容,写入完成以后,该方法会返回写入的字符的个数。
file_name = 'demo.txt'
# with open(file_name , 'w' , encoding='utf-8') as file_obj:
# with open(file_name , 'r+' , encoding='utf-8') as file_obj:
with open(file_name , 'x' , encoding='utf-8') as file_obj:
file_obj.write('aaa\n')
file_obj.write('bbb\n')
file_obj.write('ccc\n')
r = file_obj.write(str(123)+'123123\n')
r = file_obj.write('今天天气真不错')
print(r)
file_name = '敢问路在何方.flac'
with open(file_name , 'rb') as file_obj:
# print(file_obj.read(100))
# 将读取到的内容写出来
# 定义一个新的文件
new_name = 'aa.flac'
with open(new_name , 'wb') as new_obj:
# 定义每次读取的大小
chunk = 1024 * 100
while True :
# 从已有的对象中读取数据
content = file_obj.read(chunk)
# 内容读取完毕,终止循环
if not content :
break
# 将读取到的数据写入到新对象中
new_obj.write(content)
seek()
可以修改当前读取的位置;此时如果再用read()
方法,会从修改的位置之后继续读取;
seek()需要两个参数
0
:从头计算,默认值;1
:从当前位置计算;file_obj.seek(70,1)
;2
:从最后位置开始计算;file_obj.seek(-10,2)
,读取文件最后10个数据;tell()
方法用来查看当前读取的位置;
print('当前读取到了 -->',file_obj.tell())
完整示例:
with open('demo2.txt','rt' , encoding='utf-8') as file_obj:
# print(file_obj.read(100))
# print(file_obj.read(30))
# seek() 可以修改当前读取的位置
file_obj.seek(9)
print(file_obj.read())
# tell() 方法用来查看当前读取的位置
print('当前读取到了 -->',file_obj.tell())
os.listdir()
获取指定目录的目录结构,需要一个路径作为参数,会获取到该路径下的目录结构,默认路径为 .
当前目录,该方法会返回一个列表,目录中的每一个文件(夹)的名字都是列表中的一个元素。os.listdir()
和 os.listdir('.')
功能是一样的;os.listdir('..')
返回当前文件目录上一级三维文件目录下的文件;os.chdir()
切换当前所在的目录,作用相当于 cd
(os.chdir('c:/')
);os.mkdir("a")
,在当前目录下创建一个名字为 aaa 的目录;os.rmdir('abc')
;os.remove('aa.txt')
;os.rename('旧名字','新名字')
可以对一个文件进行重命名,也可以用来移动一个文件:os.rename('aa.txt','bb.txt')
;实现文件重命名;os.rename('bb.txt','c:/users/34123/desktop/bb.txt')
;蒋文佳移动到桌面;此处只列出了一些常用的文件操作,如果在开发过程中有其他的需求,可以查阅官方文档。
参考:https://edu.aliyun.com/course/1782