一.文件IO常用操作
方法 | 含义 |
---|---|
open | 打开 |
read | 读取 |
write | 写入 |
close | 关闭 |
readline | 单行读取 |
readlines | 多行读取 |
seek | 文件指针操作 |
tell | 读取当前指针位置 |
二.open
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
创建并打开一个文件test,然后关闭
打开一个文件,返回一个文件对象(流对象)和文件描述符。
打开文件失败,则返回异常。
#touch test #linux
#New-Item "new test.txt" -type File #powershell
f = open("test") # file对象
# windows <_io.TextIOWrapper name='test' mode='r' encoding='cp936'> # linux <_io.TextIOWrapper name='test' mode='r' encoding='UTF-8'> print(f.read()) # 读取文件
f.close() # 关闭文件
1.open参数详解
① file
打开或者要创建的文件名,如果不指定路径,默认是当前路径
或者是文件描述符(整型)
② mode
文件打开的模式。默认以文本只读 mode=rt
的模式打开已经存在的文件
描述字符 | 含义 |
---|---|
r | 缺省值,只读打开,如果文件不存在,则抛出错误FileNotFoundError异常 |
w | 只写打开,没有文件则创建文件,如果文件存在,清空文件 |
x | 创建文件,并只写方式打开,文件存在则报错 |
a | 写入打开,如果文件存在,则追加文件内容,不存在则先创建再追加 |
b | 二进制模式,文件按照字节理解,字节操作使用bytes类型 |
t | 缺省值,文本模式,将文件按照某种字符标码理解,按照字符操作 |
+ | 不能单独使用,读写打开一个文件。给原来只读,只写当时打开提供缺失的读或者写功能 |
文件指针
文件指针,指向当前字节位置
f.seek(offset, whence=0, /) (f 是文件对象)
改变文件流的位置
offset 相对于whence偏移了多少个字节
whence 可以有三个选择的值
- 0 -- start of stream (the default); offset should be zero or positive 文件开头,默认
- 1 -- current stream position; offset may be negative 当前位置
- 2 -- end of stream; offset is usually negative 文件末尾
文本模式模式下:支持从开头向后偏移的。whence=1 表示从当前位置开始偏移,但是offset 只能为0,相当于原地不动。whence=2 表示从文本末尾开始偏移,offset 只能为0,seek 是按照字节偏移的
二进制模式下:默认whence=0,从文件开头开始,offset只能是正整数。whence=1,offset可正可负。whence=2,offset可正可负。二进制模式支持任意起点的偏移,向后seek可以超界,但是向前的seek不可以超界,否则抛出异常。
调用seek 会自动flush
2.buffering : 缓冲区
buffer缓冲区
缓冲区是一个内存空间,一般来说是一个FIFO队列,到缓冲区满了或者达到阈值的时候,数据才会flush 到磁盘中。
flush() 将缓冲区数据写入磁盘close()关闭前会调用flush()
buffering | 说明 |
---|---|
buffering=-1 | t,b都是默认使用io.DEFAULT_BUFFER_SIZE 的值,默认是4096或者8192。 |
buffering=0 | b 关闭缓冲区 ,t 不支持 |
buffering=1 | b 就1个字节,t 行缓冲,遇到换行符才flush |
buffering> 1 | b模式表示缓冲的大小,t模式,还是使用默认的buffer_size |
3.encoding
None 表示使用缺省编码,依赖操作系统。
windows默认是GBK(cp936)。
linux默认是UTF-8。
4.其他参数
errors 编码错误将被捕获,None和strict表示有编码错误将抛出ValueError错误,ignore表示忽略。
newline文本模式中,换行的转换。
以为None、'' 空串、'\r'、'\n'、'\r\n' 读时,None表示'\r'、'\n'、'\r\n'都被 转换为'\n';''表示不会自动转换通用换行符;其它合法字符表示换行符就是指定字符,就会按照指定字符分行 写 时,None表示'\n'都会被替换为系统缺省行分隔符os.linesep;'\n'或''表示'\n'不替换;其它合法字符表示'\n'会被 替换为指定的字符。
closefd 关闭文件描述符,True表示关闭它。False会在文件关闭后保持这个描述符。fileobj.fileno()查看
三.read
fileobj.read(size=-1, /)
size表示读取的多少个字符或字节;负数或者None表示读取到EOF
- readline(size=-1)
一行行读取文件内容。size设置一次能读取行内几个字符或字节。 - readlines(hint=-1)
读取所有行的列表。指定hint则返回指定的行数
四.write
fileobj.write(s, /)
把字符串s写入到文件中并返回字符的个数。
writelines(lines),将字符串列表写入文件。
五.close
flush 并关闭文件对象。
文件已经关闭,再次关闭没有任何 效果
六. 上下文管理
交给python解释器去释放文件对象
with open("file") as f:
f.read()
或者以下这种写法
f = open('test')
with f:
f.read()
- 使用with .. as 关键字
- 上下文管理的语句块并不会开启新的作用域
- with语句块执行完毕,会自动关闭文件对象
对于类似于文件对象的IO对象,一般来说都需要在不使用的时候关闭、注销,以释放资源。 IO被打开的时候,会获得一个文件描述符。计算机资源是有限的,所以操作系统都会做限制。就是为了保护计算机 的资源不要被完全耗尽,计算资源是共享的,不是独占的。 一般情况下,除非特别明确的知道资源情况,否则不要提高资源的限制值来解决问题。