python学习笔记-tip49(io编程--文件读写)

引言

python内置了读写文件的函数,用法和C语言是兼容的

读文件--open()函数

用法:传入文件名和标识符(r,w)即读,写
示例:

   >>>f=open('/Users/guaju/test.txt','r')

这样,我们就成功的打开了文件

但是如果这个文件不存在,open()函数就会报出IOError的异常,并且给出错误码,和详细的信息告诉你文件不存在

如果文件打开成功,我们就可以通过read()的方法,将文件中的内容全部读出来,然后用一个str对象表示出来,现在呢,我们看一个示例

我们在桌面新建一个hello.txt的文件,然后里面输入内容“helloworld”,我们尝试读取一下这个文件中的数据

python学习笔记-tip49(io编程--文件读写)_第1张图片

下面我们来说下关闭文件的方法 close()

文件打开然后操作完毕之后,必须要对文件进行关闭,因为文件对象会占用操作系统的资源,关闭文件意味着释放资源,所以我们必须有良好的编程习惯

    f.close()

由于文件读写都有可能出现 IOError,所以一旦报错,关闭文件的代码:
f.close()
有时候会无法被调用到,程序就异常退出。
所以,为了保证无论是否出错,都能保证正常的关闭文件,我们可以使用try...finally来实现

  try:
      f=open('Users/guaju/Desktop/hello.txt','r')
      print(f.read())
  finally:
      if f:
         f.close()

这样写固然是合理的,但是如果我们频繁操作文件的话,这样写就有些繁琐了
python提供了更加合适的方法
with语句来自动帮助我们调用close()方法
请看代码示例:

    with open('Users/guaju/Desktop/hello/txt','r') as f:
            print(f.read())

这个写法实现的效果和上面的try...finally是一样的,但是代码却异常简洁

我们来深究下read()方法

上文中我们知道了,调用read()方法,会一次性的将文件中的全部信息读取出来,那么如果文件有10G,那么电脑内存就爆掉了,所以为了安全起见,可以反复调用

  • read(size)方法,这样每次最多读取size个字节的内容。
  • 另外,使用readline() 可以每次读取文件中的一行内容
  • 此外,使用readlines()可以一次性读取所有内容,并且按行返回list
    因此要根据需要,决定什么时候怎么调用

经验之谈

如果文件很小,read()方法是最佳的
如果不能确定文件大小,那么read(size)来反复调用,比较保险
如果是读取配置文件,那么使用readlines()比较合适

下面来说明一下readlines()方法使用小示例

    for line in f.readlines():
         #strip()方法可以把末尾的回车符 ”\n“ 删掉
         print(line.strip())

file-like Object

就是一种类的类型,有read()方法的对象,在python中统称为file-like Object。
这种file-like Object可以是
file文件
内存的字节流
网络流
自定义流
等等
file-like Object 不要求从特定类继承,只要写个 read() 方法就行了。

StringIO 是在内存中创建的file-like Object,常用作临时缓冲。

二进制文件

前面提到的都是读取的文本文件,而且都是utf-8格式的文本文件,要读取二进制文件
比如图片、视频、音频等,用‘rb’模式打开文件即可
比如现在我要打开我桌面上的杨幂的图片
路径为:‘Users/guaju/Desktop/ym.jpg’
模式为:‘rb’
那么就这样书写代码就可以了


python学习笔记-tip49(io编程--文件读写)_第2张图片

我们看到读取到的图片的信息是16进制展示的

其实原图是这样的
python学习笔记-tip49(io编程--文件读写)_第3张图片

字符编码

要读取飞utf-8编码的文本文件的话,就要给open()传入encoding的参数,例如读取GBK编码的文件,我们这么写

f=open('User/guaju/Desktop/gbkfile.txt','r',encoding='gbk')

当然,我们肯定会遇到编码不规则的文件,那么必然会遇到UnicodeDecodeError,因为在文本文件中可能夹杂了一些非法编码的字符。
遇到这种情况,open()函数还接受一个errors的参数,表示如果遇到编码错误后,如何处理,当然最简单的处理方式是忽略

    f=open('Users/guaju/Desktop/hello.txt','r',encoding='gbk',errors='ignore')

写文件

写文件和读文件是一样的,唯一区别调用open函数是,输入的模式变化,输入模式变为
‘w’ 或者是‘wb’,分别表示输出字符,或者输出二进制内容
此外,“读”read() 则转化为写write()
我们来看下示例代码

      with open('Users/guaju/Desktop/hello2.txt','w') as f1
      f1.write('hello python')
      with open('Users/guaju/Desktop/hello2.txt','r') as f2
      f2.read()    

需要注意的是,程序执行完write()方法之后,要输入的文本或者字节有时并不会真正的完整的输出到文件中去,而是当我们调用close()方法时,才会完成完整的输出,所以我们一定不要忘了调用close()方法。
最好的做法就是我上边的做法,使用with语句

当然,如果要写入指定编码的文件,那么同上放一样,给open()方法设置encoding的配置,将字符串自动转换成为指定的编码

还有两点需要注意

  • 如果文件不存在,那么不能直接写入,需要先创建再进行写入

  • 当我们写文件时,如果传入的模式是'w'的话,那么如果写的操作执行很多次,那么文件中的内容不会追加,而是会覆盖,那么怎么解决这个问题呢?
    其实这个模式替换成'a'就可以了

我们来简单看一个示例


python学习笔记-tip49(io编程--文件读写)_第4张图片

本例是文件不存在的情况

接下来我们先把文件创建出来,然后重新执行一遍


python学习笔记-tip49(io编程--文件读写)_第5张图片

现在大家看到区别了吧

总结

用到的函数有

open()
close()
read()
write()

打开文件的配置常见的有

'r'
'w'
'rb'
'wb'
'a'

配置编码的方式

encoding='编码方式'

错误的处理方式

errors='ignore'

with的使用

with open('文件路径','打开方式',encoding='编码方式',errors='处理方法') as f:

不多,很简单,多练练就好了

你可能感兴趣的:(python学习笔记-tip49(io编程--文件读写))