Python学习笔记10——文件操作相关

文章目录

  • 前言
  • 一、函数和模块
    • 1.1 函数
    • 1.2 模块
  • 二、文件操作
    • 2.1 文件打开和关闭
    • 2.2 文件内容读取
    • 2.3 判断文件是否存在
    • 2.4 写文件
    • 2.5 文件定位
    • 2.6 重命名或删除文件
    • 2.7 创建、删除或更改目录
  • 三、file对象常用方法补充
    • 3.1 Python3 File flush() 方法
    • 3.2 Python3 File readline() 方法
    • 3.3 Python3 File readlines() 方法
    • 3.4 Python3 File seek() 方法
    • 3.5 Python3 File writelines() 方法
  • 四、with 关键字用于文件打开


前言

从本章开始,我们进入python学习的第二阶段,主要讲解python语言中函数与模块的部分。这一章主要讲解python语言中关于文件操作的内容。

一、函数和模块

Python学习笔记10——文件操作相关_第1张图片

1.1 函数

函数是每一门编程语言中必须要掌握的内容,一个函数往往会实现一个功能,并且该功能往往会被多次使用,函数的存在意义在于减少代码量,提高程序员写代码的效率。
python中的函数分为以下两种类型:

  • 内置函数
    内置函数在python中有很多,比如len()、bin()、oct()、hex() 等等,在编写程序时,无需声明或者定义,也无需引入专门的模块,直接就可以调用。
  • 自定义函数
    自定义函数往往是程序员为了实现某些功能自己编写的代码块。
def send_email():
    # 写了10行代码,实现了发送邮件。
    pass

send_email()
# 定义了一个函数,功能代码块
def send_email():
    # 写了10行代码,实现了发送邮件。
    pass

goods = [
    {"name": "电脑", "price": 1999},
    {"name": "鼠标", "price": 10},
    {"name": "游艇", "price": 20},
    {"name": "美女", "price": 998}
]
for index in range(len(goods)):
    item = goods[index]
    print(index + 1, item['name'], item['price'])

# 调用并执行函数
send_email()

while True:
    num = input("请输入要选择的商品序号(Q/q):")  # "1"
    if num.upper() == "Q":
        break
    if not num.isdecimal():
        print("用输入的格式错误")
        break
    num = int(num)
    send_email()
    if num > 4 or num < 0:
        print("范围选择错误")
        break
    target_index = num - 1
    choice_item = goods[target_index]
    print(choice_item["name"], choice_item['price'])
    send_email()

1.2 模块

模块是机场各部分了很多功能的函数集合。

  • 内置模块,Python内部帮助我们提供好的模块。
import random

num = random.randint(0,19)
import decimal

v1 = decimal.Decimal("0.1")
v2 = decimal.Decimal("0.2")
v3 = v1 + v2
print(v3) # 0.3
  • 第三方模块,比如tensorflow、numpy等等。
  • 自定义模块。

二、文件操作

在学习文件操作之前,先来回顾一下编码的相关以及相关数据类型的知识。

  • 字符串类型(str),在程序中用于表示文字信息,本质上是unicode编码中的二进制。

    name = "武沛齐"
    
  • 字节类型(bytes)

    • 可表示文字信息,本质上是utf-8/gbk等编码的二进制(对unicode进行压缩,方便文件存储和网络传输。)

      name = "武沛齐"
      data = name.encode('utf-8')
      print(data) # b'\xe6\xad\xa6\xe6\xb2\x9b\xe9\xbd\x90'
      
      result = data.decode('utf-8')
      print(result) # "武沛齐"
      
    • 可表示原始二进制(图片、文件等信息)

2.1 文件打开和关闭

对于文件的打开与关闭,需要使用python的内置文件打开函数open()以及关闭函数close(),两个函数往往搭配在一起使用。open()函数返回的是一个文件对象。
Python 提供了必要的函数和方法进行默认情况下的文件基本操作。你可以用 file 对象做大部分的文件操作。

open 函数
你必须先用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写。

语法:

file object = open(file_name [, access_mode][, buffering])

各个参数的细节如下:

  • file_name:file_name变量是一个包含了你要访问的文件名称的字符串值。
  • access_mode:access_mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读®。
  • buffering:如果buffering的值被设为0,就不会有寄存。如果buffering的值取1,访问文件时会寄存行。如果将buffering的值设为大于1的整数,表明了这就是的寄存区的缓冲大小。如果取负值,寄存区的缓冲大小则为系统默认。

不同模式打开文件的完全列表:

模式 描述
t 文本模式
x 写模式,新建一个文件,如果该文件已存在则会报错。
+ 打开一个文件进行更新(可读可写)。
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
w+ 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

下图很好的总结了这几种模式:
Python学习笔记10——文件操作相关_第2张图片

模式 r r+ w w+ a a+
+ + + +
+ + + + +
创建 + + + +
覆盖 + +
指针在开始 + + + +
指针在结尾 + +

File对象的属性
一个文件被打开后,你有一个file对象,你可以得到有关该文件的各种信息。

以下是和file对象相关的所有属性的列表(注意不是方法):

属性 描述
file.closed 返回true如果文件已被关闭,否则返回false。
file.mode 返回被打开文件的访问模式。
file.name 返回文件的名称。
file.softspace 如果用print输出后,必须跟一个空格符,则返回false。否则返回true。

代码示例

# -*- coding: UTF-8 -*-
 
# 打开一个文件
fo = open("foo.txt", "w")
print "文件名: ", fo.name
print "是否已关闭 : ", fo.closed
print "访问模式 : ", fo.mode
print "末尾是否强制加空格 : ", fo.softspace

#输出
文件名:  foo.txt
是否已关闭 :  False
访问模式 :  w
末尾是否强制加空格 :  0

close()方法
File 对象的 close()方法刷新缓冲区里任何还没写入的信息,并关闭该文件,这之后便不能再进行写入。

当一个文件对象的引用被重新指定给另一个文件时,Python 会关闭之前的文件。用 close()方法关闭文件是一个很好的习惯。

语法:

fileObject.close()
# 打开一个文件
fo = open("foo.txt", "w")
print "文件名: ", fo.name
 
# 关闭打开的文件
fo.close()

#输出:
文件名:  foo.txt

2.2 文件内容读取

read()方法
read()方法从一个打开的文件中读取一个字符串。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。也就是说,如果是以文本模式打开,那么读取的最小单位是字符。如果打开的方式为二进制模式,那么读取的最小单位就是字节。

语法:

fileObject.read([count])

在这里,被传递的参数是要从已打开文件中读取的字符/字节计数。该方法从文件的开头开始读入,如果没有传入count,它会尝试尽可能多地读取更多的内容,很可能是直到文件的末尾。

代码示例

# -*- coding: UTF-8 -*-
 
# 打开一个文件
fo = open("foo.txt", "r+")
str = fo.read(10)
print "读取的字符串是 : ", str
# 关闭打开的文件
fo.close()
# 1.打开文件
#	- 路径:
#		相对路径:'file/info.txt'
#		绝对路径:'F:\python路飞学习\python项目-模块二\file\info.txt'
# 	- 模式
# 		rb,表示读取文件原始的二进制(r, 读 read;b, 二进制 binary;)
# 1.打开文件
file_object = open('file/info.txt', mode='rb')
# 2.读取文件内容,并赋值给data
data = file_object.read()
# 3.关闭文件
file_object.close()

print(data) # b'alex-123\n\xe6\xad\xa6\xe6\xb2\x9b\xe9\xbd\x90-123'
text = data.decode("utf-8")
print(text)

在当前目录中创建一个py文件用于文件读取,需要读取的文件时放在file文件夹中的info.txt文件。open()函数中第一个参数是文本路径,这里使用使用的是相对路径,也可以使用绝对路径。由于pycharm在打开项目时,当前目录已经默认进入到了项目的目录之中,所以使用相对路径不会报错。但是如果在终端没有进入项目目录而直接运行该脚本,则会找不到文本文件,需要注意。

file_object = open('a1.png', mode='rb')
data = file_object.read()
file_object.close()

print(data) # \x91\xf6\xf2\x83\x8aQFfv\x8b7\xcc\xed\xc3}\x7fT\x9d{.3.\xf1{\xe8\...

补充
在liunx或者mac系统中,文件路径的分隔符为/,卸载字符串中不会被转义,但是对于windows系统,文件路径的分隔符是```,默认情况下,会被字符串转义,因此在windows系统下写文件路径时,可以使用以下两种方法解决该问题:

  1. 字符串加r,例如file_object = open(r'C:\new\info.txt', mode='rt', encoding='utf-8')
  2. 使用\\来代替\,例如file_object = open('C:\\new\\info.txt', mode='rt', encoding='utf-8')

2.3 判断文件是否存在

调用os模块中的exists函数判断文件路径是否存在:

# 判断路径是否存在?
import os

file_path = "/Users/wupeiqi/PycharmProjects/luffyCourse/day09/info.txt"
exists = os.path.exists(file_path)
if exists:
    # 1.打开文件
    file_object = open('infower.txt', mode='rt', encoding='utf-8')
    # 2.读取文件内容,并赋值给data
    data = file_object.read()
    # 3.关闭文件
    file_object.close()
    print(data)
else:
    print("文件不存在")

2.4 写文件

write()方法
write()方法可将任何字符串写入一个打开的文件。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。

write()方法不会在字符串的结尾添加换行符(’\n’)
语法:

fileObject.write(string)

在这里,被传递的参数是要写入到已打开文件的内容。

代码示例

# -*- coding: UTF-8 -*-
 
# 打开一个文件
fo = open("foo.txt", "w")
fo.write( "www.runoob.com!\nVery good site!\n")
 
# 关闭打开的文件
fo.close()

上述方法会创建foo.txt文件,并将收到的内容写入该文件,并最终关闭文件。如果你打开这个文件,将看到以下内容:

$ cat foo.txt 
www.runoob.com!
Very good site!
# 1.打开文件
#	- 路径:
#		相对路径:'file/info.txt'
#		绝对路径:'F:\python路飞学习\python项目-模块二\file\info.txt'
# 	- 模式
# 		w,表示写文件
# 1.打开文件
file_object = open('file/info.txt', mode='wt',encoding="utf-8")# 注意encoding参数最好写清楚

# 2.写文件内容
file_object.write("小香猪爱学习!!!!!!!!")
# 3.关闭文件
file_object.close()
# 1.打开文件
# 路径:t1.txt
# 模式:wb(要求写入的内容需要是字节类型)
file_object = open("t1.txt", mode='wb')

# 2.写入内容
file_object.write(    "武沛齐".encode("utf-8")    )

# 3.文件关闭
file_object.close()
file_object = open("t1.txt", mode='wt', encoding='utf-8')

file_object.write("武沛齐")

file_object.close()

还可以写图片文件,注意对于非文本文件,最好使用字节类型对文件进行打开:

f1 = open('a1.png',mode='rb')
content = f1.read()
f1.close()

f2 = open('a2.png',mode='wb')
f2.write(content)
f2.close()

基础案例

# 案例1:用户注册

user = input("请输入用户名:")
pwd = input("请输入密码:")
data = "{}-{}".format(user, pwd)
file_object = open("files/info.txt", mode='wt', encoding='utf-8')
file_object.write(data)
file_object.close()


# 案例2:多用户注册

# w写入文件,先清空文件;再在文件中写入内容。
file_object = open("files/info.txt", mode='wt', encoding='utf-8')
while True:
    user = input("请输入用户名:")
    if user.upper() == "Q":
        break
    pwd = input("请输入密码:")
    data = "{}-{}\n".format(user, pwd)

    file_object.write(data)
file_object.close()

利用爬虫获取数据并写入文件:

# 案例1:去网上下载一点文本,文本信息写入文件。
import requests

res = requests.get(
    url="https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start=20",
    headers={
        "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"
    }
)

# 网络传输的原始二进制信息(bytes)
# res.content

file_object = open('files/log1.txt', mode='wb')
file_object.write(res.content)
file_object.close()



# 案例2:去网上下载一张图片,图片写入本地文件。
import requests

res = requests.get(
    url="https://hbimg.huabanimg.com/c7e1461e4b15735fbe625c4dc85bd19904d96daf6de9fb-tosv1r_fw1200",
    headers={
        "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"
    }
)

# 网络传输的原始二进制信息(bytes)
# res.content

file_object = open('files/图片.png', mode='wb')
file_object.write(res.content)
file_object.close()

2.5 文件定位

tell()方法告诉你文件内的当前位置, 换句话说,下一次的读写会发生在文件开头这么多字节之后。

seek(offset [,from])方法改变当前文件的位置。

  • Offset变量表示要移动的字节数
  • From变量指定开始移动字节的参考位置。

如果from被设为0,这意味着将文件的开头作为移动字节的参考位置。如果设为1,则使用当前的位置作为参考位置。如果它被设为2,那么该文件的末尾将作为参考位置。

一定要注意的是,中文字符一般占用三个字节,英文字符一般占用一个字节,所以读取一个中文字符光标会移动三个字符!

file_object = open('file/info.txt', mode='r+',encoding="utf-8")
# 2.写文件内容
data = file_object.read(4)
print(data)
print(file_object.tell())
# 3.关闭文件
file_object.close()

#输出
小香a猪
10 #三个中文字符加一个英文字符,一共3*3+1=10个字节

2.6 重命名或删除文件

Python的os模块提供了帮你执行文件处理操作的方法,比如重命名和删除文件。要使用这个模块,你必须先导入它,然后才可以调用相关的各种功能。

rename() 方法
rename() 方法需要两个参数,当前的文件名和新文件名。

语法:

os.rename(current_file_name, new_file_name)

例子:

下例将重命名一个已经存在的文件test1.txt。

# -*- coding: UTF-8 -*-

import os
 
# 重命名文件test1.txt到test2.txt。
os.rename( "test1.txt", "test2.txt" )

remove()方法
你可以用remove()方法删除文件,需要提供要删除的文件名作为参数。

语法:

os.remove(file_name)

例子:

下例将删除一个已经存在的文件test2.txt。

# -*- coding: UTF-8 -*-


import os
 
# 删除一个已经存在的文件test2.txt
os.remove("test2.txt")

2.7 创建、删除或更改目录

所有文件都包含在各个不同的目录下,不过Python也能轻松处理。os模块有许多方法能帮你创建,删除和更改目录。

mkdir()方法
可以使用os模块的mkdir()方法在当前目录下创建新的目录们。你需要提供一个包含了要创建的目录名称的参数。

语法:

os.mkdir("newdir")

例子:

下例将在当前目录下创建一个新目录test。

# -*- coding: UTF-8 -*-

import os
 
# 创建目录test
os.mkdir("test")

chdir()方法
可以用chdir()方法来改变当前的目录。chdir()方法需要的一个参数是你想设成当前目录的目录名称。

语法:

os.chdir("newdir")

例子:

下例将进入"/home/newdir"目录。

# -*- coding: UTF-8 -*-

import os
 
# 将当前目录改为"/home/newdir"
os.chdir("/home/newdir")

getcwd()方法:

getcwd()方法显示当前的工作目录。

语法:

os.getcwd()

例子:

下例给出当前目录:

# -*- coding: UTF-8 -*-

import os
 
# 给出当前的目录
print os.getcwd()

rmdir()方法
rmdir()方法删除目录,目录名称以参数传递。

在删除这个目录之前,它的所有内容应该先被清除。

语法:

os.rmdir('dirname')

例子

以下是删除" /tmp/test"目录的例子。目录的完全合规的名称必须被给出,否则会在当前目录下搜索该目录。

# -*- coding: UTF-8 -*-

import os
 
# 删除”/tmp/test”目录
os.rmdir( "/tmp/test"  )

三、file对象常用方法补充

3.1 Python3 File flush() 方法

概述
flush() 方法是用来刷新缓冲区的,即将缓冲区中的数据立刻写入文件,同时清空缓冲区,不需要是被动的等待输出缓冲区写入。

一般情况下,文件关闭后会自动刷新缓冲区,但有时你需要在关闭前刷新它,这时就可以使用 flush() 方法。

语法
flush() 方法语法如下:

fileObject.flush();

参数

返回值
该方法没有返回值。

实例
以下实例演示了 flush() 方法的使用:

# 打开文件
fo = open("runoob.txt", "wb")
print ("文件名为: ", fo.name)

# 刷新缓冲区
fo.flush()

# 关闭文件
fo.close()

# 以上实例输出结果为:

文件名为:  runoob.txt

3.2 Python3 File readline() 方法

概述
readline() 方法用于从文件读取整行,包括 “\n” 字符。如果指定了一个非负数的参数,则返回指定大小的字节数,包括 “\n” 字符。

语法
readline() 方法语法如下:

fileObject.readline(); 

参数

  • size – 从文件中读取的字节数。

返回值
返回从字符串中读取的字节。

实例
以下实例演示了 readline() 方法的使用:

文件 runoob.txt 的内容如下:

1:www.runoob.com
2:www.runoob.com
3:www.runoob.com
4:www.runoob.com
5:www.runoob.com

读取文件的内容:

实例

# 打开文件
fo = open("runoob.txt", "r+")
print ("文件名为: ", fo.name)

line = fo.readline()
print ("读取第一行 %s" % (line))

line = fo.readline(5)
print ("读取的字符串为: %s" % (line))

# 关闭文件
fo.close()

#以上实例输出结果为:

文件名为:  runoob.txt
读取第一行 1:www.runoob.com

读取的字符串为: 2:www

3.3 Python3 File readlines() 方法

概述
readlines() 方法用于读取所有行(直到结束符 EOF)并返回列表,该列表可以由 Python 的 for… in … 结构进行处理。 如果碰到结束符 EOF 则返回空字符串。

如果碰到结束符 EOF 则返回空字符串。

语法
readlines() 方法语法如下:

fileObject.readlines()

参数
无。

返回值
返回列表,包含所有的行。

实例
以下实例演示了 readline() 方法的使用:

文件 runoob.txt 的内容如下:

1:www.runoob.com
2:www.runoob.com
3:www.runoob.com
4:www.runoob.com
5:www.runoob.com

循环读取文件的内容:

# 打开文件
fo = open("runoob.txt", "r")
print ("文件名为: ", fo.name)
 
for line in fo.readlines():                          #依次读取每行  
    line = line.strip()                             #去掉每行头尾空白  
    print ("读取的数据为: %s" % (line))
 
# 关闭文件
fo.close()

以上实例输出结果为:

文件名为:  runoob.txt
读取的数据为: 1:www.runoob.com
读取的数据为: 2:www.runoob.com
读取的数据为: 3:www.runoob.com
读取的数据为: 4:www.runoob.com
读取的数据为: 5:www.runoob.com

补充:循环,读大文件(readline加强版)【常见】

f = open('info.txt', mode='r', encoding='utf-8')
for line in f:
    print(line.strip())
f.close()

3.4 Python3 File seek() 方法

概述
seek() 方法用于移动文件读取指针到指定位置。

语法
seek() 方法语法如下:

fileObject.seek(offset[, whence])

参数

  • offset – 开始的偏移量,也就是代表需要移动偏移的字节数,如果是负数表示从倒数第几位开始。
  • whence:可选,默认值为 0。给 offset 定义一个参数,表示要从哪个位置开始偏移;0 代表从文件开头开始算起,1
    代表从当前位置开始算起,2 代表从文件末尾算起。

返回值
如果操作成功,则返回新的文件位置,如果操作失败,则函数返回 -1。

实例
以下实例演示了 seek() 方法的使用:

>>> f = open('workfile', 'rb+')
>>> f.write(b'0123456789abcdef')
16
>>> f.seek(5)      # 移动到文件的第六个字节
5
>>> f.read(1)
b'5'
>>> f.seek(-3, 2)  # 移动到文件倒数第三个字节
13
>>> f.read(1)
b'd'

文件 runoob.txt 的内容如下:

1:www.runoob.com
2:www.runoob.com
3:www.runoob.com
4:www.runoob.com
5:www.runoob.com

循环读取文件的内容:

# 打开文件
fo = open("runoob.txt", "r+")
print ("文件名为: ", fo.name)
 
line = fo.readline()
print ("读取的数据为: %s" % (line))
 
# 重新设置文件读取指针到开头
fo.seek(0, 0)
line = fo.readline()
print ("读取的数据为: %s" % (line))
 
 
# 关闭文件
fo.close()


#以上实例输出结果为:

文件名为:  runoob.txt
读取的数据为: 1:www.runoob.com

读取的数据为: 1:www.runoob.com

3.5 Python3 File writelines() 方法

概述
writelines() 方法用于向文件中写入一序列的字符串。

这一序列字符串可以是由迭代对象产生的,如一个字符串列表。

换行需要制定换行符 \n。

语法
writelines() 方法语法如下:

fileObject.writelines( [ str ])

参数

  • str – 要写入文件的字符串序列。

返回值
该方法没有返回值。

实例
以下实例演示了 writelines() 方法的使用:

# 打开文件
fo = open("test.txt", "w")
print ("文件名为: ", fo.name)
seq = ["小香猪爱学习\n", "小香猪还有钱"]
fo.writelines( seq )

# 关闭文件
fo.close()
以上实例输出结果为:

文件名为:  test.txt
查看文件内容:

$ cat test.txt 
小香猪爱学习
小香猪还有钱

四、with 关键字用于文件打开

为了防止程序在文件打开后中途出现错误导致程序崩溃,文件最终没有关闭的情况发生,导致文件数据丢失或受损,我们选择将文件关闭的恰当时机交给python解释器来决定更为保险。

with open("xxxx.txt", mode='rb') as file_object:
    data = file_object.read()
    print(data)

在Python 2.7 后,with又支持同时对多个文件的上下文进行管理,即:

with open("xxxx.txt", mode='rb') as f1, open("xxxx.txt", mode='rb') as f2:
    pass

你可能感兴趣的:(python学习笔记,python,编程语言)