python文件操作

读取文件

要使用文本文件中的信息,首先需要将信息读取到内存中。为此,你可以一次性读取文件的全部内容,也可以以每次一行的方式逐步读取。

读取整个文件

要读取文件,需要一个包含几行文本的文件。下面首先来创建一个文件,它包含精确到小数点后 30 位的圆周率值,且在小数点后每 10 位处都换行:

pi_digits.txt

3.1415926535
8979323846
2643383279

下面的程序打开并读取这个文件,再将其内容显示到屏幕上:

file_reader.py

with open('pi_digits.txt') as file_object:
    contents = file_object.read()
    print(contents)

函数 open() 返回一个表示文件的对象。在这里,open('pi_digits.txt') 返回一个表示文件 pi_digits.txt 的对象; Python 将这个对象存储在我们将在后面使用的变量中。

关键字 with 在不再需要访问文件后将其关闭。在这个程序中,注意到我们调用了 open() ,但没有调用 close()

Python 自会在合适的时候自动将其关闭。

逐行读取

要以每次一行的方式检查文件,可对文件对象使用 for 循环

file_reader.py

filename = 'pi_digits.txt'
with open(filename) as file_object:
    for line in file_object:
        print(line)

# 3.1415926535

# 8979323846

# 2643383279

我们打印每一行时,有多个空白行

为何会出现这些空白行呢?因为在这个文件中,每行的末尾都有一个看不见的换行符,而 print 语句也会加上一个换行符,因此每行末尾都有两个换行符:一个来自文件,另一个来自 print 语句。要消除这些多余的空白行,可在 print 语句中使用 rstrip()

filename = 'pi_digits.txt'
with open(filename) as file_object:
    for line in file_object:
        print(line.rstrip())

# 3.1415926535
# 8979323846
# 2643383279

创建一个包含文件各行内容的列表

使用关键字 with 时, open() 返回的文件对象只在 with 代码块内可用。如果要在 with 代码块外访问文件的内容,可在 with 代码块内将文件的各行存储在一个列表中,并在 with 代码块外使用该列表:你可以立即处理文件的各个部分,也可推迟到程序后面再处理。

filename = 'pi_digits.txt'
with open(filename) as file_object:
    lines = file_object.readlines()
for line in lines:
    print(line.rstrip())

使用文件的内容

将文件读取到内存中后,就可以以任何方式使用这些数据了。

filename = 'pi_digits.txt'
with open(filename) as file_object:
    lines = file_object.readlines()
pi_string = ''
for line in lines:
    pi_string += line.rstrip()
print(pi_string)
print(len(pi_string))

# 3.141592653589793238462643383279
# 32

读取文本文件时, Python 将其中的所有文本都解读为字符串。如果你读取的是数字,并要将其作为数值使用,就必须使用函数 int() 将其转换为整数,或使用函数 float() 将其转换为浮点数。

包含一百万位的大型文件

前面我们分析的都是一个只有三行的文本文件,但这些代码示例也可处理大得多的文件。如果我们有一个文本文件,其中包含精确到小数点后 1 000 000 位而不是 30 位的圆周率值,也可创建一个包含所有这些数字的字符串。

filename = 'pi_million_digits.txt'
with open(filename) as file_object:
    lines = file_object.readlines()
pi_string = ''
for line in lines:
    pi_string += line.strip()
print(pi_string[:52] + "...")
print(len(pi_string))

对于你可处理的数据量, Python 没有任何限制;只要系统的内存足够多,你想处理多少数据都可以。

写入文件

保存数据的最简单的方式之一是将其写入到文件中。通过将输出写入文件,即便关闭包含程序输出的终端窗口,这些输出也依然存在。

写入空文件

要将文本写入文件,你在调用 open() 时需要提供另一个实参,告诉 Python 你要写入打开的文件。

filename = 'programming.txt'
with open(filename, 'w') as file_object:
    file_object.write("I love programming")

打开文件时,可指定以下模式:

模式 名称
读取模式 r
写入模式 w
附加模式 a
读取和写入文件 r+

如果你省略了模式实参, Python 将以默认的只读模式打开文件。

如果你要写入的文件不存在,函数 open() 将自动创建它。然而,以写入模式打开文件时千万要小心,因为如果指定的文件已经存在, Python 将在返回文件对象前清空该文件。

Python 只能将字符串写入文本文件。要将数值数据存储到文本文件中,必须先使用函数 str() 将其转换为字符串格式。

写入多行

函数 write() 不会在你写入的文本末尾添加换行符,因此如果你写入多行时没有指定换行符,文件看起来可能不是你希望的那样:

filename = 'programming.txt'
with open(filename, 'w') as file_object:
    file_object.write("I love programming.\n")
    file_object.write("I love creating new games.\n")

附加到文件

filename = 'programming.txt'
with open(filename, 'a') as file_object:
    file_object.write("I also love finding meaning in large datasets.\n")
    file_object.write("I love creating apps that can run in a browser.\n")
filename = 'programming.txt'
with open(filename, 'a') as file_object:
    file_object.write("I also love finding meaning in large datasets.\n")
    file_object.write("I love creating apps that can run in a browser.\n")
python

你可能感兴趣的:(python文件操作)