《Python编程:从入门到实践》第 10 章 文件和异常

目录

10.1 从文件中读取数据

10.1.1 读取整个文件

10.1.2 文件路径

 10.1.3 逐行读取

10.1.4 创建一个包含文件各行内容的列表

10.1.5 使用文件的内容

 10.1.6 包含一百万位的大型文件

 10.1.7 练习

练习10-1:Python学习笔记

练习10-2:C语言学习笔记

10.2 写入文件

10.2.1 写入空文件

10.2.2 写入多行 

10.2.3 附加到文件

10.2.4 练习

练习10-3:访客

练习10-4:访客名单

练习10-5:调查

10.3 异常

10.3.1 处理ZeroDivisionError 异常

10.3.2 使用try-except 代码块

10.3.3 使用异常避免崩溃

10.3.4 else 代码块

10.3.5 处理FileNotFoundError 异常

10.3.6 分析文本

10.3.7 使用多个文件

10.3.8 静默失败

10.3.9 决定报告哪些错误

10.3.10 练习

练习10-6:加法运算

练习10-7:加法计算器

练习10-8:猫和狗

练习10-9:静默的猫和狗

练习10-10:常见单词

10.4 存储数据

 10.4.1 使用json.dump() 和json.load()

10.4.2 保存和读取用户生成的数据

10.4.3 重构

10.4.4 练习

练习10-11:喜欢的数

练习10-12:记住喜欢的数

练习10-13:验证用户


 

10.1 从文件中读取数据

文本文件可存储的数据量多得难以置信:天气数据、交通数据、社会经济数据、文学作品等。每当需要分析或修改存储在文件中的信息时,读取文件都很有用,对数据分析应用程序来说尤其如此。例如,可以编写一个这样的程序:读取一个文本文件的内容,重新设置这些数据的格式并将其写入文件,让浏览器能够显示这些内容。

要使用文本文件中的信息,首先需要将信息读取到内存中。为此,你可以一次性读取文件的全部内容,也可以以每次一行的方式逐步读取。

10.1.1 读取整个文件

要读取文件,需要一个包含几行文本的文件。下面首先创建一个文件,它包含精确到小数点后30位的圆周率值,且在小数点后每10位处换行:
3.1415926535
  8979323846
  2643383279
要动手尝试后续示例,可在编辑器中输入这些数据行,再将文件保存为pi_digits.txt,请将该文件保存到本章程序所在的目录。
下面的程序打开并读取这个文件,再将其内容显示到屏幕上:
with open('D:\\python_work\\chapter10\\pi_digits.txt') as file_object:
    contents = file_object.read()
print(contents)
在这个程序中,第一行代码做了大量的工作。我们先来看看函数 open() 。要以任何方式使用文件,那怕仅仅是打印其内容,都得先打开 文件,才能访问它。函数open() 接受一个参数:要打开的文件的名称。Python在当前执行的文件所在的目录中查找指定的文件。在本例中,当前运行的是file_reader.py,因此Python在file_reader.py所在的目录中查找pi_digits.txt。函数 open() 返回一个表示文件的对象。在这里, open('pi_digits.txt') 返回一个表示文件pi_digits.txt的对象,Python将该对象赋给 file_object 供以后使用。
关键字 with 在不再需要访问文件后将其关闭。在这个程序中,注意到我们调用了open() ,但没有调用 close() 。也可以调用 open() close() 来打开和关闭 文件,但这样做时,如果程序存在bug导致方法close() 未执行,文件将不会关闭。这看似微不足道,但未妥善关闭文件可能导致数据丢失或受损。如果在程序中过早调用 close() ,你会发现需要使用文件时它已关闭 (无法访问),这会导致更多的错误。并非在任何情况下都能轻松确定关闭文件的恰当时机,但通过使用前面所示的结构,可让Python去确定:你只管打开文件,并在需要时使用它,Python自会在合适的时候自动将其关闭。
有了表示pi_digits.txt的文件对象后,使用方法 read() (前述程序的第二行)读取这个文件的全部内容,并将其作为一个长长的字符串赋给变量 contents 。这样,通过打印 contents 的值,就可将这个文本文件的全部内容显示出来:
3.1415926535
  8979323846
  2643383279

10.1.2 文件路径

将类似于pi_digits.txt的简单文件名传递给函数open() 时,Python将在当前执行的文件(即.py程序文件)所在的目录中查找。

根据你组织文件的方式,有时可能要打开不在程序文件所属目录中的文件。例如,你可能将程序文件存储在了文件夹python_work中,而该文件夹中有一个名为text_files的文件夹用于存储程序文件操作的文本文件。虽然文件夹text_files包含在文件夹python_work中,但仅向open() 传递位于前者中的文件名称也不可行,因为Python只在文件夹python_work中查找,而不会在其子文件夹text_files中查找。要让Python打开不与程序文件位于同一个目录中的文件,需要提供文件路径,让Python到系统的特定位置去查找。由于文件夹text_files位于文件夹python_work中,可以使用相对文件路径来打开其中的文件。相对文件路径让Python到指定的位置去查找,而该位置是相对于当前运行的程序所在目录的。例如,可这样编写代码:
with open('text_files/filename.txt') as file_object:
这行代码让Python到文件夹python_work下的文件夹text_files中去查找指定的.txt文件。
注意         示文件路径时,Windows系统使用反斜杠(\ )而不是斜杠( / ),但在代码中依然可以使用斜杠。

 还可以将文件在计算机中的准确位置告诉Python,这样就不用关心当前运行的程序存储在什么地方了。这称为绝对文件路径 。在相对路径行不通时,可使用绝对路径。例如,如果text_files并不在文件夹python_work中,而在文件夹other_files中,则向open() 传递路径'text_files/filename .txt' 行不通,因为Python只在文件夹python_work中查找该位置。为明确指出希望Python到哪里去查找,需要提供完整的路径。

绝对路径通常比相对路径长,因此将其赋给一个变量,再将该变量传递给open()会有所帮助
file_path = '/home/ehmatthes/other_files/text_files/_filename_.txt'
with open(file_path) as file_object:

通过使用绝对路径,可读取系统中任何地方的文件。就目前而言,最简单的做法是,要么将数据文件存储在程序文件所在的目录,要么将其存储在程序文件所在目录下的一个文件夹(如text_files)中。

注意         如果在文件路径中直接使用反斜杠,将引发错误,因为反斜杠用于对字符串中的字符进行转义。例如,对于路径 "C:\path\to\file.txt" ,其中的 \t 将被解读为制表符。如果一定要使用反斜杠,可对路径中的每个反斜杠都进行转义,如 "C:\\path\\to\\file.txt"

 10.1.3 逐行读取

读取文件时,常常需要检查其中的每一行:可能要在文件中查找特定的信息,或者要以某种方式修改文件中的文本。例如,你可能要遍历一个包含天气数据的文件,并使用天气描述中包含sunny字样的行。在新闻报道中,你可能会查找包含标签 的行,并按特定的格式设置它。
要以每次一行的方式检查文件,可对文件对象使用 for 循环:
filename = 'D:\\python_work\\chapter10\\pi_digits.txt'
with open(filename) as file_object:
    for line in file_object:
        print(line)
将要读取的文件的名称赋给变量 filename 。这是使用文件时的一种常见做法。变量 filename 表示的并非实际文件——它只是一个让Python知道到哪里去查找文件的字符串,因此可以轻松地将 'pi_digits.txt' 替换为要使用的另一个文件的名称。调用 open() 后,将一个表示文件及其内容的对象赋给了变量file_object 。这里也使用了关键字with ,让Python负责妥善地打开和关闭文件。为查看文件的内容,通过对文件对象执行循环来遍历文件中的每一行
打印每一行时,发现空白行:
3.1415926535

  8979323846

  2643383279
为何会出现这些空白行呢?因为在这个文件中,每行的末尾都有一个看不见的换行符,而函数调用 print() 也会加上一个换行符,因此每行末尾都有两个换行符:一个来自文件,另一个来自函数调用 print() 。要消除这些多余的空白行,可在函数调用 print() 中使用 rstrip()
filename = 'D:\\python_work\\chapter10\\pi_digits.txt'
with open(filename) as file_object:
    for line in file_object:
        print(line.rstrip())
现在,输出又与文件内容完全相同了:
3.1415926535
  8979323846
  2643383279

10.1.4 创建一个包含文件各行内容的列表

使用关键字 with 时, open() 返回的文件对象只在 with 代码块内可用。如果要在 with 代码块外访问文件的内容,可在 with 代码块内将文件的各行存储在一个列 表中,并在 with 代码块外使用该列表:可以立即处理文件的各个部分,也可以推迟到程序后面再处理。
下面的示例在 with 代码块中将文件pi_digits.txt的各行存储在一个列表中,再在with 代码块外打印:
filename = 'D:\\python_work\\chapter10\\pi_digits.txt'
with open(filename) as file_object:
    lines = file_object.readlines()

for line in lines:
    print(line.rstrip())
方法 readlines() 从文件中读取每一行,并将其存储在一个列表中。接下来,该列表被赋给变量 lines 。在 with 代码块外,依然可使用这个变量。 使用一个简单的 for 循环来打印 lines 中的各行。因为列表 lines 的每个元素都对应于文件中的一行,所以输出与文件内容完全一致。

10.1.5 使用文件的内容

将文件读取到内存中后,就能以任何方式使用这些数据了。下面以简单的方式使用圆周率的值。首先,创建一个字符串,它包含文件中存储的所有数字,且没有任何空格:
filename = 'D:\\python_work\\chapter10\\pi_digits.txt'
with open(filename) as file_object:
    lines = file_object.readlines()
pi_string = ''
for line in lines:
    pi_string += line.rstrip()

print(pi_string)
print(len(pi_string))
像前一个示例一样,首先打开文件,并将其中所有的行都存储在一个列表中。创建了一个变量 pi_string ,用于指向圆周率的值。接下来,使用一个循环将各行加入 pi_string ,并删除每行末尾的换行符 。打印这个字符串及其长度:
3.1415926535 8979323846 2643383279
36
变量 pi_string 指向的字符串包含原来位于每行左边的空格,为删除这些空格,可使用 strip() 而非 rstrip()
--snip--
for line in lines:
    pi_string += line.strip()
print(pi_string)
print(len(pi_string))
这样就获得了一个字符串,其中包含准确到30位小数的圆周率值。这个字符串长32字符,因为它还包含整数部分的3和小数点:
3.141592653589793238462643383279
32
注意         读取文本文件时,Python将其中的所有文本都解读为字符串。如果读取的是数,并要将其作为数值使用,就必须使用函数 int() 将其转换为整数或使用函数 float() 将其转换为浮点数。

 10.1.6 包含一百万位的大型文件

前面分析的都是一个只有三行的文本文件,但这些代码示例也可处理大得多的文件。如果我们有一个文本文件,其中包含精确到小数点后1 000 000位而不是30位的圆周率值,也可创建一个包含所有这些数字的字符串。为此,无须对前面的程序做任何修改,只要将这个文件传递给它即可。在这里,只打印到小数点后50位,以免终端为显示全部1 000 000位而不断滚动:
filename = 'pi_million_digits.txt'
with open(filename) as file_object:
    lines = file_object.readlines()

pi_string = ''
for line in lines:
    pi_string += line.strip()

print(f"{pi_string[:52]}...")
print(len(pi_string))
输出表明,创建的字符串确实包含精确到小数点后1 000 000位的圆周率值:
3.14159265358979323846264338327950288419716939937510...
1000002
对于可处理的数据量,Python没有任何限制。只要系统的内存足够多,你想处理多少数据都可以。

 10.1.7 练习

练习10-1:Python学习笔记

在文本编辑器中新建一个文件,写几句话来总结一下你至此学到的Python知识,其中每一行都以“In Python you can”打头。将这个文件命名为learning_python.txt,并存储到为完成本章练习而编写的程序所在的目录中。编写一个程序,它读取这个文件,并将你所写的内容打印三次:第一次打印时读取整个文件;第二次打印时遍历文件对象;第三次打印时将各行存储在一个列表中,再在 with 代码块外打印它们。
file_name = 'D:\\python_work\\chapter10\\practice10_1.txt'
with open(file_name) as file_object:
    print(file_object)
    lines = file_object.readlines()
    print(lines)

for line in lines:
    print(line.rstrip())

练习10-2:C语言学习笔记

可使用方法 replace() 将字符串中的特定单词都替换为另一个单词。下面是一个简单的示例,演示了如何将句子中的'dog'替换为 'cat'
file_name = 'D:\\python_work\\chapter10\\practice10_1.txt'
with open(file_name) as file_object:
    print(file_object)
    lines = file_object.readlines()
    print(lines)

for line in lines:
    line = line.rstrip()
    print(line.replace('python', 'C'))

10.2 写入文件

保存数据的最简单的方式之一是将其写入文件中。通过将输出写入文件,即便关闭包含程序输出的终端窗口,这些输出也依然存在:可以在程序结束运行后查看这些输出,可以与别人分享输出文件,还可以编写程序来将这些输出读取到内存中并进行处理。

10.2.1 写入空文件

要将文本写入文件,你在调用open() 时需要提供另一个实参,告诉Python你要写入打开的文件。为明白其中的工作原理,我们来将一条简单的消息存储到文件中,而不是将其打印到屏幕上:
filename = 'programming.txt'
# ❶
with open(filename, 'w') as file_object:
# ❷
    file_object.write("I love programming.")

在本例中,调用open() 时提供了两个实参(见❶)。第一个实参也是要打开的文件的名称。第二个实参('w' )告诉Python,要以写入模式 打开这个文件。打开文件时,可指定读取模式 'r' 写入模式 'w' 附加模式 'a' 读写模式 'r+' 。如果省略了模式实参,Python将以默认的只读模式打开文件。

如果要写入的文件不存在,函数 open() 将自动创建它。
然而,以写入模式('w')打开文件时千万要小心, 因为 如果指定的文件已经存在 Python将在返回文件对象前清空该文件的内容
处,使用文件对象的方法 write() 将一个字符串写入文件。这个程序没有终端输出,但如果打开文件programming.txt,将看到其中包含如下一行内容:
I love programming.
相比于计算机中的其他文件,这个文件没有什么不同。你可以打开它、在其中输入新文本、复制其内容、将内容粘贴到其中,等等。
注意         Python只能将字符串写入文本文件。要将数值数据存储到文本文件中,必须先使用函数 str() 将其转换为字符串格式。

10.2.2 写入多行 

函数 write() 不会在写入的文本末尾添加换行符,因此如果写入多行时没有指定换行符,文件看起来可能不是你希望的那样:
filename = 'programming.txt'
with open(filename, 'w') as file_object:
    file_object.write("I love programming.")
    file_object.write("I love creating new games.")
如果你打开programming.txt,将发现两行内容挤在一起:
I love programming.I love creating new games.
要让每个字符串都单独占一行,需要在方法调用 write() 中包含换行符:
filename = 'programming.txt'
with open(filename, 'w') as file_object:
    file_object.write("I love programming.\n")
    file_object.write("I love creating new games.\n")
现在,输出出现在不同的行中:
I love programming.
I love creating new games.
像显示到终端的输出一样,还可以使用空格、制表符和空行来设置这些输出的格式。

10.2.3 附加到文件

如果要给文件添加内容,而不是覆盖原有的内容,可以以附加模式打开文件。以附加模式打开文件时,Python不会在返回文件对象前清空文件的内容,而是将写入文件的行添加到文件末尾。如果指定的文件不存在,Python将为你创建一个空文件。下面来修改write_message.py,在既有文件programming.txt中再添加一些你酷爱编程的原因:
filename = 'programming.txt'

with open(filename, 'a') as file_object:
    file_object.write("I also love finding meaning in large datasets.\n")
    file_object.write("I love creating apps that can run in a browser.\n")
打开文件时指定了实参 'a' ,以便将内容附加到文件末尾,而不是覆盖文件原来的内容。 又写入了两行,它们被添加到文件programming.txt末尾:
I love programming.
I love creating new games.
I also love finding meaning in large datasets.
I love creating apps that can run in a browser.
最终的结果是,文件原来的内容还在,后面则是刚添加的内容

10.2.4 练习

练习10-3:访客

编写一个程序,提示用户输入名字。用户做出响应后,将其名字写入文件guest.txt中。
file_name = 'D:\\python_work\\chapter10\\guest.txt'
with open(file_name, 'a') as gu:
    print("you can quit any time if you input q")
    while True:
        x = input("please input your name:\n")
        if x == 'q':
            break
        else:
            gu.write(f"{x}\n")

练习10-4:访客名单

编写一个while 循环,提示用户输入名字。用户输入名字后,在屏幕上打印一句问候语,并将一条到访记录添加到文件guest_book.txt中。确保这个文件中的每条记录都独占一行。
file_name = 'D:\\python_work\\chapter10\\guest.txt'
with open(file_name, 'a') as gu:
    print("you can quit any time if you input q")
    while True:
        x = input("please input your name:\n")
        if x == 'q':
            break
        else:
            gu.write(f"{x}\n")

练习10-5:调查

编写一个 while 循环,询问用户为何喜欢编程。每当用户输入一个原因后,都将其添加到一个存储所有原因的文件中。
file_name_1 = "D:\\python_work\\chapter10\\guest_book.txt"
with open(file_name_1, 'a') as gu:
    print("you can quit any time if you input q")
    while True:
        x = input("please input your name:\n")
        if x == 'q':
            break
        else:
            gu.write(f"{x}\n")
            print(f"Good day!{x}")
file_name_2 = "D:\\python_work\\chapter10\\reasons.txt"
with open(file_name_2, 'a') as fu:
    print("you can quit any time if you input q")
    while True:
        x = input("why do you like progamme\n")
        if x == 'q':
            break
        else:
            fu.write(f"{x}\n")
            print(f"Good day!{x}")

10.3 异常

Python使用称为 异常 的特殊对象来管理程序执行期间发生的错误。每当发生让Python不知所措的错误时,它都会创建一个异常对象。如果你编写了处理该异常的代码,程序将继续运行;如果未对异常进行处理,程序将停止并显示traceback,其中包含有关异常的报告。
异常是使用 try-except 代码块处理的。 try-except 代码块让Python执行指定的操作,同时告诉Python发生异常时怎么办。使用try-except 代码块时,即便出现异常,程序也将继续运行:显示你编写的友好的错误消息,而不是令用户迷惑的traceback。

10.3.1 处理ZeroDivisionError 异常

下面来看一种导致Python引发异常的简单错误。你可能知道,不能用数除以0,但还是让Python这样做:
print(5/0)
显然,Python无法这样做,因此你将看到一个traceback:
 Traceback (most recent call last):
 File "division_calculator.py", line 1, in 
 print(5/0)
❶ ZeroDivisionError: division by zero
在上述traceback中,❶处指出的错误ZeroDivisionError 是个异常对象。Python无法按你的要求做时,就会创建这种对象。在这种情况下,Python将停止运行程序,并指出引发了哪种异常,而我们可根据这些信息对程序进行修改。下面来告诉Python,发生这种错误时怎么办。这样,如果再次发生此类错误,我们就有备无患了。

10.3.2 使用try-except 代码块

当你认为可能会发生错误时,可编写一个try-except 代码块来处理可能引发的异常。你让Python尝试运行一些代码,并告诉它如果这些代码引发了指定的异常该怎么办。
处理 ZeroDivisionError 异常的 try-except 代码块类似于下面这样:
try:
    print(5/0)
except ZeroDivisionError:
    print("You can't divide by zero!")
将导致错误的代码行 print(5/0) 放在一个 try 代码块中。如果 try 代码块中的代码运行起来没有问题,Python将跳过 except 代码块;如果 try 代码块中的代码导致了错误,Python将查找与之匹配的 except 代码块并运行其中的代码。
在本例中, try 代码块中的代码引发了 ZeroDivisionError 异常,因此Python查找指出了该怎么办的 except 代码块,并运行其中的代码。这样,用户看到的是一条友好的错误消息,而不是traceback:
You can't divide by zero!
如果 try-except 代码块后面还有其他代码,程序将接着运行,因为已经告诉了Python如何处理这种错误。下面来看一个捕获错误后程序继续运行的示例。

10.3.3 使用异常避免崩溃

发生错误时,如果程序还有工作尚未完成,妥善地处理错误就尤其重要。这种情况经常会出现在要求用户提供输入的程序中;如果程序能够妥善地处理无效输入,就能再提示用户提供有效输入,而不至于崩溃。
下面来创建一个只执行除法运算的简单计算器:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
# ❶
    first_number = input("\nFirst number: ")
    if first_number == 'q':
        break
# ❷
    second_number = input("Second number: ")
    if second_number == 'q':
        break
# ❸
    answer = int(first_number) / int(second_number)
    print(answer)
处,程序提示用户输入一个数,并将其赋给变量 first_number 。如果用户输入的不是表示退出的 q ,就再提示用户输入一个数,并将其赋给变量second_number (见 )。接下来,计算这两个数的商(见 ❸)。该程序没有采取任何处理错误的措施,因此在执行除数为0的除法运算时,它将崩溃:
Give me two numbers, and I'll divide them.
Enter 'q' to quit.
First number: 5
Second number: 0
Traceback (most recent call last):
 File "division_calculator.py", line 9, in 
 answer = int(first_number) / int(second_number)
ZeroDivisionError: division by zero
程序崩溃可不好,但让用户看到traceback也不是个好主意。不懂技术的用户会被搞糊涂,怀有恶意的用户还会通过traceback获悉你不想他知道的信息。例如,他将知道你的程序文件的名称,还将看到部分不能正确运行的代码。有时候,训练有素的攻击者可根据这些信息判断出可对你的代码发起什么样的攻击。

10.3.4 else 代码块

通过将可能引发错误的代码放在 try-except 代码块中,可提高程序抵御错误的能力。错误是执行除法运算的代码行导致的,因此需要将它放到 try-except 代码块中。这个示例还包含一个 else 代码块。依赖 try 代码块成功执行的代码都应放到else 代码块中:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
    first_number = input("\nFirst number: ")
    if first_number == 'q':
        break
    second_number = input("Second number: ")
    if second_number == 'q':
        break
    try:
        answer = int(first_number) / int(second_number)
    except ZeroDivisionError:
        print("You can't divide by 0!")
    else:
        print(answer)
让Python尝试执行 try 代码块中的除法运算,这个代码块只包含可能导致错误的代码。依赖 try 代码块成功执行的代码都放在 else 代码块中。在本例中,如果除法运算成功,就使用 else 代码块来打印结果。except 代码块告诉Python,出现 ZeroDivisionError 异常时该如何办。如果 try 代码块因除零错误而失败,就打印一条友好的消息,告诉用户如何避免这种错误。程序继续运行,用户根本看不到traceback:
Give me two numbers, and I'll divide them.
Enter 'q' to quit.
First number: 5
Second number: 0
You can't divide by 0!
First number: 5
Second number: 2
2.5
First number: q
try-except-else 代码块的工作原理大致如下。Python尝试执行 try 代码块中的代码,只有可能引发异常的代码才需要放在 try 语句中。有时候,有一些仅在try代码块成功执行时才需要运行的代码,这些代码应放在 else 代码块中。except代码块告诉Python,如果尝试运行 try 代码块中的代码时引发了指定的异常该怎么办。
通过预测可能发生错误的代码,可编写健壮的程序。它们即便面临无效数据或缺少资源,也能继续运行,从而抵御无意的用户错误和恶意的攻击。

10.3.5 处理FileNotFoundError 异常

使用文件时,一种常见的问题是找不到文件:查找的文件可能在其他地方,文件名可能不正确,或者这个文件根本就不存在。对于所有这些情形,都可使用try-except 代码块以直观的方式处理。
我们来尝试读取一个不存在的文件。下面的程序尝试读取文件alice.txt的内容,但该文件没有存储在alice.py所在的目录中:
filename = 'alice.txt'

with open(filename, encoding='utf-8') as f:
    contents = f.read()
相比于本章前面的文件打开方式,这里有两个不同之处。一是使用变量 f 来表示文件对象,这是一种常见的做法。二是给参数 encoding 指定了值,在系统的默认编码与要读取文件使用的编码不一致时,必须这样做。
Python无法读取不存在的文件,因此它引发一个异常:
Traceback (most recent call last):
 File "alice.py", line 3, in 
 with open(filename, encoding='utf-8') as f:
FileNotFoundError: [Errno 2] No such file or directory: 'alice.txt'
上述traceback的最后一行报告了 FileNotFoundError 异常,这是Python找不到要打开的文件时创建的异常。在本例中,这个错误是函数 open() 导致的。因此,要处理这个错误,必须将 try 语句放在包含 open() 的代码行之前:
filename = 'alice.txt'
try:
    with open(filename, encoding='utf-8') as f:
        contents = f.read()
except FileNotFoundError:
    print(f"Sorry, the file {filename} does not exist.")
在本例中, try 代码块引发了 FileNotFoundError 异常,因此Python找到与该错误匹配的 except 代码块,并运行其中的代码。最终的结果是显示一条友好的错误消息,而不是traceback:
Sorry, the file alice.txt does not exist.
如果文件不存在,这个程序就什么都做不了,错误处理代码也意义不大。下面来扩展这个示例,看看在你使用多个文件时,异常处理可提供什么样的帮助。

10.3.6 分析文本

你可以分析包含整本书的文本文件。很多经典文学作品都是简单以文本文件的形式提供的,因为它们不受版权限制。本节使用的文本来自古登堡计划,该计划提供了一系列不受版权限制的文学作品。如果你要在编程项目中使用文学文本,这是一个很不错的资源。
下面来提取童话《爱丽丝漫游奇境记》( Alice in Wonderland )的文本,并尝试计算它包含多少个单词。我们将使用方法 split() ,它能根据一个字符串创建一个单词列表。下面是对只包含童话名 "Alice in Wonderland" 的字符串调用方法split() 的结果:
>>> title = "Alice in Wonderland"
>>> title.split()
['Alice', 'in', 'Wonderland']
方法split() 以空格为分隔符将字符串分拆成多个部分,并将这些部分都存储到一个列表中。结果是一个包含字符串中所有单词的列表,虽然有些单词可能包含标点。为计算《爱丽丝漫游奇境记》包含多少个单词,我们将对整篇小说调用split() ,再计算得到的列表包含多少个元素,从而确定整篇童话大致包含多少个单词:
filename = 'alice.txt'
try:
    with open(filename, encoding='utf-8') as f:
        contents = f.read()
except FileNotFoundError:
    print(f"Sorry, the file {filename} does not exist.")
else:
    # 计算该文件大致包含多少个单词。
❶    words = contents.split()
❷    num_words = len(words)
❸    print(f"The file {filename} has about {num_words} words.")
我们将文件alice.txt移到了正确的目录中,让 try 代码块能够成功执行。在 ❶处,对变量 contents (它现在是一个长长的字符串,包含童话《爱丽丝漫游奇境记》的全部文本)调用方法 split() ,以生成一个列表,其中包含这部童话中的所有单词。使用 len() 来确定这个列表的长度时,就能知道原始字符串大致包含多少个单词了(见 )。在 ❸处,打印一条消息,指出文件包含多少个单词。这些代码都放在else 代码块中,因为仅当 try 代码块成功执行时才执行它们。输出指出了文件
alice.txt包含多少个单词:
The file alice.txt has about 29465 words.
这个数稍大一点,因为使用的文本文件包含出版商提供的额外信息,但还是成功估算出了童话《爱丽丝漫游奇境记》的篇幅。

10.3.7 使用多个文件

下面多分析几本书。这此之前,先将这个程序的大部分代码移到一个名为count_words() 的函数中。这样,对多本书进行分析时将更容易:
def count_words(filename):
    """计算一个文件大致包含多少个单词。"""
    try:
        with open(filename, encoding='utf-8') as f:
            contents = f.read()
    except FileNotFoundError:
        print(f"Sorry, the file {filename} does not exist.")
    else:
        words = contents.split()
        num_words = len(words)
        print(f"The file {filename} has about {num_words} words.")
filename = 'alice.txt'
count_words(filename)
这些代码大多与原来一样,只是移到了函数count_words() 中,并增加了缩进量。修改程序的同时更新注释是个不错的习惯,因此我们将注释改成文档字符串,并稍微调整了一下措辞
现在可以编写一个简单的循环,计算要分析的任何文本包含多少个单词了。为此,将要分析的文件的名称存储在一个列表中,然后对列表中的每个文件调用count_words() 。我们将尝试计算《爱丽丝漫游奇境记》《悉达多》( Siddhartha )、《白鲸》( Moby Dick )和《小妇人》( Little Women )分别包含多少个单词,它们都不受版权限制。我故意没有将siddhartha.txt放到word_count.py所在的目录中,从而展示该程序在文件不存在时应对得有多出色:
def count_words(filename):
    --snip--

filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
    count_words(filename)
文件siddhartha.txt不存在,但这丝毫不影响该程序处理其他文件:
The file alice.txt has about 29465 words.
Sorry, the file siddhartha.txt does not exist.
The file moby_dick.txt has about 215830 words.
The file little_women.txt has about 189079 words.
在本例中,使用try-except 代码块提供了两个重要的优点:避免用户看到traceback,以及让程序继续分析能够找到的其他文件。如果不捕获因找不到siddhartha.txt而引发的FileNotFoundError 异常,用户将看到完整的traceback,而程序将在尝试分析《悉达多》后停止运行。它根本不会分析《白鲸》和《小妇人》。

10.3.8 静默失败

在前一个示例中,我们告诉用户有一个文件找不到。但并非每次捕获到异常都需要告诉用户,有时候你希望程序在发生异常时保持静默,就像什么都没有发生一样继续运行。要让程序静默失败,可像通常那样编写 try 代码块,但在 except 代码块中明确地告诉Python什么都不要做。Python有一个 pass 语句,可用于让Python在代码块中什么都不要做:
def count_words(filename):
    """计算一个文件大致包含多少个单词。"""
    try:
        with open(filename, encoding='utf-8') as f:
            contents = f.read()
    except FileNotFoundError:
        pass
    else:
        words = contents.split()
        num_words = len(words)
        print(f"The file {filename} has about {num_words} words.")
filename = 'alice.txt'
count_words(filename)
--snip--
相比于前一个程序,这个程序唯一的不同之处是 pass 语句。现在,出现FileNotFoundError 异常时,将执行 except 代码块中的代码,但什么都不会发生。这种错误发生时,不会出现traceback,也没有任何输出。用户将看到存在的每个文件包含多少个单词,但没有任何迹象表明有一个文件未找到:
The file alice.txt has about 29465 words.
The file moby_dick.txt has about 215830 words.
The file little_women.txt has about 189079 words.
pass 语句还充当了占位符,提醒你在程序的某个地方什么都没有做,并且以后也许要在这里做些什么。例如,在这个程序中,我们可能决定将找不到的文件的名称写入文件missing_files.txt中。用户看不到这个文件,但我们可以读取它,进而处理所有找不到文件的问题。

10.3.9 决定报告哪些错误

该在什么情况下向用户报告错误?又该在什么情况下静默失败呢?如果用户知道要分析哪些文件,他们可能希望在有文件却没有分析时出现一条消息来告知原因。如果用户只想看到结果,并不知道要分析哪些文件,可能就无须在有些文件不存在时告知他们。向用户显示他不想看到的信息可能会降低程序的可用性。Python的错误处理结构让你能够细致地控制与用户分享错误信息的程度,要分享多少信息由你决定。
编写得很好且经过详尽测试的代码不容易出现内部错误,如语法或逻辑错误,但只要程序依赖于外部因素,如用户输入、存在指定的文件、有网络链接,就有可能出现异常。凭借经验可判断该在程序的什么地方包含异常处理块,以及出现错误时该向用户提供多少相关的信息。

10.3.10 练习

练习10-6:加法运算

提示用户提供数值输入时,常出现的一个问题是,用户提供的是文本而不是数。在此情况下,当你尝试将输入转换为整数时,将引发ValueError 异常。编写一个程序,提示用户输入两个数,再将其相加并打印结果。在用户输入的任何一个值不是数时都捕获ValueError 异常,并打印一条友好的错误消息。对你编写的程序进行测试:先输入两个数,再输入一些文本而不是数。
print("please input two numbers:")
while True:
    a = input("please input the first number:\n")
    try:
        a = int(a)
    except ValueError:
        print("please input numbers!not text!")
    else:
        break
while True:
    b = input("please input the second number:\n")
    try:
        b = int(b)
    except ValueError:
        print("please input numbers!not text!")
    else:
        break
print(a + b)

练习10-7:加法计算器

将为完成练习10-6而编写的代码放在一个 while 循环中,让用户犯错(输入的是文本而不是数)后能够继续输入数。
print("please input two numbers:")
while True:
    a = input("please input the first number:\n")
    try:
        a = int(a)
    except ValueError:
        print("please input numbers!not text!")
    else:
        break
while True:
    b = input("please input the second number:\n")
    try:
        b = int(b)
    except ValueError:
        print("please input numbers!not text!")
    else:
        break
print(a + b)

练习10-8:猫和狗

创建文件cats.txt和dogs.txt,在第一个文件中至少存储三只猫的名字,在第二个文件中至少存储三条狗的名字。编写一个程序,尝试读取这些文件,并将其内容打印到屏幕上。将这些代码放在一个try-except代码块中,以便在文件不存在时捕获 FileNotFound 错误,并显示一条友好的消息。将任意一个文件移到另一个地方,并确认 except 代码块中的代码将正确执行。
file_name_1 = 'D:\\python_work\\chapter10\\cats.txt'
file_name_2 = 'D:\\python_work\\chapter10\\dogs.txt'
try:
    with open(file_name_1, 'r') as ca:
        cats_lines = ca.readlines()
        for cat_line in cats_lines:
            print(cat_line.rstrip())
except FileNotFoundError:
    print(f"Sorry, the file {file_name_1} does not exist.")
try:
    with open(file_name_2, 'r') as do:
        dogs_lines = do.readlines()
        for dog_line in dogs_lines:
            print(dog_line.rstrip())
except FileNotFoundError:
    print(f"Sorry, the file {file_name_2} does not exist.")

练习10-9:静默的猫和狗

修改你在练习10-8中编写的 except 代码块,让程序在任意文件不存在时静默失败。
file_name_1 = 'D:\\python_work\\chapter10\\cats.txt'
file_name_2 = 'D:\\python_work\\chapter10\\dogs.txt'
try:
    with open(file_name_1, 'r') as ca:
        cats_lines = ca.readlines()
        for cat_line in cats_lines:
            print(cat_line.rstrip())
except FileNotFoundError:
    pass
try:
    with open(file_name_2, 'r') as do:
        dogs_lines = do.readlines()
        for dog_line in dogs_lines:
            print(dog_line.rstrip())
except FileNotFoundError:
    pass

练习10-10:常见单词

访问古登堡计划,找一些你想分析的图书。下载这些作品的文本文件或将浏览器中的原始文本复制到文本文件中。
可以使用方法 count() 来确定特定的单词或短语在字符串中出现了多少次。例如,下面的代码计算 'row' 在一个字符串中出现了多少次:
>>> line = "Row, row, row your boat"
>>> line.count('row')
2
>>> line.lower().count('row')
3
请注意,通过使用 lower() 将字符串转换为小写,可捕捉要查找单词的所有格式,而不管其大小写如何。
编写一个程序,它读取你在古登堡计划中获取的文件,并计算单词'the' 在每个文件中分别出现了多少次。这里计算得到的结果并不准确,因为将诸如 'then' 'there' 等单词也计算在内了。请尝试计算 'the ' (包含空格)出现的次数,看看结果相差多少。
代码略
古登堡计划链接icon-default.png?t=M7J4https://www.gutenberg.org/

10.4 存储数据

很多程序都要求用户输入某种信息,如让用户存储游戏首选项或提供要可视化的数据。不管关注点是什么,程序都把用户提供的信息存储在列表和字典等数据结构中。用户关闭程序时,几乎总是要保存他们提供的信息。一种简单的方式是使用模块 json 来存储数据。
模块 json 让你能够将简单的Python数据结构转储到文件中,并在程序再次运行时加载该文件中的数据。你还可以使用json 在Python程序之间分享数据。更重要的是,JSON数据格式并非Python专用的,这让你能够将以JSON格式存储的数据与使用其他编程语言的人分享。这是一种轻便而有用的格式,也易于学习。
注意         JSON(JavaScript Object Notation)格式最初是为JavaScript开发的,但随后成了一种常见格式,被包括Python在内的众多语言采用。

 10.4.1 使用json.dump() json.load()

我们来编写一个存储一组数的简短程序,再编写一个将这些数读取到内存中的程序。第一个程序将使用 json.dump() 来存储这组数,而第二个程序将使用json.load()
函数 json.dump() 接受两个实参:要存储的数据,以及可用于存储数据的文件对象。下面演示了如何使用 json.dump() 来存储数字列表:
import json
numbers = [2, 3, 5, 7, 11, 13]
#❶
filename = 'numbers.json'
#❷
with open(filename, 'w') as f:
#❸
    json.dump(numbers, f)
先导入模块 json ,再创建一个数字列表。在❶处,指定了要将该数字列表存储到哪个文件中。通常使用文件扩展名.json来指出文件存储的数据为JSON格式。接下来,以写入模式打开这个文件,让 json 能够将数据写入其中(见 )。在 ❸处,使用函数 json.dump() 将数字列表存储到文件numbers.json中。
这个程序没有输出,但可以打开文件numbers.json来看看内容。数据的存储格式与Python中一样:
[2, 3, 5, 7, 11, 13]

下面再编写一个程序,使用json.load() 将列表读取到内存中:  

import json
#❶
filename = 'numbers.json'
#❷
with open(filename) as f:
#❸
    numbers = json.load(f)
print(numbers)
❶处,确保读取的是前面写入的文件。这次以读取方式打开该文件,因为Python只需要读取它(见 )。在 处,使用函数 json.load() 加载存储在numbers.json中的信息,并将其赋给变量 numbers 。最后,打印恢复的数字列表,看看是否与number_writer.py中创建的数字列表相同:
[2, 3, 5, 7, 11, 13]
这是一种在程序之间共享数据的简单方式。

10.4.2 保存和读取用户生成的数据

使用json 保存用户生成的数据大有裨益,因为如果不以某种方式存储,用户的信息会在程序停止运行时丢失。下面来看一个这样的例子:提示用户首次运行程序时输入自己的名字,并在再次运行程序时记住他。
先来存储用户的名字:
 import json
❶
 username = input("What is your name? ")
 filename = 'username.json'
 with open(filename, 'w') as f:
❷    json.dump(username, f)
❸    print(f"We'll remember you when you come back, {username}!")
处,提示输入用户名并将其赋给一个变量。接下来,调用 json.dump() ,并将用户名和一个文件对象传递给它,从而将用户名存储到文件中(见 ❷)。然后,打印一条消息,指出存储了用户输入的信息(见 ):
What is your name? Eric
We'll remember you when you come back, Eric!
现在再编写一个程序,向已存储了名字的用户发出问候:
import json
filename = 'username.json'
with open(filename) as f:
❶    username = json.load(f)
❷    print(f"Welcome back, {username}!")
处,使用 json.load() 将存储在username.json中的信息读取到变量username 中。恢复用户名后,就可以欢迎用户回来了(见 ):
Welcome back, Eric!
需要将这两个程序合并到一个程序(remember_me.py)中。这个程序运行时,将尝试从文件username.json中获取用户名。因此,首先编写一个尝试恢复用户名的try代码块。如果这个文件不存在,就在 except 代码块中提示用户输入用户名,并将其存储到username.json中,以便程序再次运行时能够获取:
  import json
 # 如果以前存储了用户名,就加载它。
 # 否则,提示用户输入用户名并存储它。
 filename = 'username.json'
  try:
❶     with open(filename) as f:
❷         username = json.load(f)
❸ except FileNotFoundError:
❹     username = input("What is your name? ")
❺     with open(filename, 'w') as f:
         json.dump(username, f)
         print(f"We'll remember you when you come back, {username}!")
  else:
      print(f"Welcome back, {username}!")
这里没有任何新代码,只是将前两个示例的代码合并到了一个程序中。在❶处,尝试打开文件username.json。如果该文件存在,就将其中的用户名读取到内存中(见❷ ),再执行 else 代码块,打印一条欢迎用户回来的消息。用户首次运行该程序 时,文件username.json不存在,将引发 FileNotFoundError 异常(见 ❸)。因此Python将执行 except 代码块,提示用户输入用户名(见 ❹),再使用json.dump() 存储该用户名并打印一句问候语(见 ❺)。
无论执行的是 except 还是 else 代码块,都将显示用户名和合适的问候语。如果这个程序是首次运行,输出将如下:
What is your name? Eric
We'll remember you when you come back, Eric!
否则,输出将如下:
Welcome back, Eric!

10.4.3 重构

你经常会遇到这样的情况:代码能够正确地运行,但通过将其划分为一系列完成具体工作的函数,还可以改进。这样的过程称为 重构 。重构让代码更清晰、更易于理解、更容易扩展。
要重构remember_me.py,可将其大部分逻辑放到一个或多个函数中。remember_me.py的重点是问候用户,因此将其所有代码都放到一个名为greet_user() 的函数中:
import json
def greet_user():
#❶
    """问候用户,并指出其名字。"""
    filename = 'username.json'
    try:
        with open(filename) as f:
            username = json.load(f)
    except FileNotFoundError:
        username = input("What is your name? ")
        with open(filename, 'w') as f:
            json.dump(username, f)
        print(f"We'll remember you when you come back, {username}!")
    else:
        print(f"Welcome back, {username}!")
greet_user()
考虑到现在使用了一个函数,我们删除原注释,转而使用一个文档字符串来指出程序的作用(见 )。这个程序更加清晰,但函数greet_user() 所做的不仅仅是问候用户,还在存储了用户名时获取它、在没有存储用户名时提示用户输入。
下面来重构 greet_user() ,减少其任务。为此,首先将获取已存储用户名的代码移到另一个函数中:
import json
def get_stored_username():
# ❶
    """如果存储了用户名,就获取它。"""
    filename = 'username.json'
    try:
        with open(filename) as f:
            username = json.load(f)
    except FileNotFoundError:
# ❷
        return None
    else:
        return username

def greet_user():
    """问候用户,并指出其名字。"""
    username = get_stored_username()
# ❸
    if username:
        print(f"Welcome back, {username}!")
    else:
        username = input("What is your name? ")
        filename = 'username.json'
        with open(filename, 'w') as f:
            json.dump(username, f)
            print(f"We'll remember you when you come back, {username}!")
greet_user()
新增的函数 get_stored_username() 目标明确,❶处的文档字符串指出了这一点。如果存储了用户名,该函数就获取并返回它;如果文件username.json不存在,该函数就返回 None (见 ❷)。这是一种不错的做法:函数要么返回预期的值,要么返回 None 。这让我们能够使用函数的返回值做简单的测试。在 ❸处,如果成功地获取了用户名,就打印一条欢迎用户回来的消息,否则提示用户输入用户名。
还需要重构 greet_user() 中的另一个代码块,将没有存储用户名时提示用户输入的代码放在一个独立的函数中:
import json
def get_stored_username():
    """如果存储了用户名,就获取它。"""
    --snip--
def get_new_username():
    """提示用户输入用户名。"""
    username = input("What is your name? ")
    filename = 'username.json'
    with open(filename, 'w') as f:
        json.dump(username, f)
    return username

def greet_user():
    """问候用户,并指出其名字。"""
    username = get_stored_username()
    if username:
        print(f"Welcome back, {username}!")
    else:
        username = get_new_username()
    print(f"We'll remember you when you come back, {username}!")
greet_user()
在remember_me.py的这个最终版本中,每个函数都执行单一而清晰的任务。我们调用 greet_user() ,它打印一条合适的消息:要么欢迎老用户回来,要么问候新用户。为此,它首先调用 get_stored_username() ,该函数只负责获取已存储的用户名(如果存储了的话)。最后在必要时调用get_new_username() ,该函数只负责获取并存储新用户的用户名。要编写出清晰而易于维护和扩展的代码,这种划分必不可少。

10.4.4 练习

练习10-11:喜欢的数

编写一个程序,提示用户输入喜欢的数,并使用json.dump() 将这个数存储到文件中。再编写一个程序,从文件中读取这个值,并打印如下所示的消息。
I know your favorite number! It's _____.
import json

file_name = 'favorite_numbers.json'


def get_stored_numbers():
    """如果存储了数字,就想用户展示他"""
    try:
        with open(file_name, 'r') as fn:
            favorite_num = json.load(fn)
    except FileNotFoundError:
        return None
    else:
        return favorite_num


def greet_user():
    """greet user"""
    favorite_num = get_stored_numbers()
    if favorite_num:
        print(f"I know your favorite number! It's {favorite_num}")
    else:
        favorite_num = input("what your favorite numbers:\n")
        with open(file_name, 'w') as f:
            json.dump(favorite_num, f)
            print(f"We'll remember you when you come back, {favorite_num}!")


greet_user()

练习10-12:记住喜欢的数

将练习10-11中的程序合二为一。如果存储了用户喜欢的数,就向用户显示它,否则提示用户输入喜欢的数并将其存储到文件中。运行这个程序两次,看看它能否像预期的那样工作。
# 见练习10-11

练习10-13:验证用户

最后一个remember_me.py版本假设用户要么已输入用户名,要么是首次运行该程序。我们应该修改这个程序,以防当前用户并非上次运行该程序的用户。
为此,在 greet_user() 中打印欢迎用户回来的消息前,询问他用户名是否正确。如果不对,就调用 get_new_username() 让用户输入正确的用户名。
--snip--

def certify_user():
    """验证用户名是否正确"""
    print(f"Are you {get_stored_username()}?")
    x = input("input 'yes' or 'no'\n")
    if x == 'yes':
        greet_user()
    else:
        get_new_username()


certify_user()

你可能感兴趣的:(习题,python,开发语言)