我感觉这样记录,对于我来说挺好的。因为我看两端对齐的语句容易走神,这样记录阅读的话,就很少出现之前的情况。
我写的初衷,也是自己来看,所以感觉写的不好的,请保留下意见,谢谢。
代码缩进情况,字体重复情况,因为我能看懂,就没改。
里面的每一个字我都看过,加粗 括号 下划线 等均是我的笔记。
第10章 文件和异常
至此,你掌握了编写组织有序而易于使用的程序所需的基本技能,该考虑让程序目标更明确、用途更大了。在本章中,你将学习处理文件,让程序能够快速地分析大
量的数据;你将学习错误处理,避免程序在面对意外情形时崩溃;你将学习异
常 ,它们是
Python
创建的特殊对象,用于管理程序运行时出现的错误;你还将学习模
块
json
,它让你能够保存用户数据,以免在程序停止运行后丢失。
学习处理文件和保存数据可让你的程序使用起来更容易:用户将能够选择输入什么样的数据,以及在什么时候输入;用户使用你的程序做一些工作后,可将程序关
闭,以后再接着往下做。学习处理异常可帮助你应对文件不存在的情形,以及处理其他可能导致程序崩溃的问题。这让你的程序在面对错误的数据时更健壮
——
不管
这些错误数据源自无意的错误,还是源自破坏程序的恶意企图。你在本章学习的技能可提高程序的适用性、可用性和稳定性。
10.1 从文件中读取数据
文本文件可存储的数据量多得难以置信:天气数据、交通数据、社会经济数据、文学作品等。每当需要分析或修改存储在文件中的信息时,读取文件都很有用,对数据分析应用
程序来说尤其如此。例如,你可以编写一个这样的程序:读取一个文本文件的内容,重新设置这些数据的格式并将其写入文件,让浏览器能够显示这些内容。
要使用文本文件中的信息,首先需要将信息读取到内存中。为此,你可以一次性读取文件的全部内容,也可以以每次一行的方式逐步读取。
10.1.1 读取整个文件
要读取文件,需要一个包含几行文本的文件。下面首先来创建一个文件,它包含精确到小数点后
30
位的圆周率值,且在小数点后每
10
位处都换行:
pi_digits.txt
3.1415926535
8979323846
2643383279
要动手尝试后续示例,可在编辑器中输入这些数据行,再将文件保存为
pi_digits.txt。
然后,将该
文件保存到本章程序所在的目录中。
下面的程序打开并读取这个文件,再将其内容显示到屏幕上:
file_reader.py
with open('pi_digits.txt') as file_object:
contents = file_object.read()
print(contents)
在这个程序中,第
1
行代码做了大量的工作。我们先来看看函数
open()
。要以任何方式使用文件
——
哪怕仅仅是打印其内容,都得先打
开 文件,这样才能访问它。函数
open()
接受一个参数:要打开的文件的名称。
Python
在当前执行的文件所在的目录中查找指定的文件。在这个示例中,当前运行的是
file_reader.py
,因此
Python
在
file_reader.py
所在的目录中
查找
pi_digits.txt
。函数
open()
返回一个表示文件的对象。
在这里,open('pi_digits.txt') 返回一个表示文件pi_digits.txt 的对象;Python将这个对象存储在我们将
在后面使用的变量中。
关键字with 在不再需要访问文件后将其关闭。
在这个程序中,注意到我们调用了
open()
,但没有调用
close()
;
你也可以调用open() 和close() 来打开和关闭文件,但
这样做时,如果程序存在bug,导致close() 语句未执行,文件将不会关闭。这看似微不足道,但未妥善地关闭文件可能会导致数据丢失或受损。如果在程序中过早地调
用close() ,你会发现需要使用文件时它已关
闭 (无法访问),这会导致更多的错误。
并非在任何情况下都能轻松确定关闭文件的恰当时机,但通过使用前面所示的结构,可
让
Python
去确定:
你只管打开文件,并在需要时使用它,Python自会在合适的时候自动将其关闭。
有了表示
pi_digits.txt
的文件对象后,我们使用方法
read()
(前述程序的第
2
行)读取这个文件的全部内容,并将其作为一个长长的字符串存储在变量
contents
中。这样,通过
打印
contents
的值,就可将这个文本文件的全部内容显示出来:
3.1415926535
8979323846
2643383279
#我这里写的代码 直接在命令行敲的。但是没有发现作者所说的最后一行多了个空行这样的问题。
>>> import os
>>> os.getcwd()
'C:\\Users\\42152'
>>> with open('111.txt') as file_object:
... contents=file_object.read()
... print(contents)
...
3.14
15
92
65
3
>>> print(contents.rstrip())
3.14
15
92
65
3
>>> contents
'3.14\n15\n92\n65\n3'
>>> contents.rstrip()
'3.14\n15\n92\n65\n3'
>>> print(file_object.read())
Traceback (most recent call last):
File "", line 1, in
ValueError: I/O operation on closed file.
我经过测试还发现了:
>>> with open('111.txt'):
... print(open('111.txt').read())
... print('I love china')
...
3.14
15
92
6
I love china
>>> with open('111.txt') as file_object:
... print(file_object.read())
... print('I love china')
...
3.14
15
92
6
I love china
由此可以看出来,这个with语句不是for循环,只起到不用即关(文件)的作用,read()函数可以逐行一次性读完文件内容。
相比于原始文件,该输出唯一不同的地方是末尾多了一个空行。为何会多出这个空行呢?因为
read()
到达文件末尾时返回一个空字符串,而将这个空字符串显示出来时就是一
个空行。要删除多出来的空行,可在
print 语句中使用rstrip() :
with open('pi_digits.txt') as file_object:
contents = file_object.read()
print(contents.rstrip())
本书前面说过,Python方法rstrip()
删除(剥除)字符串末尾的空白。现在,输出与原始文件的内容完全相同:
3.1415926535
8979323846
2643383279
10.1.2 文件路径
当你将类似
pi_digits.txt
这样的简单文件名传递给函数
open()
时,
Python将在当前执行的文件(即.py程序文件)所在的目录中查找文件。
根据你组织文件的方式,有时可能要打开不在程序文件所属目录中的文件。例如,你可能将程序文件存储在了文件夹
python_work
中,(笔者的意思是此文件夹与该程序文件所处同一目录)而在文件夹
python_work
中,有一个名为
text_files
的文件夹,用于存储程序文件操作的文本文件。虽然文件夹
text_files
包含在文件夹
python_work
中,但仅向
open()
传递位于该文件夹中的文件的名称也不可行,因为
Python
只在文件夹
python_work
中查找,而不会在其子文件夹
text_files
中查找。要让
Python
打开不与程序文件位于同一个目录中的文件,需要提供文件路径
件路
径 ,它让
Python
到系统的特定位置
去查找。
由于文件夹
text_files
位于文件夹
python_work
中,因此可使用相
对文
件
路 径来打开该文件夹中的文件。相对文件路径让
Python
到指定的位置去查找,而该位置是相对于当前运行的程
序所在目录的。在
Linux和OS X
中,你可以这样编写代码:
with open('text_files/filename.txt') as file_object:
这行代码让
Python
到文件夹
python_work
下的文件夹
text_files
中去查找指定的
.txt
文件。在
Windows
系统中,在文件路径中使用反斜杠(
\
)而不是斜杠(
/
):
with open('text_files\filename.txt') as file_object:
你还可以将文件在计算机中的准确位置告诉
Python
,这样就不用关心当前运行的程序存储在什么地方了。这称为绝
对文
件路
径 。在相对路径行不通时,可使用绝对路径。例如,
如果
text_files
并不在文件夹
python_work
中,而在文件夹
other_files
中,则向
open()
传递路径
'text_files/ filename.txt'
行不通,因为
Python
只在文件夹
python_work
中查找
该位置。为明确地指出你希望
Python
到哪里去查找,你需要提供完整的路径。
绝对路径通常比相对路径更长,因此将其存储在一个变量中,再将该变量传递给
open()
会有所帮助。在
Linux
和
OS X
中,绝对路径类似于下面这样:
file_path = '/home/ehmatthes/other_files/text_files/filename.txt'
with open(file_path) as file_object:
而在
Windows
系统中,它们类似于下面这样:
file_path = 'C:\Users\ehmatthes\other_files\text_files\filename.txt'
with open(file_path) as file_object:
通过使用绝对路径,可读取系统任何地方的文件。就目前而言,最简单的做法是,要么将数据文件存储在程序文件所在的目录,要么将其存储在程序文件所在目录下的一个文件
夹(如text_files)中。
注
意
Windows系统有时能够正确地解读文件路径中的斜杠。如果你使用的是Windows系统,且结果不符合预期,请确保在文件路径中使用的是反斜杠。
10.1.3 逐行读取
读取文件时,常常需要检查其中的每一行:你可能要在文件中查找特定的信息,或者要以某种方式修改文件中的文本。例如,你可能要遍历一个包含天气数据的文件,并使用天
气描述中包含字样
sunny
的行。在新闻报道中,你可能会查找包含标签
的行,并按特定的格式设置它。
要以每次一行的方式检查文件,可对文件对象使用
for
循环:
file_reader.py
❶
filename = 'pi_digits.txt'
❷
with open(filename) as file_object:
❸
for line in file_object:
print(line)
>>> with open('111.txt') as f2:
... for line in f2:
... print(f2)
... print(line)
...
<_io.TextIOWrapper name='111.txt' mode='r' encoding='cp936'>
3.14
<_io.TextIOWrapper name='111.txt' mode='r' encoding='cp936'>
15
<_io.TextIOWrapper name='111.txt' mode='r' encoding='cp936'>
92
<_io.TextIOWrapper name='111.txt' mode='r' encoding='cp936'>
6
在
❶
处,我们将要读取的文件的名称存储在变量
filename
中,这是使用文件时一种常见的做法。由于变量
filename
表示的并非实际文件
——
它只是一个让
Python
知道到哪里
>>> with open('111.txt') as f1:
... print(f1)
...
<_io.TextIOWrapper name='111.txt' mode='r' encoding='cp936'>
去查找文件的字符串,因此可轻松地将
'pi_digits.txt'
替换为你要使用的另一个文件的名称。调用
open()
后,将一个表示文件及其内容的对象存储到了变
量
file_object
中(见
❷
)。这里也使用了关键字
with ,让Python
负责妥善地打开和关闭文件。为查看文件的内容,我们通过对文件对象执行循环来遍历文件中的每一行(见
❸
)。
我们打印每一行时,发现空白行更多了:
3.1415926535
8979323846
2643383279
为何会出现这些空白行呢?因为在这个文件中,每行的末尾都有一个看不见的换行符,而
print 语句也会加上一个换行符,因此每行末尾都有两个换行符:一个来自文件,另一
个来自print 语句。要消除这些多余的空白行,可在print 语句中使用rstrip() :
filename = 'pi_digits.txt'
with open(filename) as file_object:
for line in file_object:
print(line.rstrip())
现在,输出又与文件内容完全相同了:
3.1415926535
8979323846
2643383279
10.1.4 创建一个包含文件各行内容的列表
使用关键字
with
时,
open() 返回的文件对象只在with 代码块内可用。
如果要在
with
代码块外访问文件的内容,可在
with
代码块内将文件的各行存储在一个列表中,并
在
with
代码块外使用该列表:你可以立即处理文件的各个部分,也可推迟到程序后面再处理。
下面的示例在
with
代码块中将文件
pi_digits.txt
的各行存储在一个列表中,再在
with
代码块外打印它们:
filename = 'pi_digits.txt'
with open(filename) as file_object:
❶
lines = file_object.readlines()
❷
for line in lines:
print(line.rstrip())
❶处的方法readlines()
从文件中读取每一行,并将其存储在一个列表中;接下来,该列表被存储到变量
lines
中;在
with
代码块外,我们依然可以使用这个变量。在
❷
处,我们使用一个简单的
for
循环来打印
lines
中的各行。由于列表
lines
的每个元素都对应于文件中的一行,因此输出与文件内容完全一致。
10.1.5 使用文件的内容
将文件读取到内存中后,就可以以任何方式使用这些数据了。下面以简单的方式使用圆周率的值。首先,我们将创建一个字符串,它包含文件中存储的所有数字,且没有任何空
格:
pi_string.py
filename = 'pi_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
❶
pi_string = ''
❷
for line in lines:
pi_string += line.rstrip()
❸
print(pi_string)
print(len(pi_string))
就像前一个示例一样,我们首先打开文件,并将其中的所有行都存储在一个列表中。在
❶
处,我们创建了一个变量
——
pi_string
,用于存储圆周率的值。接下来,我们使用
一个循环将各行都加入pi_string ,并删除每行末尾的换行符(见❷
)。在
❸
处,我们打印这个字符串及其长度:
3.1415926535 89793238462643383279
36
在变量
pi_string
存储的字符串中,包含原来位于每行左边的空格,为删除这些空格,可使用
strip()
而不是
rstrip()
:
filename = 'pi_30_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
pi_string = ''
for line in lines:
pi_string += line.strip()
print(pi_string)
print(len(pi_string))
这样,我们就获得了一个这样的字符串:它包含精确到
30
位小数的圆周率值。这个字符串长
32
字符,因为它还包含整数部分的
3
和小数点:
3.141592653589793238462643383279
32
注意
读取文本文件时,
Python将其中的所有文本都解读为字符串。如果你读取的是数字,并要将其作为数值使用,就必须使用函数int() 将其转换为整数,或使用
函数float()
将其转换为浮点数。
10.1.6 包含一百万位的大型文件
前面我们分析的都是一个只有三行的文本文件,但这些代码示例也可处理大得多的文件。如果我们有一个文本文件,其中包含精确到小数点后
1 000 000
位而不是
30
位的圆周率
值,也可创建一个包含所有这些数字的字符串。为此,我们无需对前面的程序做任何修改,只需将这个文件传递给它即可。在这里,我们只打印到小数点后
50
位,以免终端为显
示全部
1 000 000
位而不断地翻滚:
pi_string.py
filename = 'pi_million_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
pi_string = ''
for line in lines:
pi_string += line.strip()
print(pi_string[:52] + "...")
print(len(pi_string))
输出表明,我们创建的字符串确实包含精确到小数点后
1 000 000
位的圆周率值:
3.14159265358979323846264338327950288419716939937510...
1000002
对于你可处理的数据量,
Python
没有任何限制;只要系统的内存足够多,你想处理多少数据都可以。
10.1.7 圆周率值中包含你的生日么
我一直想知道自己的生日是否包含在圆周率值中。下面来扩展刚才编写的程序,以确定某个人的生日是否包含在圆周率值的前
1 000 000
位中。为此,可将生日表示为一个由数字
组成的字符串,再检查这个字符串是否包含在
pi_string
中:
filename = 'pi_million_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
pi_string = ''
for line in lines:
pi_string += line.rstrip()
❶
birthday = input("Enter your birthday, in the form mmddyy: ")
❷
if birthday in pi_string:
print("Your birthday appears in the first million digits of pi!")
else:
print("Your birthday does not appear in the first million digits of pi.")
在
❶
处,我们提示用户输入其生日,在接下来的
❷
处,我们检查这个字符串是否包含在
pi_string
中。运行一下这个程序:
Enter your birthdate, in the form mmddyy: 120372
Your birthday appears in the first million digits of pi!
我的生日确实出现在了圆周率值中!读取文件的内容后,就可以以你能想到的任何方式对其进行分析。
动手试一试
10-1 Python
学
学习
习笔
笔记
记 :在文本编辑器中新建一个文件,写几句话来总结一下你至此学到的
Python
知识,其中每一行都以
“In Python you can”
打头。将这个文件命名为
learning_python.txt
,并将其存储到为完成本章练习而编写的程序所在的目录中。编写一个程序,它读取这个文件,并将你所写的内容打印三次:第一次打印时读取整个
文件;第二次打印时遍历文件对象;第三次打印时将各行存储在一个列表中,再在
with
代码块外打印它们。
10-2 C
语
语言
言学
学习
习笔
笔记
记 :可使用方法
replace()
将字符串中的特定单词都替换为另一个单词。下面是一个简单的示例,演示了如何将句子中的
'dog'
替换为
'cat'
:
>>> message = "I really like dogs."
>>> message.replace('dog', 'cat')
'I really like cats.'
读取你刚创建的文件
learning_python.txt
中的每一行,将其中的
Python
都替换为另一门语言的名称,如
C
。将修改后的各行都打印到屏幕上。
10.2 写入文件
保存数据的最简单的方式之一是将其写入到文件中。通过将输出写入文件,即便关闭包含程序输出的终端窗口,这些输出也依然存在:你可以在程序结束运行后查看这些输出,
可与别人分享输出文件,还可编写程序来将这些输出读取到内存中并进行处理。
10.2.1 写入空文件
要将文本写入文件,你在调用
open()
时需要提供另一个实参,告诉
Python
你要写入打开的文件。为明白其中的工作原理,我们来将一条简单的消息存储到文件中,而不是将其打
印到屏幕上:
write_message.py
filename = 'programming.txt'
❶
with open(filename, 'w') as file_object:
❷
file_object.write("I love programming.")
在这个示例中,调用
open()
时提供了两个实参(见
❶
)。第一个实参也是要打开的文件的名称;第二个实参(
'w'
)告诉
Python
,我们要以写
入模
式 打开这个文件。
打开文件
时,可指定读取模式 ('r' )、写入模式 ('w' )、附加模
式 ('a' )或让你能够读取和写入文件的模式('r+' )。
如果你省略了模式实参,
Python将以默认的只读模式打
开文件。
如果你要写入的文件不存在,函数open() 将自动创建它。然而,以写入('w' )模式打开文件时千万要小心,因为如果指定的文件已经存在,Python将在返回文件对象前清空
该文件。
在
❷
处,我们使用文件对象的方法
write()
将一个字符串写入文件。这个程序没有终端输出,但如果你打开文件
programming.txt
,将看到其中包含如下一行内容:
programming.txt
I love programming.
相比于你的计算机中的其他文件,这个文件没有什么不同。你可以打开它、在其中输入新文本、复制其内容、将内容粘贴到其中等。
注意
Python只能将字符串写入文本文件。要将数值数据存储到文本文件中,必须先使用函数str() 将其转换为字符串格式。
10.2.2 写入多行
函数write() 不会在你写入的文本末尾添加换行符
,因此如果你写入多行时没有指定换行符,文件看起来可能不是你希望的那样:
filename = 'programming.txt'
with open(filename, 'w') as file_object:
file_object.write("I love programming.")
file_object.write("I love creating new games.")
如果你打开
programming.txt
,将发现两行内容挤在一起:
I love programming.I love creating new games.
要让每个字符串都单独占一行,需要在
write()
语句中包含换行符:
filename = 'programming.txt'
with open(filename, 'w') as file_object:
file_object.write("I love programming.\n")
file_object.write("I love creating new games.\n")
现在,输出出现在不同行中:
I love programming.
I love creating new games.
像显示到终端的输出一样,还可以使用空格、制表符和空行来设置这些输出的格式。
10.2.3 附加到文件
如果你要给文件添加内容,而不是覆盖原有的内容,可以附
加模
式 打开文件。你以附加模式打开文件时,
Python
不会在返回文件对象前清空文件,而你写入到文件的行都将添加
到文件末尾。如果指定的文件不存在,
Python
将为你创建一个空文件。
下面来修改
write_message.py
,在既有文件
programming.txt
中再添加一些你酷爱编程的原因:
write_message.py
filename = 'programming.txt'
❶
with open(filename, 'a') as file_object:
❷
file_object.write("I also love finding meaning in large datasets.\n")
file_object.write("I love creating apps that can run in a browser.\n")
在
❶
处,我们打开文件时指定了实参
'a'
,以便将内容附加到文件末尾,而不是覆盖文件原来的内容。在
❷
处,我们又写入了两行,它们被添加到文件
programming.txt
末尾:
programming.txt
I love programming.
I love creating new games.
I also love finding meaning in large datasets.
I love creating apps that can run in a browser.
最终的结果是,文件原来的内容还在,它们后面是我们刚添加的内容。
动手试一试
10-3
访
访客
客 :编写一个程序,提示用户输入其名字;用户作出响应后,将其名字写入到文件
guest.txt
中。
10-4
访
访客
客名
名单
单 :编写一个
while
循环,提示用户输入其名字。用户输入其名字后,在屏幕上打印一句问候语,并将一条访问记录添加到文件
guest_book.txt
中。确保这
个文件中的每条记录都独占一行。
10-5
关
关于
于编
编程
程的
的调
调查
查 :编写一个
while
循环,询问用户为何喜欢编程。每当用户输入一个原因后,都将其添加到一个存储所有原因的文件中。
10.3 异常
Python
使用被称为异
常 的特殊对象来管理程序执行期间发生的错误。每当发生让
Python
不知所措的错误时,它都会创建一个异常对象。如果你编写了处理该异常的代码,程序将继
续运行;如果你未对异常进行处理,程序将停止,并显示一个
traceback
,其中包含有关异常的报告。
异常是使用
try-except
代码块处理的。
try-except
代码块让
Python
执行指定的操作,同时告诉
Python
发生异常时怎么办。使用了
try-except
代码块时,即便出现异常,
程序也将继续运行:显示你编写的友好的错误消息,而不是令用户迷惑的
traceback
。
10.3.1 处理ZeroDivisionError异常
下面来看一种导致
Python
引发异常的简单错误。你可能知道不能将一个数字除以
0
,但我们还是让
Python
这样做吧:
division.py
print(5/0)
显然,
Python
无法这样做,因此你将看到一个
traceback
:
Traceback (most recent call last):
File "division.py", line 1, in
print(5/0)
❶
ZeroDivisionError: division by zero
在上述
traceback
中,
❶
处指出的错误
ZeroDivisionError
是一个异常对象。
Python
无法按你的要求做时,就会创建这种对象。在这种情况下,
Python
将停止运行程序,并指出
引发了哪种异常,而我们可根据这些信息对程序进行修改。下面我们将告诉
Python
,发生这种错误时怎么办;这样,如果再次发生这样的错误,我们就有备无患了。
10.3.2 使用try-except代码块
当你认为可能发生了错误时,可编写一个
try-except
代码块来处理可能引发的异常。你让
Python
尝试运行一些代码,并告诉它如果这些代码引发了指定的异常,该怎么办。
处理
ZeroDivisionError
异常的
try-except
代码块类似于下面这样:
try:
print(5/0)
except ZeroDivisionError:
print("You can't divide by zero!")
我们将导致错误的代码行
print(5/0)
放在了一个
try
代码块中。如果
try
代码块中的代码运行起来没有问题,
Python
将跳过
except
代码块;如果
try
代码块中的代码导致了
错误,
Python
将查找这样的
except
代码块,并运行其中的代码,即其中指定的错误与引发的错误相同。
在这个示例中,
try
代码块中的代码引发了
ZeroDivisionError
异常,因此
Python指出了该如何解决问题的except
代码块,并运行其中的代码。这样,用户看到的是一条友
好的错误消息,而不是
traceback
:
You can't divide by zero!
如果
try-except
代码块后面还有其他代码,程序将接着运行,因为已经告诉了
Python
如何处理这种错误。下面来看一个捕获错误后程序将继续运行的示例。
10.3.3 使用异常避免崩溃
发生错误时,如果程序还有工作没有完成,妥善地处理错误就尤其重要。这种情况经常会出现在要求用户提供输入的程序中;如果程序能够妥善地处理无效输入,就能再提示用
户提供有效输入,而不至于崩溃。
下面来创建一个只执行除法运算的简单计算器:
division.py
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
❶
first_number = input("\nFirst number: ")
if first_number == 'q':
break
❷
second_number = input("Second number: ")
if second_number == 'q':
break
❸
answer = int(first_number) / int(second_number)
print(answer)
在
❶
处,这个程序提示用户输入一个数字,并将其存储到变量
first_number
中;如果用户输入的不是表示退出的
q
,就再提示用户输入一个数字,并将其存储到变
量
second_number
中(见
❷
)。接下来,我们计算这两个数字的商(即
answer
,见
❸
)。这个程序没有采取任何处理错误的措施,因此让它执行除数为
0
的除法运算时,它
将崩溃:
Give me two numbers, and I'll divide them.
Enter 'q' to quit.
First number: 5
Second number: 0
Traceback (most recent call last):
File "division.py", line 9, in
answer = int(first_number) / int(second_number)
ZeroDivisionError: division by zero
程序崩溃可不好,但让用户看到
traceback
也不是好主意。不懂技术的用户会被它们搞糊涂,而且如果用户怀有恶意,他会通过
traceback
获悉你不希望他知道的信息。例如,他将知
道你的程序文件的名称,还将看到部分不能正确运行的代码。有时候,训练有素的攻击者可根据这些信息判断出可对你的代码发起什么样的攻击。
10.3.4 else代码块
通过将可能引发错误的代码放在
try-except
代码块中,可提高这个程序抵御错误的能力。错误是执行除法运算的代码行导致的,因此我们需要将它放到
try-except
代码块
中。这个示例还包含一个
else
代码块;依赖于
try 代码块成功执行的代码都应放到else
代码块中:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
first_number = input("\nFirst number: ")
if first_number == 'q':
break
second_number = input("Second number: ")
❶
try:
answer = int(first_number) / int(second_number)
❷
except ZeroDivisionError:
print("You can't divide by 0!")
❸
else:
print(answer)
我们让
Python
尝试执行
try
代码块中的除法运算(见
❶
),这个代码块只包含可能导致错误的代码。依赖于
try
代码块成功执行的代码都放在
else
代码块中;在这个示例中,如
果除法运算成功,我们就使用
else
代码块来打印结果(见
❸
)。
except
代码块告诉
Python
,出现
ZeroDivisionError
异常时该怎么办(见
❷
)。如果
try
代码块因除零错误而失败,我们就打印一条友好的消息,告诉用户如何避免这种错
误。程序将继续运行,用户根本看不到
traceback
:
Give me two numbers, and I'll divide them.
Enter 'q' to quit.
First number: 5
Second number: 0
You can't divide by 0!
First number: 5
Second number: 2
2.5
First number: q
try-except-else
代码块的工作原理大致如下:
Python
尝试执行
try
代码块中的代码;只有可能引发异常的代码才需要放在
try
语句中。有时候,有一些仅在
try
代码块成功
执行时才需要运行的代码,这些代码应放在
else
代码块中。
except
代码块告诉
Python
,如果它尝试运行
try
代码块中的代码时引发了指定的异常,该怎么办。
通过预测可能发生错误的代码,可编写健壮的程序,它们即便面临无效数据或缺少资源,也能继续运行,从而能够抵御无意的用户错误和恶意的攻击。
10.3.5 处理FileNotFoundError异常
使用文件时,一种常见的问题是找不到文件:你要查找的文件可能在其他地方、文件名可能不正确或者这个文件根本就不存在。对于所有这些情形,都可使用
try-except
代码
块以直观的方式进行处理。
我们来尝试读取一个不存在的文件。下面的程序尝试读取文件
alice.txt
的内容,但我没有将这个文件存储在
alice.py
所在的目录中:
alice.py
filename = 'alice.txt'
with open(filename) as f_obj:
contents = f_obj.read()
Python
无法读取不存在的文件,因此它引发一个异常:
Traceback (most recent call last):
File "alice.py", line 3, in
with open(filename) as f_obj:
FileNotFoundError: [Errno 2] No such file or directory: 'alice.txt'
在上述
traceback
中,最后一行报告了
FileNotFoundError
异常,这是
Python
找不到要打开的文件时创建的异常。在这个示例中,这个错误是函数
open()
导致的,因此要处理
这个错误,必须将
try
语句放在包含
open()
的代码行之前:
filename = 'alice.txt'
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
msg = "Sorry, the file " + filename + " does not exist."
print(msg)
在这个示例中,
try
代码块引发
FileNotFoundError
异常,因此
Python
找出与该错误匹配的
except
代码块,并运行其中的代码。最终的结果是显示一条友好的错误消息,而
不是
traceback
:
Sorry, the file alice.txt does not exist.
如果文件不存在,这个程序什么都不做,因此错误处理代码的意义不大。下面来扩展这个示例,看看在你使用多个文件时,异常处理可提供什么样的帮助。
10.3.6 分析文本
你可以分析包含整本书的文本文件。很多经典文学作品都是以简单文本文件的方式提供的,因为它们不受版权限制。本节使用的文本来自项目
Gutenberg(http://gutenberg.org/ ),
这个项目提供了一系列不受版权限制的文学作品,如果你要在编程项目中使用文学文本,这是一个很不错的资源。
下面来提取童话
Alicein Wonderland
的文本,并尝试计算它包含多少个单词。我们将使用方法
split()
,它根据一个字符串创建一个单词列表。下面是对只包含童话名
"Alice
in Wonderland"
的字符串调用方法
split()
的结果:
>>> title = "Alice in Wonderland"
>>> title.split()
['Alice', 'in', 'Wonderland']
方法split()
以空格为分隔符将字符串分拆成多个部分,并将这些部分都存储到一个列表中。结果是一个包含字符串中所有单词的列表,虽然有些单词可能包含标点。为计算
Alicein Wonderland
包含多少个单词,我们将对整篇小说调用
split()
,再计算得到的列表包含多少个元素,从而确定整篇童话大致包含多少个单词:
filename = 'alice.txt'
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
msg = "Sorry, the file " + filename + " does not exist."
print(msg)
else:
#
计算文件大致包含多少个单词
❶
words = contents.split()
❷
num_words = len(words)
❸
print("The file " + filename + " has about " + str(num_words) + " words.")
我们把文件
alice.txt
移到了正确的目录中,让
try
代码块能够成功地执行。在
❶
处,我们对变量
contents
(它现在是一个长长的字符串,包含童话
Alicein Wonderland
的全部文
本)调用方法
split()
,以生成一个列表,其中包含这部童话中的所有单词。当我们使用len()
来确定这个列表的长度时,就知道了原始字符串大致包含多少个单词(见
❷
)。在
❸
处,我们打印一条消息,指出文件包含多少个单词。这些代码都放在
else
代码块中,因为仅当
try
代码块成功执行时才执行它们。输出指出了文件
alice.txt
包含多少
个单词:
The file alice.txt has about 29461 words.
这个数字有点大,因为这里使用的文本文件包含出版商提供的额外信息,但与童话
Alicein Wonderland
的长度相当一致。
10.3.7 使用多个文件
下面多分析几本书。这样做之前,我们先将这个程序的大部分代码移到一个名为
count_words()
的函数中,这样对多本书进行分析时将更容易:
word_count.py
def count_words(filename):
❶
"""
计算一个文件大致包含多少个单词
"""
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
msg = "Sorry, the file " + filename + " does not exist."
print(msg)
else:
#
计算文件大致包含多少个单词
words = contents.split()
num_words = len(words)
print("The file " + filename + " has about " + str(num_words) +
" words.")
filename = 'alice.txt'
count_words(filename)
这些代码大都与原来一样,我们只是将它们移到了函数
count_words()
中,并增加了缩进量。修改程序的同时更新注释是个不错的习惯,因此我们将注释改成了文档字符串,
并稍微调整了一下措辞(见
❶
)。
现在可以编写一个简单的循环,计算要分析的任何文本包含多少个单词了。为此,我们将要分析的文件的名称存储在一个列表中,然后对列表中的每个文件都调
用
count_words()
。我们将尝试计算
Alicein Wonderland
、
Siddhartha
、
Moby Dick
和
Little Women
分别包含多少个单词,它们都不受版权限制。我故意没有将
siddhartha.txt
放到
word_count.py
所在的目录中,让你能够看到这个程序在文件不存在时处理得有多出色:
def count_words(filename):
--snip--
filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
count_words(filename)
文件
siddhartha.txt
不存在,但这丝毫不影响这个程序处理其他文件:
The file alice.txt has about 29461 words.
Sorry, the file siddhartha.txt does not exist.
The file moby_dick.txt has about 215136 words.
The file little_women.txt has about 189079 words.
在这个示例中,使用
try-except
代码块提供了两个重要的优点:避免让用户看到
traceback
;让程序能够继续分析能够找到的其他文件。如果不捕获因找不到
siddhartha.txt
而引发
的
FileNotFoundError
异常,用户将看到完整的
traceback
,而程序将在尝试分析
Siddhartha
后停止运行
——
根本不分析 Moby Dick 和
Little Women 。
10.3.8 失败时一声不吭
在前一个示例中,我们告诉用户有一个文件找不到。但并非每次捕获到异常时都需要告诉用户,有时候你希望程序在发生异常时一声不吭,就像什么都没有发生一样继续运行。
要让程序在失败时一声不吭,可像通常那样编写
try
代码块,但在
except
代码块中明确地告诉
Python
什么都不要做。
Python
有一个
pass
语句,可在代码块中使用它来让
Python
什么都不要做:
def count_words(filename):
"""
计算一个文件大致包含多少个单词
"""
try:
--snip--
except FileNotFoundError:
❶
pass
else:
--snip--
filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
count_words(filename)
相比于前一个程序,这个程序唯一不同的地方是
❶
处的
pass
语句。现在,出现
FileNotFoundError
异常时,将执行
except
代码块中的代码,但什么都不会发生。这种错误
发生时,不会出现
traceback
,也没有任何输出。用户将看到存在的每个文件包含多少个单词,但没有任何迹象表明有一个文件未找到:
The file alice.txt has about 29461 words.
The file moby_dick.txt has about 215136 words.
The file little_women.txt has about 189079 words.
pass 语句还充当了占位符,它提醒你在程序的某个地方什么都没有做,并且以后也许要在这里做些什么。例如,在这个程序中,我们可能决定将找不到的文件的名称写入到文
件missing_files.txt中。用户看不到这个文件,但我们可以读取这个文件,进而处理所有文件找不到的问题。
10.3.9 决定报告哪些错误
在什么情况下该向用户报告错误?在什么情况下又应该在失败时一声不吭呢?如果用户知道要分析哪些文件,他们可能希望在有文件没有分析时出现一条消息,将其中的原因告
诉他们。如果用户只想看到结果,而并不知道要分析哪些文件,可能就无需在有些文件不存在时告知他们。向用户显示他不想看到的信息可能会降低程序的可用性。Python的错误
处理结构让你能够细致地控制与用户分享错误信息的程度,要分享多少信息由你决定。
编写得很好且经过详尽测试的代码不容易出现内部错误,如语法或逻辑错误,但只要程序依赖于外部因素,如用户输入、存在指定的文件、有网络链接,就有可能出现异常。凭
借经验可判断该在程序的什么地方包含异常处理块,以及出现错误时该向用户提供多少相关的信息。
动手试一试
10-6
加
加法
法运
运算
算 :提示用户提供数值输入时,常出现的一个问题是,用户提供的是文本而不是数字。在这种情况下,当你尝试将输入转换为整数时,将引
发
TypeError
异常。编写一个程序,提示用户输入两个数字,再将它们相加并打印结果。在用户输入的任何一个值不是数字时都捕获
TypeError
异常,并打印一
条友好的错误消息。对你编写的程序进行测试:先输入两个数字,再输入一些文本而不是数字。
10-7
加
加法
法计
计算
算器
器 :将你为完成练习
10-6
而编写的代码放在一个
while
循环中,让用户犯错(输入的是文本而不是数字)后能够继续输入数字。
10-8
猫
猫和
和狗
狗 :创建两个文件
cats.txt
和
dogs.txt
,在第一个文件中至少存储三只猫的名字,在第二个文件中至少存储三条狗的名字。编写一个程序,尝试读取这些文件,
并将其内容打印到屏幕上。将这些代码放在一个
try-except
代码块中,以便在文件不存在时捕获
FileNotFound
错误,并打印一条友好的消息。将其中一个文件
移到另一个地方,并确认
except
代码块中的代码将正确地执行。
10-9
沉
沉默
默的
的猫
猫和
和狗
狗 :修改你在练习
10-8
中编写的
except
代码块,让程序在文件不存在时一言不发。
10-10
常
常见
见单
单词
词 :访问项目
Gutenberg
(
http://gutenberg.org/
),并找一些你想分析的图书。下载这些作品的文本文件或将浏览器中的原始文本复制到文本文件中。
你可以使用方法
count()
来确定特定的单词或短语在字符串中出现了多少次。例如,下面的代码计算
'row'
在一个字符串中出现了多少次:
>>> line = "Row, row, row your boat"
>>> line.count('row')
2
>>> line.lower().count('row')
3
请注意,通过使用
lower()
将字符串转换为小写,可捕捉要查找的单词出现的所有次数,而不管其大小写格式如何。
编写一个程序,它读取你在项目
Gutenberg
中获取的文件,并计算单词
'the'
在每个文件中分别出现了多少次。
10.4 存储数据
很多程序都要求用户输入某种信息,如让用户存储游戏首选项或提供要可视化的数据。不管专注的是什么,程序都把用户提供的信息存储在列表和字典等数据结构中。用户关闭
程序时,你几乎总是要保存他们提供的信息;一种简单的方式是使用模块
json
来存储数据。
模块json 让你能够将简单的Python
数据结构转储到文件中,并在程序再次运行时加载该文件中的数据。你还可以使用
json 在Python程序之间分享数据。更重要的是,JSON数据
格式并非Python专用的,这让你能够将以JSON格式存储的数据与使用其他编程语言的人分享。这是一种轻便格式,很有用,也易于学习。
注
意
JSON
(
JavaScript Object Notation
)格式最初是为
JavaScript
开发的,但随后成了一种常见格式,被包括
Python
在内的众多语言采用。
10.4.1 使用json.dump()和json.load() #dump 转储
我们来编写一个存储一组数字的简短程序,再编写一个将这些数字读取到内存中的程序。第一个程序将使用
json.dump()
来存储这组数字,而第二个程序将使
用
json.load()
。
函数
json.dump()
接受两个实参:要存储的数据以及可用于存储数据的文件对象。下面演示了如何使用
json.dump()
来存储数字列表:
number_writer.py
import json
numbers = [2, 3, 5, 7, 11, 13]
❶
filename = 'numbers.json'
❷
with open(filename, 'w') as f_obj:
❸
json.dump(numbers, f_obj)
我们先导入模块
json
,再创建一个数字列表。在
❶
处,我们指定了要将该数字列表存储到其中的文件的名称。通常使用文件扩展名
.json
来指出文件存储的数据为
JSON
格式。接
下来,我们以写入模式打开这个文件,让
json
能够将数据写入其中(见
❷
)。在
❸
处,我们使用函数
json.dump()
将数字列表存储到文件
numbers.json
中。
这个程序没有输出,但我们可以打开文件
numbers.json
,看看其内容。数据的存储格式与
Python
中一样:
[2, 3, 5, 7, 11, 13]
下面再编写一个程序,使用
json.load()
将这个列表读取到内存中:
number_reader.py
import json
❶
filename = 'numbers.json'
❷
with open(filename) as f_obj:
❸
numbers = json.load(f_obj)
print(numbers)
在
❶
处,我们确保读取的是前面写入的文件。这次我们以读取方式打开这个文件,因为
Python
只需读取这个文件(见
❷
)。在
❸
处,我们使用函数
json.load()
加载存储在
numbers.json
中的信息,并将其存储到变量
numbers
中。最后,我们打印恢复的数字列表,看看它是否与
number_writer.py
中创建的数字列表相同:
[2, 3, 5, 7, 11, 13]
这是一种在程序之间共享数据的简单方式。
10.4.2 保存和读取用户生成的数据
对于用户生成的数据,使用
json
保存它们大有裨益,因为如果不以某种方式进行存储,等程序停止运行时用户的信息将丢失。下面来看一个这样的例子:用户首次运行程序时
被提示输入自己的名字,这样再次运行程序时就记住他了。
我们先来存储用户的名字:
remember_me.py
import json
❶
username = input("What is your name? ")
filename = 'username.json'
with open(filename, 'w') as f_obj:
❷
json.dump(username, f_obj)
❸
print("We'll remember you when you come back, " + username + "!")
在
❶
处,我们提示输入用户名,并将其存储在一个变量中。接下来,我们调用
json.dump()
,并将用户名和一个文件对象传递给它,从而将用户名存储到文件中(见
❷
)。然
后,我们打印一条消息,指出我们存储了他输入的信息(见
❸
):
What is your name? Eric
We'll remember you when you come back, Eric!
现在再编写一个程序,向其名字被存储的用户发出问候:
greet_user.py
import json
filename = 'username.json'
with open(filename) as f_obj:
❶
username = json.load(f_obj)
❷
print("Welcome back, " + username + "!")
在
❶
处,我们使用
json.load()
将存储在
username.json
中的信息读取到变量
username
中。恢复用户名后,我们就可以欢迎用户回来了(见
❷
):
Welcome back, Eric!
我们需要将这两个程序合并到一个程序(
remember_me.py
)中。这个程序运行时,我们将尝试从文件
username.json
中获取用户名,因此我们首先编写一个尝试恢复用户名的
try
代
码块。如果这个文件不存在,我们就在
except
代码块中提示用户输入用户名,并将其存储在
username.json
中,以便程序再次运行时能够获取它:
remember_me.py
import json
#
如果以前存储了用户名,就加载它
#
否则,就提示用户输入用户名并存储它 #这个地方不缩进正确,我都看不懂
filename = 'username.json'
try:
❶
with open(filename) as f_obj:
❷
username = json.load(f_obj)
❸
except FileNotFoundError:
❹
username = input("What is your name? ")
❺
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We'll remember you when you come back, " + username + "!")
else:
print("Welcome back, " + username + "!")
这里没有任何新代码,只是将前两个示例的代码合并到了一个程序中。在
❶
处,我们尝试打开文件
username.json
。如果这个文件存在,就将其中的用户名读取到内存中(见
❷),
再执行else
代码块,即打印一条欢迎用户回来的消息。用户首次运行这个程序时,文件
username.json
不存在,将引发
FileNotFoundError
异常(见
❸
),因此
Python
将执
行
except
代码块:提示用户输入其用户名(见
❹
),再使用
json.dump()
存储该用户名,并打印一句问候语(见
❺
)。
无论执行的是
except
代码块还是
else
代码块,都将显示用户名和合适的问候语。
如果这个程序是首次运行,输出将如下:
What is your name? Eric
We'll remember you when you come back, Eric!
否则,输出将如下:
Welcome back, Eric!
这是程序之前至少运行了一次时的输出。
10.4.3 重构
你经常会遇到这样的情况:代码能够正确地运行,但可做进一步的改进
——
将代码划分为一系列完成具体工作的函数。这样的过程被称为重
构 。重构让代码更清晰、更易于理
解、更容易扩展。
要重构
remember_me.py
,可将其大部分逻辑放到一个或多个函数中。
remember_me.py
的重点是问候用户,因此我们将其所有代码都放到一个名为
greet_user()
的函数中:
remember_me.py
import json
def greet_user():
❶
"""
问候用户,并指出其名字
"""
filename = 'username.json'
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
username = input("What is your name? ")
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We'll remember you when you come back, " + username + "!")
else:
print("Welcome back, " + username + "!")
greet_user()
考虑到现在使用了一个函数,我们删除了注释,转而使用一个文档字符串来指出程序是做什么的(见
❶
)。这个程序更清晰些,但函数
greet_user()
所做的不仅仅是问候用
户,还在存储了用户名时获取它,而在没有存储用户名时提示用户输入一个。
下面来重构
greet_user()
,让它不执行这么多任务。为此,我们首先将获取存储的用户名的代码移到另一个函数中:
import json
def get_stored_username():
❶
"""
如果存储了用户名,就获取它
"""
filename = 'username.json'
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
❷
return None
else:
return username
def greet_user():
"""
问候用户,并指出其名字
"""
username = get_stored_username()
❸
if username:
print("Welcome back, " + username + "!")
else:
username = input("What is your name? ")
filename = 'username.json'
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We'll remember you when you come back, " + username + "!")
greet_user()
新增的函数
get_stored_username()
目标明确,
❶
处的文档字符串指出了这一点。如果存储了用户名,这个函数就获取并返回它;如果文件
username.json
不存在,这个函数
就返回
None
(见
❷
)。这是一种不错的做法:函数要么返回预期的值,要么返回
None
;这让我们能够使用函数的返回值做简单测试。在
❸
处,如果成功地获取了用户名,就打
印一条欢迎用户回来的消息,否则就提示用户输入用户名。
我们还需将
greet_user()
中的另一个代码块提取出来:将没有存储用户名时提示用户输入的代码放在一个独立的函数中:
import json
def get_stored_username():
"""
如果存储了用户名,就获取它
"""
--snip--
def get_new_username():
"""
提示用户输入用户名
"""
username = input("What is your name? ")
filename = 'username.json'
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
return username
def greet_user():
"""
问候用户,并指出其名字
"""
username = get_stored_username()
if username:
print("Welcome back, " + username + "!")
else:
username = get_new_username()
print("We'll remember you when you come back, " + username + "!")
greet_user()
在
remember_me.py
的这个最终版本中,每个函数都执行单一而清晰的任务。我们调用
greet_user()
,它打印一条合适的消息:要么欢迎老用户回来,要么问候新用户。为此,
它首先调用
get_stored_username()
,这个函数只负责获取存储的用户名(如果存储了的话),再在必要时调用
get_new_username()
,这个函数只负责获取并存储新
用户的用户名。要编写出清晰而易于维护和扩展的代码,这种划分工作必不可少。
动手试一试
10-11
喜
喜欢
欢的
的数
数字
字 :编写一个程序,提示用户输入他喜欢的数字,并使用
json.dump()
将这个数字存储到文件中。再编写一个程序,从文件中读取这个值,并打印
消息
“I knowyour favorite number! It's _____.”
。
10-12
记
记住
住喜
喜欢
欢的
的数
数字
字 :将练习
10-11
中的两个程序合而为一。如果存储了用户喜欢的数字,就向用户显示它,否则提示用户输入他喜欢的数字并将其存储到文件中。
运行这个程序两次,看看它是否像预期的那样工作。
10-13
验
验证
证用
用户
户 :最后一个
remember_me.py
版本假设用户要么已输入其用户名,要么是首次运行该程序。我们应修改这个程序,以应对这样的情形:当前和最后一次
运行该程序的用户并非同一个人。
为此,在
greet_user()
中打印欢迎用户回来的消息前,先询问他用户名是否是对的。如果不对,就调用
get_new_username()
让用户输入正确的用户名。
10.5 小结
在本章中,你学习了:如何使用文件;如何一次性读取整个文件,以及如何以每次一行的方式读取文件的内容;如何写入文件,以及如何将文本附加到文件末尾;什么是异常以
及如何处理程序可能引发的异常;如何存储Python数据结构,以保存用户提供的信息,避免用户每次运行程序时都需要重新提供。在第11章中,你将学习高效的代码测试方式,这可帮助你确定代码正确无误,以及发现扩展现有程序时可能引入的bug。