程序猿的探索之路

Python书籍阅读与记录 6.17 I 文件和异常

我感觉这样记录，对于我来说挺好的。因为我看两端对齐的语句容易走神，这样记录阅读的话，就很少出现之前的情况。

我写的初衷，也是自己来看，所以感觉写的不好的，请保留下意见，谢谢。

代码缩进情况，字体重复情况，因为我能看懂，就没改。

里面的每一个字我都看过，加粗括号下划线等均是我的笔记。

第10章文件和异常

至此，你掌握了编写组织有序而易于使用的程序所需的基本技能，该考虑让程序目标更明确、用途更大了。在本章中，你将学习处理文件，让程序能够快速地分析大

量的数据；你将学习错误处理，避免程序在面对意外情形时崩溃；你将学习异

常，它们是 Python 创建的特殊对象，用于管理程序运行时出现的错误；你还将学习模

块 json ，它让你能够保存用户数据，以免在程序停止运行后丢失。

学习处理文件和保存数据可让你的程序使用起来更容易：用户将能够选择输入什么样的数据，以及在什么时候输入；用户使用你的程序做一些工作后，可将程序关

闭，以后再接着往下做。学习处理异常可帮助你应对文件不存在的情形，以及处理其他可能导致程序崩溃的问题。这让你的程序在面对错误的数据时更健壮 —— 不管

这些错误数据源自无意的错误，还是源自破坏程序的恶意企图。你在本章学习的技能可提高程序的适用性、可用性和稳定性。

10.1 从文件中读取数据

文本文件可存储的数据量多得难以置信：天气数据、交通数据、社会经济数据、文学作品等。每当需要分析或修改存储在文件中的信息时，读取文件都很有用，对数据分析应用

程序来说尤其如此。例如，你可以编写一个这样的程序：读取一个文本文件的内容，重新设置这些数据的格式并将其写入文件，让浏览器能够显示这些内容。

要使用文本文件中的信息，首先需要将信息读取到内存中。为此，你可以一次性读取文件的全部内容，也可以以每次一行的方式逐步读取。

10.1.1 读取整个文件

要读取文件，需要一个包含几行文本的文件。下面首先来创建一个文件，它包含精确到小数点后 30 位的圆周率值，且在小数点后每 10 位处都换行：

pi_digits.txt

3.1415926535

8979323846

2643383279

要动手尝试后续示例，可在编辑器中输入这些数据行，再将文件保存为 pi_digits.txt。然后，将该

文件保存到本章程序所在的目录中。

下面的程序打开并读取这个文件，再将其内容显示到屏幕上：

file_reader.py

with open('pi_digits.txt') as file_object:

contents = file_object.read()

print(contents)

在这个程序中，第 1 行代码做了大量的工作。我们先来看看函数 open() 。要以任何方式使用文件 —— 哪怕仅仅是打印其内容，都得先打

开文件，这样才能访问它。函数 open()

接受一个参数：要打开的文件的名称。 Python 在当前执行的文件所在的目录中查找指定的文件。在这个示例中，当前运行的是 file_reader.py ，因此 Python 在 file_reader.py 所在的目录中

查找 pi_digits.txt 。函数 open() 返回一个表示文件的对象。 在这里，open('pi_digits.txt') 返回一个表示文件pi_digits.txt 的对象；Python将这个对象存储在我们将

在后面使用的变量中。

关键字with 在不再需要访问文件后将其关闭。在这个程序中，注意到我们调用了 open() ，但没有调用 close() ；你也可以调用open() 和close() 来打开和关闭文件，但

这样做时，如果程序存在bug，导致close() 语句未执行，文件将不会关闭。这看似微不足道，但未妥善地关闭文件可能会导致数据丢失或受损。如果在程序中过早地调

用close() ，你会发现需要使用文件时它已关

闭（无法访问），这会导致更多的错误。并非在任何情况下都能轻松确定关闭文件的恰当时机，但通过使用前面所示的结构，可

让 Python 去确定：你只管打开文件，并在需要时使用它，Python自会在合适的时候自动将其关闭。

有了表示 pi_digits.txt 的文件对象后，我们使用方法 read() （前述程序的第 2 行）读取这个文件的全部内容，并将其作为一个长长的字符串存储在变量 contents 中。这样，通过

打印 contents 的值，就可将这个文本文件的全部内容显示出来：

3.1415926535

8979323846

2643383279

#我这里写的代码直接在命令行敲的。但是没有发现作者所说的最后一行多了个空行这样的问题。

>>> import os
>>> os.getcwd()
'C:\\Users\\42152'
>>> with open('111.txt') as file_object:
... contents=file_object.read()
... print(contents)
...
3.14
15
92
65
3
>>> print(contents.rstrip())
3.14
15
92
65
3
>>> contents
'3.14\n15\n92\n65\n3'
>>> contents.rstrip()
'3.14\n15\n92\n65\n3'

>>> print(file_object.read())
Traceback (most recent call last):
File "", line 1, in
ValueError: I/O operation on closed file.

我经过测试还发现了：

>>> with open('111.txt'):
... print(open('111.txt').read())
... print('I love china')
...
3.14
15
92
6
I love china

>>> with open('111.txt') as file_object:
... print(file_object.read())
... print('I love china')
...
3.14
15
92
6
I love china

由此可以看出来，这个with语句不是for循环，只起到不用即关（文件）的作用，read（）函数可以逐行一次性读完文件内容。

相比于原始文件，该输出唯一不同的地方是末尾多了一个空行。为何会多出这个空行呢？因为 read() 到达文件末尾时返回一个空字符串，而将这个空字符串显示出来时就是一

个空行。要删除多出来的空行，可在 print 语句中使用rstrip() ：

with open('pi_digits.txt') as file_object:

contents = file_object.read()

print(contents.rstrip())

本书前面说过，Python方法rstrip() 删除（剥除）字符串末尾的空白。现在，输出与原始文件的内容完全相同：

3.1415926535

8979323846

2643383279

10.1.2 文件路径

当你将类似 pi_digits.txt 这样的简单文件名传递给函数 open() 时， Python将在当前执行的文件（即.py程序文件）所在的目录中查找文件。

根据你组织文件的方式，有时可能要打开不在程序文件所属目录中的文件。例如，你可能将程序文件存储在了文件夹 python_work 中，（笔者的意思是此文件夹与该程序文件所处同一目录）而在文件夹 python_work 中，有一个名为

text_files 的文件夹，用于存储程序文件操作的文本文件。虽然文件夹 text_files 包含在文件夹 python_work 中，但仅向 open() 传递位于该文件夹中的文件的名称也不可行，因为 Python

只在文件夹 python_work 中查找，而不会在其子文件夹 text_files 中查找。要让 Python 打开不与程序文件位于同一个目录中的文件，需要提供文件路径件路径，它让 Python 到系统的特定位置

去查找。

由于文件夹 text_files 位于文件夹 python_work 中，因此可使用相对文件路径来打开该文件夹中的文件。相对文件路径让 Python 到指定的位置去查找，而该位置是相对于当前运行的程

序所在目录的。在 Linux和OS X 中，你可以这样编写代码：

with open('text_files/filename.txt') as file_object:

这行代码让 Python 到文件夹 python_work 下的文件夹 text_files 中去查找指定的 .txt 文件。在 Windows 系统中，在文件路径中使用反斜杠（ \ ）而不是斜杠（ / ）：

with open('text_files\filename.txt') as file_object:

你还可以将文件在计算机中的准确位置告诉 Python ，这样就不用关心当前运行的程序存储在什么地方了。这称为绝对文件路

径。在相对路径行不通时，可使用绝对路径。例如，

如果 text_files 并不在文件夹 python_work 中，而在文件夹 other_files 中，则向 open() 传递路径 'text_files/ filename.txt' 行不通，因为 Python 只在文件夹 python_work 中查找

该位置。为明确地指出你希望 Python 到哪里去查找，你需要提供完整的路径。

绝对路径通常比相对路径更长，因此将其存储在一个变量中，再将该变量传递给 open() 会有所帮助。在 Linux 和 OS X 中，绝对路径类似于下面这样：

file_path = '/home/ehmatthes/other_files/text_files/filename.txt'

with open(file_path) as file_object:

而在 Windows 系统中，它们类似于下面这样： file_path = 'C:\Users\ehmatthes\other_files\text_files\filename.txt'

with open(file_path) as file_object:

通过使用绝对路径，可读取系统任何地方的文件。就目前而言，最简单的做法是，要么将数据文件存储在程序文件所在的目录，要么将其存储在程序文件所在目录下的一个文件

夹（如text_files）中。

注意

Windows系统有时能够正确地解读文件路径中的斜杠。如果你使用的是Windows系统，且结果不符合预期，请确保在文件路径中使用的是反斜杠。

10.1.3 逐行读取

读取文件时，常常需要检查其中的每一行：你可能要在文件中查找特定的信息，或者要以某种方式修改文件中的文本。例如，你可能要遍历一个包含天气数据的文件，并使用天

气描述中包含字样 sunny 的行。在新闻报道中，你可能会查找包含标签的行，并按特定的格式设置它。

要以每次一行的方式检查文件，可对文件对象使用 for 循环：

file_reader.py

❶ filename = 'pi_digits.txt'

❷ with open(filename) as file_object:

❸ for line in file_object:

print(line)

>>> with open('111.txt') as f2:
... for line in f2:
... print(f2)
... print(line)
...
<_io.TextIOWrapper name='111.txt' mode='r' encoding='cp936'>
3.14

<_io.TextIOWrapper name='111.txt' mode='r' encoding='cp936'>
15

<_io.TextIOWrapper name='111.txt' mode='r' encoding='cp936'>
92

<_io.TextIOWrapper name='111.txt' mode='r' encoding='cp936'>
6

在 ❶ 处，我们将要读取的文件的名称存储在变量 filename 中，这是使用文件时一种常见的做法。由于变量 filename 表示的并非实际文件 —— 它只是一个让 Python 知道到哪里

>>> with open('111.txt') as f1:
... print(f1)
...
<_io.TextIOWrapper name='111.txt' mode='r' encoding='cp936'>

去查找文件的字符串，因此可轻松地将 'pi_digits.txt' 替换为你要使用的另一个文件的名称。调用 open() 后，将一个表示文件及其内容的对象存储到了变

量 file_object 中（见 ❷ ）。这里也使用了关键字 with ，让Python 负责妥善地打开和关闭文件。为查看文件的内容，我们通过对文件对象执行循环来遍历文件中的每一行（见

❸ ）。

我们打印每一行时，发现空白行更多了：

3.1415926535

8979323846

2643383279

为何会出现这些空白行呢？因为在这个文件中，每行的末尾都有一个看不见的换行符，而 print 语句也会加上一个换行符，因此每行末尾都有两个换行符：一个来自文件，另一

个来自print 语句。要消除这些多余的空白行，可在print 语句中使用rstrip() ：

filename = 'pi_digits.txt'

with open(filename) as file_object:

for line in file_object:

print(line.rstrip())

现在，输出又与文件内容完全相同了：

3.1415926535

8979323846

2643383279

10.1.4 创建一个包含文件各行内容的列表

使用关键字 with 时， open() 返回的文件对象只在with 代码块内可用。如果要在 with 代码块外访问文件的内容，可在 with 代码块内将文件的各行存储在一个列表中，并

在 with 代码块外使用该列表：你可以立即处理文件的各个部分，也可推迟到程序后面再处理。

下面的示例在 with 代码块中将文件 pi_digits.txt 的各行存储在一个列表中，再在 with 代码块外打印它们：

filename = 'pi_digits.txt'

with open(filename) as file_object:

❶ lines = file_object.readlines()

❷ for line in lines:

print(line.rstrip())

❶处的方法readlines() 从文件中读取每一行，并将其存储在一个列表中；接下来，该列表被存储到变量 lines 中；在 with 代码块外，我们依然可以使用这个变量。在 ❷

处，我们使用一个简单的 for 循环来打印 lines 中的各行。由于列表 lines 的每个元素都对应于文件中的一行，因此输出与文件内容完全一致。

10.1.5 使用文件的内容

将文件读取到内存中后，就可以以任何方式使用这些数据了。下面以简单的方式使用圆周率的值。首先，我们将创建一个字符串，它包含文件中存储的所有数字，且没有任何空

格：

pi_string.py

filename = 'pi_digits.txt'

with open(filename) as file_object:

lines = file_object.readlines()

❶ pi_string = ''

❷ for line in lines:

pi_string += line.rstrip()

❸ print(pi_string)

print(len(pi_string))

就像前一个示例一样，我们首先打开文件，并将其中的所有行都存储在一个列表中。在 ❶ 处，我们创建了一个变量 —— pi_string ，用于存储圆周率的值。接下来，我们使用

一个循环将各行都加入pi_string ，并删除每行末尾的换行符（见❷ ）。在 ❸ 处，我们打印这个字符串及其长度：

3.1415926535 89793238462643383279

在变量 pi_string 存储的字符串中，包含原来位于每行左边的空格，为删除这些空格，可使用 strip() 而不是 rstrip() ：

filename = 'pi_30_digits.txt'

with open(filename) as file_object:

lines = file_object.readlines()

pi_string = ''

for line in lines:

pi_string += line.strip()

print(pi_string)

print(len(pi_string))

这样，我们就获得了一个这样的字符串：它包含精确到 30 位小数的圆周率值。这个字符串长 32 字符，因为它还包含整数部分的 3 和小数点：

3.141592653589793238462643383279

注意

读取文本文件时， Python将其中的所有文本都解读为字符串。如果你读取的是数字，并要将其作为数值使用，就必须使用函数int() 将其转换为整数，或使用

函数float() 将其转换为浮点数。

10.1.6 包含一百万位的大型文件

前面我们分析的都是一个只有三行的文本文件，但这些代码示例也可处理大得多的文件。如果我们有一个文本文件，其中包含精确到小数点后 1 000 000 位而不是 30 位的圆周率

值，也可创建一个包含所有这些数字的字符串。为此，我们无需对前面的程序做任何修改，只需将这个文件传递给它即可。在这里，我们只打印到小数点后 50 位，以免终端为显

示全部 1 000 000 位而不断地翻滚：

pi_string.py

filename = 'pi_million_digits.txt'

with open(filename) as file_object:

lines = file_object.readlines()

pi_string = ''

for line in lines:

pi_string += line.strip()

print(pi_string[:52] + "...")

print(len(pi_string))

输出表明，我们创建的字符串确实包含精确到小数点后 1 000 000 位的圆周率值：

3.14159265358979323846264338327950288419716939937510...

1000002

对于你可处理的数据量， Python 没有任何限制；只要系统的内存足够多，你想处理多少数据都可以。

10.1.7 圆周率值中包含你的生日么

我一直想知道自己的生日是否包含在圆周率值中。下面来扩展刚才编写的程序，以确定某个人的生日是否包含在圆周率值的前 1 000 000 位中。为此，可将生日表示为一个由数字

组成的字符串，再检查这个字符串是否包含在 pi_string 中：

filename = 'pi_million_digits.txt'

with open(filename) as file_object:

lines = file_object.readlines()

pi_string = ''

for line in lines:

pi_string += line.rstrip()

❶ birthday = input("Enter your birthday, in the form mmddyy: ")

❷ if birthday in pi_string:

print("Your birthday appears in the first million digits of pi!")

else:

print("Your birthday does not appear in the first million digits of pi.")

在 ❶ 处，我们提示用户输入其生日，在接下来的 ❷ 处，我们检查这个字符串是否包含在 pi_string 中。运行一下这个程序： Enter your birthdate, in the form mmddyy: 120372

Your birthday appears in the first million digits of pi!

我的生日确实出现在了圆周率值中！读取文件的内容后，就可以以你能想到的任何方式对其进行分析。

动手试一试

10-1 Python 学

学习

习笔

笔记

记：在文本编辑器中新建一个文件，写几句话来总结一下你至此学到的 Python 知识，其中每一行都以 “In Python you can” 打头。将这个文件命名为

learning_python.txt ，并将其存储到为完成本章练习而编写的程序所在的目录中。编写一个程序，它读取这个文件，并将你所写的内容打印三次：第一次打印时读取整个

文件；第二次打印时遍历文件对象；第三次打印时将各行存储在一个列表中，再在 with 代码块外打印它们。

10-2 C 语

语言

言学

学习

习笔

笔记

记：可使用方法 replace() 将字符串中的特定单词都替换为另一个单词。下面是一个简单的示例，演示了如何将句子中的 'dog' 替换为 'cat'

：

>>> message = "I really like dogs."

>>> message.replace('dog', 'cat')

'I really like cats.'

读取你刚创建的文件 learning_python.txt 中的每一行，将其中的 Python 都替换为另一门语言的名称，如 C 。将修改后的各行都打印到屏幕上。

10.2 写入文件

保存数据的最简单的方式之一是将其写入到文件中。通过将输出写入文件，即便关闭包含程序输出的终端窗口，这些输出也依然存在：你可以在程序结束运行后查看这些输出，

可与别人分享输出文件，还可编写程序来将这些输出读取到内存中并进行处理。

10.2.1 写入空文件

要将文本写入文件，你在调用 open() 时需要提供另一个实参，告诉 Python 你要写入打开的文件。为明白其中的工作原理，我们来将一条简单的消息存储到文件中，而不是将其打

印到屏幕上：

write_message.py

filename = 'programming.txt'

❶ with open(filename, 'w') as file_object:

❷ file_object.write("I love programming.")

在这个示例中，调用 open() 时提供了两个实参（见 ❶ ）。第一个实参也是要打开的文件的名称；第二个实参（ 'w' ）告诉 Python ，我们要以写入模式打开这个文件。 打开文件

时，可指定读取模式（'r' ）、写入模式（'w' ）、附加模

式（'a' ）或让你能够读取和写入文件的模式（'r+' ）。 如果你省略了模式实参， Python将以默认的只读模式打

开文件。

如果你要写入的文件不存在，函数open() 将自动创建它。然而，以写入（'w' ）模式打开文件时千万要小心，因为如果指定的文件已经存在，Python将在返回文件对象前清空

该文件。

在 ❷ 处，我们使用文件对象的方法 write() 将一个字符串写入文件。这个程序没有终端输出，但如果你打开文件 programming.txt ，将看到其中包含如下一行内容：

programming.txt

I love programming.

相比于你的计算机中的其他文件，这个文件没有什么不同。你可以打开它、在其中输入新文本、复制其内容、将内容粘贴到其中等。

注意

Python只能将字符串写入文本文件。要将数值数据存储到文本文件中，必须先使用函数str() 将其转换为字符串格式。

10.2.2 写入多行

函数write() 不会在你写入的文本末尾添加换行符 ，因此如果你写入多行时没有指定换行符，文件看起来可能不是你希望的那样：

filename = 'programming.txt'

with open(filename, 'w') as file_object:

file_object.write("I love programming.")

file_object.write("I love creating new games.")

如果你打开 programming.txt ，将发现两行内容挤在一起：

I love programming.I love creating new games.

要让每个字符串都单独占一行，需要在 write() 语句中包含换行符：

filename = 'programming.txt'

with open(filename, 'w') as file_object:

file_object.write("I love programming.\n")

file_object.write("I love creating new games.\n")

现在，输出出现在不同行中：

I love programming.

I love creating new games.

像显示到终端的输出一样，还可以使用空格、制表符和空行来设置这些输出的格式。

10.2.3 附加到文件

如果你要给文件添加内容，而不是覆盖原有的内容，可以附加模式打开文件。你以附加模式打开文件时， Python 不会在返回文件对象前清空文件，而你写入到文件的行都将添加

到文件末尾。如果指定的文件不存在， Python 将为你创建一个空文件。

下面来修改 write_message.py ，在既有文件 programming.txt 中再添加一些你酷爱编程的原因：

write_message.py

filename = 'programming.txt'

❶ with open(filename, 'a') as file_object:

❷ file_object.write("I also love finding meaning in large datasets.\n")

file_object.write("I love creating apps that can run in a browser.\n")

在 ❶ 处，我们打开文件时指定了实参 'a' ，以便将内容附加到文件末尾，而不是覆盖文件原来的内容。在 ❷ 处，我们又写入了两行，它们被添加到文件 programming.txt 末尾：

programming.txt

I love programming.

I love creating new games.

I also love finding meaning in large datasets.

I love creating apps that can run in a browser.

最终的结果是，文件原来的内容还在，它们后面是我们刚添加的内容。

动手试一试

10-3 访

访客

客：编写一个程序，提示用户输入其名字；用户作出响应后，将其名字写入到文件 guest.txt 中。

10-4 访

访客

客名

名单

单：编写一个 while 循环，提示用户输入其名字。用户输入其名字后，在屏幕上打印一句问候语，并将一条访问记录添加到文件 guest_book.txt 中。确保这

个文件中的每条记录都独占一行。

10-5 关

关于

于编

编程

程的

的调

调查

查：编写一个 while 循环，询问用户为何喜欢编程。每当用户输入一个原因后，都将其添加到一个存储所有原因的文件中。

10.3 异常

Python 使用被称为异

常的特殊对象来管理程序执行期间发生的错误。每当发生让 Python 不知所措的错误时，它都会创建一个异常对象。如果你编写了处理该异常的代码，程序将继

续运行；如果你未对异常进行处理，程序将停止，并显示一个 traceback ，其中包含有关异常的报告。

异常是使用 try-except 代码块处理的。 try-except 代码块让 Python 执行指定的操作，同时告诉 Python 发生异常时怎么办。使用了 try-except 代码块时，即便出现异常，

程序也将继续运行：显示你编写的友好的错误消息，而不是令用户迷惑的 traceback 。

10.3.1 处理ZeroDivisionError异常

下面来看一种导致 Python 引发异常的简单错误。你可能知道不能将一个数字除以 0 ，但我们还是让 Python 这样做吧：

division.py

print(5/0)

显然， Python 无法这样做，因此你将看到一个 traceback ：

Traceback (most recent call last):

File "division.py", line 1, in

print(5/0)

❶ ZeroDivisionError: division by zero

在上述 traceback 中， ❶ 处指出的错误 ZeroDivisionError 是一个异常对象。 Python 无法按你的要求做时，就会创建这种对象。在这种情况下， Python 将停止运行程序，并指出

引发了哪种异常，而我们可根据这些信息对程序进行修改。下面我们将告诉 Python ，发生这种错误时怎么办；这样，如果再次发生这样的错误，我们就有备无患了。

10.3.2 使用try-except代码块

当你认为可能发生了错误时，可编写一个 try-except 代码块来处理可能引发的异常。你让 Python 尝试运行一些代码，并告诉它如果这些代码引发了指定的异常，该怎么办。

处理 ZeroDivisionError 异常的 try-except 代码块类似于下面这样：

try:

print(5/0)

except ZeroDivisionError:

print("You can't divide by zero!")

我们将导致错误的代码行 print(5/0) 放在了一个 try 代码块中。如果 try 代码块中的代码运行起来没有问题， Python 将跳过 except 代码块；如果 try 代码块中的代码导致了

错误， Python 将查找这样的 except 代码块，并运行其中的代码，即其中指定的错误与引发的错误相同。在这个示例中， try 代码块中的代码引发了 ZeroDivisionError 异常，因此 Python指出了该如何解决问题的except 代码块，并运行其中的代码。这样，用户看到的是一条友

好的错误消息，而不是 traceback ：

You can't divide by zero!

如果 try-except 代码块后面还有其他代码，程序将接着运行，因为已经告诉了 Python 如何处理这种错误。下面来看一个捕获错误后程序将继续运行的示例。

10.3.3 使用异常避免崩溃

发生错误时，如果程序还有工作没有完成，妥善地处理错误就尤其重要。这种情况经常会出现在要求用户提供输入的程序中；如果程序能够妥善地处理无效输入，就能再提示用

户提供有效输入，而不至于崩溃。

下面来创建一个只执行除法运算的简单计算器：

division.py

print("Give me two numbers, and I'll divide them.")

print("Enter 'q' to quit.")

while True:

❶ first_number = input("\nFirst number: ")

if first_number == 'q':

break

❷ second_number = input("Second number: ")

if second_number == 'q':

break

❸ answer = int(first_number) / int(second_number)

print(answer)

在 ❶ 处，这个程序提示用户输入一个数字，并将其存储到变量 first_number 中；如果用户输入的不是表示退出的 q ，就再提示用户输入一个数字，并将其存储到变

量 second_number 中（见 ❷ ）。接下来，我们计算这两个数字的商（即 answer ，见 ❸ ）。这个程序没有采取任何处理错误的措施，因此让它执行除数为 0 的除法运算时，它

将崩溃：

Give me two numbers, and I'll divide them.

Enter 'q' to quit.

First number: 5

Second number: 0

Traceback (most recent call last):

File "division.py", line 9, in

answer = int(first_number) / int(second_number)

ZeroDivisionError: division by zero

程序崩溃可不好，但让用户看到 traceback 也不是好主意。不懂技术的用户会被它们搞糊涂，而且如果用户怀有恶意，他会通过 traceback 获悉你不希望他知道的信息。例如，他将知

道你的程序文件的名称，还将看到部分不能正确运行的代码。有时候，训练有素的攻击者可根据这些信息判断出可对你的代码发起什么样的攻击。

10.3.4 else代码块

通过将可能引发错误的代码放在 try-except 代码块中，可提高这个程序抵御错误的能力。错误是执行除法运算的代码行导致的，因此我们需要将它放到 try-except 代码块

中。这个示例还包含一个 else 代码块；依赖于 try 代码块成功执行的代码都应放到else 代码块中：

print("Give me two numbers, and I'll divide them.")

print("Enter 'q' to quit.")

while True:

first_number = input("\nFirst number: ")

if first_number == 'q':

break

second_number = input("Second number: ")

❶ try:

answer = int(first_number) / int(second_number)

❷ except ZeroDivisionError:

print("You can't divide by 0!")

❸ else:

print(answer)

我们让 Python 尝试执行 try 代码块中的除法运算（见 ❶ ），这个代码块只包含可能导致错误的代码。依赖于 try 代码块成功执行的代码都放在 else 代码块中；在这个示例中，如

果除法运算成功，我们就使用 else 代码块来打印结果（见 ❸ ）。

except 代码块告诉 Python ，出现 ZeroDivisionError 异常时该怎么办（见 ❷ ）。如果 try 代码块因除零错误而失败，我们就打印一条友好的消息，告诉用户如何避免这种错

误。程序将继续运行，用户根本看不到 traceback ：

Give me two numbers, and I'll divide them.

Enter 'q' to quit.

First number: 5

Second number: 0

You can't divide by 0!

First number: 5

Second number: 2

2.5

First number: q

try-except-else 代码块的工作原理大致如下： Python 尝试执行 try 代码块中的代码；只有可能引发异常的代码才需要放在 try 语句中。有时候，有一些仅在 try 代码块成功

执行时才需要运行的代码，这些代码应放在 else 代码块中。 except 代码块告诉 Python ，如果它尝试运行 try 代码块中的代码时引发了指定的异常，该怎么办。

通过预测可能发生错误的代码，可编写健壮的程序，它们即便面临无效数据或缺少资源，也能继续运行，从而能够抵御无意的用户错误和恶意的攻击。

10.3.5 处理FileNotFoundError异常

使用文件时，一种常见的问题是找不到文件：你要查找的文件可能在其他地方、文件名可能不正确或者这个文件根本就不存在。对于所有这些情形，都可使用 try-except 代码

块以直观的方式进行处理。

我们来尝试读取一个不存在的文件。下面的程序尝试读取文件 alice.txt 的内容，但我没有将这个文件存储在 alice.py 所在的目录中：

alice.py

filename = 'alice.txt'

with open(filename) as f_obj:

contents = f_obj.read()

Python 无法读取不存在的文件，因此它引发一个异常：

Traceback (most recent call last):

File "alice.py", line 3, in

with open(filename) as f_obj:

FileNotFoundError: [Errno 2] No such file or directory: 'alice.txt'

在上述 traceback 中，最后一行报告了 FileNotFoundError 异常，这是 Python 找不到要打开的文件时创建的异常。在这个示例中，这个错误是函数 open() 导致的，因此要处理

这个错误，必须将 try 语句放在包含 open() 的代码行之前：

filename = 'alice.txt'

try:

with open(filename) as f_obj:

contents = f_obj.read()

except FileNotFoundError:

msg = "Sorry, the file " + filename + " does not exist."

print(msg)

在这个示例中， try 代码块引发 FileNotFoundError 异常，因此 Python 找出与该错误匹配的 except 代码块，并运行其中的代码。最终的结果是显示一条友好的错误消息，而

不是 traceback ：

Sorry, the file alice.txt does not exist.

如果文件不存在，这个程序什么都不做，因此错误处理代码的意义不大。下面来扩展这个示例，看看在你使用多个文件时，异常处理可提供什么样的帮助。

10.3.6 分析文本

你可以分析包含整本书的文本文件。很多经典文学作品都是以简单文本文件的方式提供的，因为它们不受版权限制。~~本节使用的文本来自项目~~ ~~Gutenberg（http://gutenberg.org/ ），~~

~~这个项目提供了一系列不受版权限制的文学作品，如果你要在编程项目中使用文学文本，这是一个很不错的资源。~~

下面来提取童话 Alicein Wonderland 的文本，并尝试计算它包含多少个单词。我们将使用方法 split() ，它根据一个字符串创建一个单词列表。下面是对只包含童话名 "Alice

in Wonderland" 的字符串调用方法 split() 的结果：

>>> title = "Alice in Wonderland"

>>> title.split()

['Alice', 'in', 'Wonderland']

方法split() 以空格为分隔符将字符串分拆成多个部分，并将这些部分都存储到一个列表中。结果是一个包含字符串中所有单词的列表，虽然有些单词可能包含标点。为计算

Alicein Wonderland 包含多少个单词，我们将对整篇小说调用 split() ，再计算得到的列表包含多少个元素，从而确定整篇童话大致包含多少个单词：

filename = 'alice.txt'

try:

with open(filename) as f_obj:

contents = f_obj.read()

except FileNotFoundError:

msg = "Sorry, the file " + filename + " does not exist."

print(msg)

else:

# 计算文件大致包含多少个单词

❶ words = contents.split()

❷ num_words = len(words)

❸ print("The file " + filename + " has about " + str(num_words) + " words.")

我们把文件 alice.txt 移到了正确的目录中，让 try 代码块能够成功地执行。在 ❶ 处，我们对变量 contents （它现在是一个长长的字符串，包含童话 Alicein Wonderland 的全部文

本）调用方法 split() ，以生成一个列表，其中包含这部童话中的所有单词。当我们使用len() 来确定这个列表的长度时，就知道了原始字符串大致包含多少个单词（见

❷ ）。在 ❸ 处，我们打印一条消息，指出文件包含多少个单词。这些代码都放在 else 代码块中，因为仅当 try 代码块成功执行时才执行它们。输出指出了文件 alice.txt 包含多少

个单词：

The file alice.txt has about 29461 words.

这个数字有点大，因为这里使用的文本文件包含出版商提供的额外信息，但与童话 Alicein Wonderland 的长度相当一致。

10.3.7 使用多个文件

下面多分析几本书。这样做之前，我们先将这个程序的大部分代码移到一个名为 count_words() 的函数中，这样对多本书进行分析时将更容易：

word_count.py

def count_words(filename):

❶ """ 计算一个文件大致包含多少个单词 """

try:

with open(filename) as f_obj:

contents = f_obj.read()

except FileNotFoundError:

msg = "Sorry, the file " + filename + " does not exist."

print(msg)

else:

# 计算文件大致包含多少个单词

words = contents.split()

num_words = len(words)

print("The file " + filename + " has about " + str(num_words) +

" words.")

filename = 'alice.txt'

count_words(filename)

这些代码大都与原来一样，我们只是将它们移到了函数 count_words() 中，并增加了缩进量。修改程序的同时更新注释是个不错的习惯，因此我们将注释改成了文档字符串，

并稍微调整了一下措辞（见 ❶ ）。

现在可以编写一个简单的循环，计算要分析的任何文本包含多少个单词了。为此，我们将要分析的文件的名称存储在一个列表中，然后对列表中的每个文件都调

用 count_words() 。我们将尝试计算 Alicein Wonderland 、 Siddhartha 、 Moby Dick 和 Little Women 分别包含多少个单词，它们都不受版权限制。我故意没有将 siddhartha.txt 放到

word_count.py 所在的目录中，让你能够看到这个程序在文件不存在时处理得有多出色：

def count_words(filename):

--snip--

filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']

for filename in filenames:

count_words(filename)

文件 siddhartha.txt 不存在，但这丝毫不影响这个程序处理其他文件：

The file alice.txt has about 29461 words.

Sorry, the file siddhartha.txt does not exist.

The file moby_dick.txt has about 215136 words.

The file little_women.txt has about 189079 words.

在这个示例中，使用 try-except 代码块提供了两个重要的优点：避免让用户看到 traceback ；让程序能够继续分析能够找到的其他文件。如果不捕获因找不到 siddhartha.txt 而引发

的 FileNotFoundError 异常，用户将看到完整的 traceback ，而程序将在尝试分析 Siddhartha 后停止运行 —— 根本不分析 Moby Dick 和 Little Women 。

10.3.8 失败时一声不吭

在前一个示例中，我们告诉用户有一个文件找不到。但并非每次捕获到异常时都需要告诉用户，有时候你希望程序在发生异常时一声不吭，就像什么都没有发生一样继续运行。

要让程序在失败时一声不吭，可像通常那样编写 try 代码块，但在 except 代码块中明确地告诉 Python 什么都不要做。 Python 有一个 pass 语句，可在代码块中使用它来让 Python

什么都不要做：

def count_words(filename):

""" 计算一个文件大致包含多少个单词 """

try:

--snip--

except FileNotFoundError:

❶ pass

else:

--snip--

filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']

for filename in filenames:

count_words(filename)

相比于前一个程序，这个程序唯一不同的地方是 ❶ 处的 pass 语句。现在，出现 FileNotFoundError 异常时，将执行 except 代码块中的代码，但什么都不会发生。这种错误

发生时，不会出现 traceback ，也没有任何输出。用户将看到存在的每个文件包含多少个单词，但没有任何迹象表明有一个文件未找到：

The file alice.txt has about 29461 words.

The file moby_dick.txt has about 215136 words.

The file little_women.txt has about 189079 words.

pass 语句还充当了占位符，它提醒你在程序的某个地方什么都没有做，并且以后也许要在这里做些什么。例如，在这个程序中，我们可能决定将找不到的文件的名称写入到文

件missing_files.txt中。用户看不到这个文件，但我们可以读取这个文件，进而处理所有文件找不到的问题。

10.3.9 决定报告哪些错误

在什么情况下该向用户报告错误？在什么情况下又应该在失败时一声不吭呢？如果用户知道要分析哪些文件，他们可能希望在有文件没有分析时出现一条消息，将其中的原因告

诉他们。如果用户只想看到结果，而并不知道要分析哪些文件，可能就无需在有些文件不存在时告知他们。向用户显示他不想看到的信息可能会降低程序的可用性。Python的错误

处理结构让你能够细致地控制与用户分享错误信息的程度，要分享多少信息由你决定。

编写得很好且经过详尽测试的代码不容易出现内部错误，如语法或逻辑错误，但只要程序依赖于外部因素，如用户输入、存在指定的文件、有网络链接，就有可能出现异常。凭

借经验可判断该在程序的什么地方包含异常处理块，以及出现错误时该向用户提供多少相关的信息。

动手试一试

10-6 加

加法

法运

运算

算：提示用户提供数值输入时，常出现的一个问题是，用户提供的是文本而不是数字。在这种情况下，当你尝试将输入转换为整数时，将引

发 TypeError 异常。编写一个程序，提示用户输入两个数字，再将它们相加并打印结果。在用户输入的任何一个值不是数字时都捕获 TypeError 异常，并打印一条友好的错误消息。对你编写的程序进行测试：先输入两个数字，再输入一些文本而不是数字。

10-7 加

加法

法计

计算

算器

器：将你为完成练习 10-6 而编写的代码放在一个 while 循环中，让用户犯错（输入的是文本而不是数字）后能够继续输入数字。

10-8 猫

猫和

和狗

狗：创建两个文件 cats.txt 和 dogs.txt ，在第一个文件中至少存储三只猫的名字，在第二个文件中至少存储三条狗的名字。编写一个程序，尝试读取这些文件，

并将其内容打印到屏幕上。将这些代码放在一个 try-except 代码块中，以便在文件不存在时捕获 FileNotFound 错误，并打印一条友好的消息。将其中一个文件

移到另一个地方，并确认 except 代码块中的代码将正确地执行。

10-9 沉

沉默

默的

的猫

猫和

和狗

狗：修改你在练习 10-8 中编写的 except 代码块，让程序在文件不存在时一言不发。

10-10 常

常见

见单

单词

词：访问项目 Gutenberg （ http://gutenberg.org/ ），并找一些你想分析的图书。下载这些作品的文本文件或将浏览器中的原始文本复制到文本文件中。

你可以使用方法 count() 来确定特定的单词或短语在字符串中出现了多少次。例如，下面的代码计算 'row' 在一个字符串中出现了多少次：

>>> line = "Row, row, row your boat"

>>> line.count('row')

>>> line.lower().count('row')

请注意，通过使用 lower() 将字符串转换为小写，可捕捉要查找的单词出现的所有次数，而不管其大小写格式如何。

编写一个程序，它读取你在项目 Gutenberg 中获取的文件，并计算单词 'the' 在每个文件中分别出现了多少次。

10.4 存储数据

很多程序都要求用户输入某种信息，如让用户存储游戏首选项或提供要可视化的数据。不管专注的是什么，程序都把用户提供的信息存储在列表和字典等数据结构中。用户关闭

程序时，你几乎总是要保存他们提供的信息；一种简单的方式是使用模块 json 来存储数据。

模块json 让你能够将简单的Python 数据结构转储到文件中，并在程序再次运行时加载该文件中的数据。你还可以使用 json 在Python程序之间分享数据。更重要的是，JSON数据

格式并非Python专用的，这让你能够将以JSON格式存储的数据与使用其他编程语言的人分享。这是一种轻便格式，很有用，也易于学习。

注

意 JSON （ JavaScript Object Notation ）格式最初是为 JavaScript 开发的，但随后成了一种常见格式，被包括 Python 在内的众多语言采用。

10.4.1 使用json.dump()和json.load() #dump 转储

我们来编写一个存储一组数字的简短程序，再编写一个将这些数字读取到内存中的程序。第一个程序将使用 json.dump() 来存储这组数字，而第二个程序将使

用 json.load() 。

函数 json.dump() 接受两个实参：要存储的数据以及可用于存储数据的文件对象。下面演示了如何使用 json.dump() 来存储数字列表：

number_writer.py

import json

numbers = [2, 3, 5, 7, 11, 13]

❶ filename = 'numbers.json'

❷ with open(filename, 'w') as f_obj:

❸ json.dump(numbers, f_obj)

我们先导入模块 json ，再创建一个数字列表。在 ❶ 处，我们指定了要将该数字列表存储到其中的文件的名称。通常使用文件扩展名 .json 来指出文件存储的数据为 JSON 格式。接

下来，我们以写入模式打开这个文件，让 json 能够将数据写入其中（见 ❷ ）。在 ❸ 处，我们使用函数 json.dump() 将数字列表存储到文件 numbers.json 中。

这个程序没有输出，但我们可以打开文件 numbers.json ，看看其内容。数据的存储格式与 Python 中一样：

[2, 3, 5, 7, 11, 13]

下面再编写一个程序，使用 json.load() 将这个列表读取到内存中：

number_reader.py

import json

❶ filename = 'numbers.json'

❷ with open(filename) as f_obj:

❸ numbers = json.load(f_obj)

print(numbers)

在 ❶ 处，我们确保读取的是前面写入的文件。这次我们以读取方式打开这个文件，因为 Python 只需读取这个文件（见 ❷ ）。在 ❸ 处，我们使用函数 json.load() 加载存储在

numbers.json 中的信息，并将其存储到变量 numbers 中。最后，我们打印恢复的数字列表，看看它是否与 number_writer.py 中创建的数字列表相同：

[2, 3, 5, 7, 11, 13]

这是一种在程序之间共享数据的简单方式。

10.4.2 保存和读取用户生成的数据

对于用户生成的数据，使用 json 保存它们大有裨益，因为如果不以某种方式进行存储，等程序停止运行时用户的信息将丢失。下面来看一个这样的例子：用户首次运行程序时

被提示输入自己的名字，这样再次运行程序时就记住他了。

我们先来存储用户的名字： remember_me.py

import json

❶ username = input("What is your name? ")

filename = 'username.json'

with open(filename, 'w') as f_obj:

❷ json.dump(username, f_obj)

❸ print("We'll remember you when you come back, " + username + "!")

在 ❶ 处，我们提示输入用户名，并将其存储在一个变量中。接下来，我们调用 json.dump() ，并将用户名和一个文件对象传递给它，从而将用户名存储到文件中（见 ❷ ）。然

后，我们打印一条消息，指出我们存储了他输入的信息（见 ❸ ）：

What is your name? Eric

We'll remember you when you come back, Eric!

现在再编写一个程序，向其名字被存储的用户发出问候：

greet_user.py

import json

filename = 'username.json'

with open(filename) as f_obj:

❶ username = json.load(f_obj)

❷ print("Welcome back, " + username + "!")

在 ❶ 处，我们使用 json.load() 将存储在 username.json 中的信息读取到变量 username 中。恢复用户名后，我们就可以欢迎用户回来了（见 ❷ ）：

Welcome back, Eric!

我们需要将这两个程序合并到一个程序（ remember_me.py ）中。这个程序运行时，我们将尝试从文件 username.json 中获取用户名，因此我们首先编写一个尝试恢复用户名的 try 代

码块。如果这个文件不存在，我们就在 except 代码块中提示用户输入用户名，并将其存储在 username.json 中，以便程序再次运行时能够获取它：

remember_me.py

import json

# 如果以前存储了用户名，就加载它

# 否则，就提示用户输入用户名并存储它 #这个地方不缩进正确，我都看不懂

filename = 'username.json'

try:

❶ with open(filename) as f_obj:

❷ username = json.load(f_obj)

❸ except FileNotFoundError:

❹ username = input("What is your name? ")

❺ with open(filename, 'w') as f_obj:

json.dump(username, f_obj)

print("We'll remember you when you come back, " + username + "!")

else:

print("Welcome back, " + username + "!")

这里没有任何新代码，只是将前两个示例的代码合并到了一个程序中。在 ❶ 处，我们尝试打开文件 username.json 。如果这个文件存在，就将其中的用户名读取到内存中（见 ❷），

再执行else 代码块，即打印一条欢迎用户回来的消息。用户首次运行这个程序时，文件 username.json 不存在，将引发 FileNotFoundError 异常（见 ❸ ），因此 Python 将执

行 except 代码块：提示用户输入其用户名（见 ❹ ），再使用 json.dump() 存储该用户名，并打印一句问候语（见 ❺ ）。

无论执行的是 except 代码块还是 else 代码块，都将显示用户名和合适的问候语。

如果这个程序是首次运行，输出将如下：

What is your name? Eric

We'll remember you when you come back, Eric!

否则，输出将如下：

Welcome back, Eric!

这是程序之前至少运行了一次时的输出。

10.4.3 重构

你经常会遇到这样的情况：代码能够正确地运行，但可做进一步的改进 —— 将代码划分为一系列完成具体工作的函数。这样的过程被称为重构。重构让代码更清晰、更易于理

解、更容易扩展。

要重构 remember_me.py ，可将其大部分逻辑放到一个或多个函数中。 remember_me.py 的重点是问候用户，因此我们将其所有代码都放到一个名为 greet_user() 的函数中：

remember_me.py

import json

def greet_user(): ❶ """ 问候用户，并指出其名字 """

filename = 'username.json'

try:

with open(filename) as f_obj:

username = json.load(f_obj)

except FileNotFoundError:

username = input("What is your name? ")

with open(filename, 'w') as f_obj:

json.dump(username, f_obj)

print("We'll remember you when you come back, " + username + "!")

else:

print("Welcome back, " + username + "!")

greet_user()

考虑到现在使用了一个函数，我们删除了注释，转而使用一个文档字符串来指出程序是做什么的（见 ❶ ）。这个程序更清晰些，但函数 greet_user() 所做的不仅仅是问候用

户，还在存储了用户名时获取它，而在没有存储用户名时提示用户输入一个。

下面来重构 greet_user() ，让它不执行这么多任务。为此，我们首先将获取存储的用户名的代码移到另一个函数中：

import json

def get_stored_username():

❶ """ 如果存储了用户名，就获取它 """

filename = 'username.json'

try:

with open(filename) as f_obj:

username = json.load(f_obj)

except FileNotFoundError:

❷ return None

else:

return username

def greet_user():

""" 问候用户，并指出其名字 """

username = get_stored_username()

❸ if username:

print("Welcome back, " + username + "!")

else:

username = input("What is your name? ")

filename = 'username.json'

with open(filename, 'w') as f_obj:

json.dump(username, f_obj)

print("We'll remember you when you come back, " + username + "!")

greet_user()

新增的函数 get_stored_username() 目标明确， ❶ 处的文档字符串指出了这一点。如果存储了用户名，这个函数就获取并返回它；如果文件 username.json 不存在，这个函数

就返回 None （见 ❷ ）。这是一种不错的做法：函数要么返回预期的值，要么返回 None ；这让我们能够使用函数的返回值做简单测试。在 ❸ 处，如果成功地获取了用户名，就打

印一条欢迎用户回来的消息，否则就提示用户输入用户名。

我们还需将 greet_user() 中的另一个代码块提取出来：将没有存储用户名时提示用户输入的代码放在一个独立的函数中：

import json

def get_stored_username():

""" 如果存储了用户名，就获取它 """

--snip--

def get_new_username():

""" 提示用户输入用户名 """

username = input("What is your name? ")

filename = 'username.json'

with open(filename, 'w') as f_obj:

json.dump(username, f_obj)

return username

def greet_user():

""" 问候用户，并指出其名字 """

username = get_stored_username()

if username:

print("Welcome back, " + username + "!")

else:

username = get_new_username()

print("We'll remember you when you come back, " + username + "!")

greet_user()

在 remember_me.py 的这个最终版本中，每个函数都执行单一而清晰的任务。我们调用 greet_user() ，它打印一条合适的消息：要么欢迎老用户回来，要么问候新用户。为此，

它首先调用 get_stored_username() ，这个函数只负责获取存储的用户名（如果存储了的话），再在必要时调用 get_new_username() ，这个函数只负责获取并存储新

用户的用户名。要编写出清晰而易于维护和扩展的代码，这种划分工作必不可少。

动手试一试

10-11 喜

喜欢

欢的

的数

数字

字：编写一个程序，提示用户输入他喜欢的数字，并使用 json.dump() 将这个数字存储到文件中。再编写一个程序，从文件中读取这个值，并打印

消息 “I knowyour favorite number! It's _____.” 。

10-12 记

记住

住喜

喜欢

欢的

的数

数字

字：将练习 10-11 中的两个程序合而为一。如果存储了用户喜欢的数字，就向用户显示它，否则提示用户输入他喜欢的数字并将其存储到文件中。

运行这个程序两次，看看它是否像预期的那样工作。

10-13 验

验证

证用

用户

户：最后一个 remember_me.py 版本假设用户要么已输入其用户名，要么是首次运行该程序。我们应修改这个程序，以应对这样的情形：当前和最后一次

运行该程序的用户并非同一个人。

为此，在 greet_user() 中打印欢迎用户回来的消息前，先询问他用户名是否是对的。如果不对，就调用 get_new_username() 让用户输入正确的用户名。

10.5 小结

在本章中，你学习了：如何使用文件；如何一次性读取整个文件，以及如何以每次一行的方式读取文件的内容；如何写入文件，以及如何将文本附加到文件末尾；什么是异常以

及如何处理程序可能引发的异常；如何存储Python数据结构，以保存用户提供的信息，避免用户每次运行程序时都需要重新提供。在第11章中，你将学习高效的代码测试方式，这可帮助你确定代码正确无误，以及发现扩展现有程序时可能引入的bug。

你可能感兴趣的:(Python读书笔记)

跟我一起学Python数据处理（七十五）：网页抓取之网页分析技巧 lilye66 python 开发语言 pandas matplotlib
跟我一起学Python数据处理（七十五）：网页抓取之网页分析技巧大家好呀！在Python数据处理的学习道路上，我深知独自摸索可能会遇到不少困难，所以希望通过这些博客，能和大家一起学习、共同进步，让我们都能更熟练地掌握这门技术。今天，咱们接着深入探讨网页抓取中的关键环节——分析网页。一、网页抓取与网页分析的关联网页抓取是获取网络数据的重要手段，在数据处理流程里占据着关键位置。而网页分析则是网页抓取的
跨语言语义理解与生成：多语言预训练方法及一致性优化策略网罗开发 AI 大模型人工智能深度学习负载均衡
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Python 抽象基类 ABC ：从实践到优雅 python
今天我们来聊聊Python中的抽象基类（AbstractBaseClass，简称ABC）。虽然这个概念在Python中已经存在很久了，但在日常开发中，很多人可能用得并不多，或者用得不够优雅。让我们从一个实际场景开始：假设你正在开发一个文件处理系统，需要支持不同格式的文件读写，比如JSON、CSV、XML等。初始版本：简单但不够严谨我们先来看看最简单的实现方式：classFileHandler:de
Python 并发编程实战：优雅地使用 concurrent.futures python
在Python多线程编程中，concurrent.futures模块提供了一个高层的接口来异步执行可调用对象。今天，我们将通过一个循序渐进的案例，深入了解如何使用这个强大的工具。从一个模拟场景开始假设我们需要处理一批网络请求。为了模拟这个场景，我们使用sleep来代表耗时操作：importtimeimportrandomdefslow_operation(task_id):"""模拟一个耗时的网络
shutil 标准库： Python 文件操作的万用刀 python
今天来聊一个被低估的Python标准库-shutil。工作中我们用Python（尤其是写一些短小轻快的脚本）虽然经常和文件打交道，却很少用到shutil。但实际上，shutil提供了比os模块更高级的文件操作接口，能让我们写出更Pythonic的代码。从一个真实场景说起最近在整理项目代码时，需要将散落在各处的配置文件归类到统一目录。按以往的习惯，我会这样写：importos#创建目标目录ifnot
Python 自带的日期日历处理大师：calendar 库 python
在Python开发中，我们经常需要处理日期和时间。虽然datetime库是最常用的选择，但其实Python标准库中的calendar模块也是一个强大的工具，特别适合处理日历相关的计算和展示。从一个真实场景开始假设你正在开发一个会议室预订系统，需要：展示月度视图计算工作日处理节假日逻辑让我们看看如何用calendar来优雅地解决这些问题。基础用法：生成日历importcalendar#创建日历对象c
Python性能优化的幕后功臣： __pycache__与字节码缓存机制 python
在日常Python开发中，我们经常会看到项目目录下神秘的__pycache__文件夹和.pyc文件。作为经验丰富的Python开发者，今天让我们深入理解这个性能优化机制。从一个性能困扰说起最近在优化一个数据处理微服务时，发现每次启动服务都需要2-3秒的预热时间。通过profile可以发现大量时间花在了Python模块的加载上。Python的编译过程与大多数人的认知不同，Python并不是纯解释型语
Python Generator：一个被低估的性能利器 python
调用OpenAI的API时，设置stream=True，接着forchunkincompletion:我们就可以“流式”地获取响应的内容。而非等待远程的模型将所有内容生成完毕，再返回给我们（这通常要等很久）。本文讨论这背后的PythonGenerator。从一个经典问题开始假设我们要处理一个超大的日志文件，需要按行读取并分析。传统的做法是：defread_log_file(filename):re
Python `__slots__` 进阶指南：不止于节省内存，从原理到实践 python
相信不少Python开发者都听说过__slots__，知道它可以帮助节省内存。但你是否思考过它背后的原理，以及在实际开发中的其他妙用？让我们一起深入探讨。从一个性能问题说起假设你的一个系统需要处理大量的订单对象：classOrder:def__init__(self,order_id,symbol,price,quantity):self.order_id=order_idself.symbol=
Python 元类（Meta Class）：解密 Python 面向对象编程的幕后推手后端python
在Python编程中，我们每天都在和类打交道，但是你是否也和我一样想过：类本身是什么？是谁创建了类？元类（MetaClass）就是用来创建类的"类"。今天让我们一起深入理解这个强大而神秘的特性。从一个简单的类说起classPerson:def__init__(self,name):self.name=namedefgreet(self):returnf"Hello,I'm{self.name}"#
langchain系列（二）- 提示词模板以及消息码--到成功大语言模型 langchain
导读环境：OpenEuler、Windows11、WSL2、Python3.12.3langchain0.3背景：前期忙碌的开发阶段结束，需要沉淀自己的应用知识，过一遍LangChain时间：20250212说明：技术梳理提示词模板理论说明提示模板将用户输入和参数转换为语言模型的指令，以此来实现模型的响应，帮助它理解上下文并生成相关且连贯的基于语言的输出。其接受一个字典作为输入，其中每个键代表提示
langchain系列 - FewShotPromptTemplate 少量示例码--到成功大语言模型 langchain
导读环境：OpenEuler、Windows11、WSL2、Python3.12.3langchain0.3背景：前期忙碌的开发阶段结束，需要沉淀自己的应用知识，过一遍LangChain时间：20250220说明：技术梳理，针对FewShotPromptTemplate专门来写一篇博客概念说明few-shot最初来源于机器学习的概念，还有one-shot、zero-shot概念，概念如下：机器学习
nginx ngx_http_module(9) 指令详解 s_fox_ nginx nginx http 运维
nginxngx_http_module(9)指令详解nginx模块目录nginx全指令目录一、目录1.1模块简介ngx_http_uwsgi_module：uWSGI支持模块，允许Nginx与uWSGI服务器进行通信。uWSGI是一种应用服务器协议，广泛用于PythonWeb应用的部署。通过该模块，Nginx可以将动态请求转发给uWSGI服务器处理，并将响应返回给客户端。常用的指令包括uwsgi
sql注入之python脚本进行时间盲注和布尔盲注温柔小胖 sql 数据库网络安全
一、什么是时间盲注和布尔盲注？答：时间盲注是攻击者通过构造恶意sql语句利用sleep()等延迟函数来观察数据库响应时间差异来进行推断信息和条件判断。如果条件为真，数据库会执行延时操作，如果为假则立即返回。响应时间较短。SELECTIF(1=1,SLEEP(5),0);如果条件为真、数据库会暂停5s如果条件为假、数据库会立即返回布尔盲注通过观察数据库返回的不同响应（如真或假）来推断信息。攻击者构造
Python中的生成器表达式（generator expression） Java资深爱好者 python python 开发语言
Python中的生成器表达式（generatorexpression）是一种类似于列表解析（listcomprehension）的语法结构，但它返回的是一个生成器（generator）对象，而不是一个完整的列表。生成器对象是一个迭代器，它可以逐个产生元素，而不是一次性生成所有元素，从而节省内存空间。生成器表达式在形式上与列表解析非常相似，但是它们使用圆括号()而不是方括号[]。当你迭代生成器表达式
Ollama部署大模型，本地调用居7然 android 人工智能 chatgpt 爬虫开发语言 AI编程
Ollama简单介绍Ollama是一个强大的大型语言模型平台，它允许用户轻松地下载、安装和运行各种大型语言模型。在本文中，我将指导你如何在你的本地机器上部署Ollama，并展示如何使用Python进行简单的API调用以访问这些模型最近很多人在学习大模型的时候，也遇到这个问题了，Ollama下载的模型，如果不想在命令行里面直接使用，而是想用Python去调用大模型该如何去使用？这是Ollama的官网
PyInstaller参数大揭秘：一文读懂打包神器的核心密码 Abossss Python python
一、引言在Python开发的广阔领域中，我们常常会面临这样一个问题：如何将自己精心编写的Python脚本，分享给那些没有Python环境的小伙伴，或者部署到生产环境中呢？这时候，PyInstaller库就如同一位救星，闪亮登场。PyInstaller是一个功能强大的跨平台打包工具，它可以将Python脚本及其所有依赖项，打包成一个独立的可执行文件。这意味着，无论目标系统是否安装了Python环境，
量化交易策略都有哪些？怎么运用？股票程序化交易接口 Python股票量化交易股票API接口量化交易量化交易策略均值回归动量策略风险控制股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>均值回归策略：寻找价格的回归点均值回归的原理均值回归策略是基于一种市场现象，即价格不会永远偏离其长期的平均值。从市场的历史数据来看，无论是股票、期货还是其他金融资产，价格总是围绕着一个均值上下波动。这就像一个有弹性的绳子，当价格被拉伸
【全栈】SprintBoot+vue3迷你商城-细节解析（2）：分页杰九 vue.js spring boot java
【全栈】SprintBoot+vue3迷你商城-细节解析（2）：分页往期的文章都在这里啦，大家有兴趣可以看一下后端部分：【全栈】SprintBoot+vue3迷你商城（1）【全栈】SprintBoot+vue3迷你商城（2）【全栈】SprintBoot+vue3迷你商城-扩展：利用python爬虫爬取商品数据【全栈】SprintBoot+vue3迷你商城（3）【全栈】SprintBoot+vue3
有需要2025年参加蓝桥杯比赛的同学往下看！！！岱宗夫up 教程蓝桥杯职场和发展
有需要2025年参加蓝桥杯比赛的同学往下下看！！！以下是关于近两年（2023年和2024年）蓝桥杯Python组考点的详细总结：一、2023年蓝桥杯Python考点分析在2023年的蓝桥杯Python竞赛中，考点主要集中在基础算法、数据结构、动态规划、数学、高精度计算以及二分查找等方面。（一）基础算法基础算法是竞赛的基石，包括枚举、排序（如冒泡排序、选择排序、插入排序等）、搜索（如BFS和DFS）
Ubuntu22 安装多个版本的python 莫忘初心丶 python 数据库开发语言
前言使用pyenv是一个很好的选择，尤其是在需要管理多个Python版本时。它提供了一个简单的方法来安装、切换和管理多个版本的Python，而不必依赖系统的包管理器或update-alternatives。特别是当你需要在同一系统中频繁切换Python版本时，pyenv会显得更加方便。目录前言为什么使用`pyenv`安装`pyenv`1.安装依赖2.安装`pyenv`3.配置shell环境4.安装
python的继承 zhangbeizhen18 L01-基础
记录：备忘录。1.继承classPerson(object):def__init__(self,p_name,p_addr,p_age):self.name=p_nameself.addr=p_addrself.age=p_ageclassGirl(Person):def__init__(self,g_name,g_addr,g_age,g_bra_cup):Person.__init__(sel
【MySQL】表空间丢失处理（Tablespace is missing for table 错误处理） m0_74824823 面试学习路线阿里巴巴 mysql 数据库
问题背景最近，我在运行一个基于Python爬虫的项目时，爬虫需要频繁与MySQL数据库交互。不幸的是，在数据爬取过程中，Windows系统突然强制更新并重启。这次意外中断导致MySQL数据库的三个表格（2022年、2023年和2024年的数据表）出现了“Tablespaceismissing”的错误。起初，我尝试了常规的CHECKTABLE和REPAIRTABLE方法，但这些都没有解决问题。最终，
Python 继承详解江湖一条鱼 python
继承是面向对象编程（OOP）的一个重要特性，允许一个类（子类）从另一个类（父类）继承属性和方法。继承可以提高代码的重用性，增强程序的可扩展性和可维护性。目录一、继承的作用二、继承的语法1.单继承2.多继承三、子类扩展1.添加新功能2.重写父类方法3.调用父类方法四、继承的特殊情况1.子类初始化父类2.方法解析顺序（MRO）五、抽象类与接口1.抽象类2.接口3.ABC类4.使用方法1.定义抽象基类2
【如何学习商城源码】启山智软商城源码微信小程序小程序 java
学习商城源码是一个系统而深入的过程，需要掌握多种方法和技巧。以下是一些建议，帮助你有效地学习商城源码：一、搭建学习环境准备开发工具编程语言相关：根据商城源码使用的编程语言，安装相应的集成开发环境（IDE）。例如，若源码是Java语言编写的，可安装IntelliJIDEA或Eclipse；若是Python语言，可选择PyCharm等。这些IDE能帮助你高效地编辑、调试代码，提供语法高亮、自动补全等功
从零创建一个 Django 项目 m0_74824823 面试学习路线阿里巴巴 django python 后端
1.准备环境在开始之前，确保你的开发环境满足以下要求：安装了Python(推荐3.8或更高版本)。安装pip包管理工具。如果要使用MySQL或PostgreSQL，确保对应的数据库已安装。创建虚拟环境在项目目录中创建并激活虚拟环境，保证项目依赖隔离：#创建虚拟环境python-mvenvenv#激活虚拟环境#WindowsenvScriptsactivate#Linux/Macsourceenv/
anaconda中的python在pycharm中用不了_Pycharm中使用Anaconda 白白前
Pycharm中使用Anaconda问题：安装完Pycharm和Anaconda后，想让Pycharm能调用Anaconda中包含的各种包。这样就不用重复安装各种包了。Anaconda下载安装Anaconda指的是一个开源的Python发行版本，其包含了conda、Python等180多个科学包及其依赖项。因为包含了大量的科学包，Anaconda的下载文件比较大(约515MB)。安装Anacond
python - 永久存储 susie0815 python python 服务器
打开文件使用open()函数打开文件时，openfilemode（文件打开模式）是一个决定了以何种方式打开文件以及对文件可以进行哪些操作的重要参数。基本模式只读模式（‘r’）默认的打开模式，用于读取文件。如果文件不存在，会抛出FileNotFoundError异常。try:file=open('test.txt','r')content=file.read()print(content)file.
自动化测试的学习路线 Ws＿学习
自动化测试是提高软件开发效率和质量的关键手段。学习自动化测试通常涉及多个方面的技能，从基础的编程语言知识到测试工具的使用，再到实际的测试脚本编写和执行。以下是一个学习自动化测试的路线图，帮助你有条不紊地掌握相关技能：1.基础知识在开始自动化测试之前，首先要具备一定的编程和软件测试基础：编程语言：Python、Java、JavaScript或者Ruby（根据你选择的自动化测试工具决定）软件测试基础：
Python自动化测试 Ws＿ python python
Python自动化测试是软件开发中的重要组成部分，可以帮助提高测试效率和准确性。以下是学习Python自动化测试的基本路线，以及相关资料的链接：学习路线1.基础知识Python基础：掌握Python语言的基本语法、数据类型、控制流、函数、面向对象编程等。你可以先确保对Python的基本语法有清晰的理解。参考资料：Python官方文档书籍推荐：《Python编程：从入门到实践》2.了解自动化测试的基
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l