要读取文件,需要一个包含几行文本的文件。下面首先来创建一个文件,它包含精确到小数点后30位的圆周率值,且在小数点后每10位处都换行:
pi_digits.txt
3.1415926535
8979323846
2643383279
下面的程序打开并读取这个文件,再将其内容显示到屏幕上:
with open('pi_digits.txt') as file_object:
contents = file_object.read()
print(contents)
函数open()接受一个参数:要打开的文件的名称。函数open() 返回一个表示文件的对象.在这里,open(‘pi_digits.txt’) 返回一个表示文件pi_digits.txt 的对象;Python将这个对象存储在我们将在后面使用的变量中。
关键字with 在不再需要访问文件后将其关闭。
有了表示pi_digits.txt的文件对象后,我们使用方法read() 读取这个文件的全部内容,并将其作为一个长长的字符串存储在变量contents 中。这样,通过打印contents 的值,就可将这个文本文件的全部内容显示出来:
相比于原始文件,该输出唯一不同的地方是末尾多了一个空行。为何会多出这个空行呢?因为read() 到达文件末尾时返回一个空字符串,而将这个空字符串显示出来时就是一个空行。要删除多出来的空行,可在print 语句中使用rstrip() :
with open('pi_digits.txt') as file_object:
contents = file_object.read()
print(contents.rstrip())
Python方法rstrip() 删除(剥除)字符串末尾的空白。现在,输出与原始文件的内容完全相同:
3.1415926535
8979323846
2643383279
??? 在使用rstrip() 之前,我从输出上看不出来有空行。无论是从vscode的控制台,还是通过windows 命令行(python3 file_reader.py )使用rstrip() 前后输出看不出区别。。
linux/unix 中文件路径使用斜杠(/),windows 中文件路径使用反斜杠(\)
选择使用相对路径或者绝对路径都可。绝对路径通常比相对路径更长,因此可以将其存储在一个变量中,再将该变量传递给open()
注意: Windows系统有时能够正确地解读文件路径中的斜杠。如果你使用的是Windows系统,且结果不符合预期,请确保在文件路径中使用的是反斜杠。
要以每次一行的方式检查文件,可对文件对象使用for 循环:
filename = 'pi_digits.txt'
with open(filename) as file_object:
for line in file_object:
print(line)
输出:
3.1415926535
8979323846
2643383279
每行的末尾都有一个看不见的换行符,而print 语句也会加上一个换行符,因此每行末尾都有两个换行符。要消除这些多余的空白行,可在print 语句中使用rstrip() :
filename = 'pi_digits.txt'
with open(filename) as file_object:
for line in file_object:
print(line.rstrip())
使用关键字with 时,open() 返回的文件对象只在with 代码块内可用。如果要在with 代码块外访问文件的内容,可在with 代码块内将文件的各行存储在一个列表中,并在with 代码块外使用该列表
filename = 'pi_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
for line in lines:
print(line.rstrip())
法readlines() 从文件中读取每一行,并将其存储在一个列表中;接下来,该列表被存储到变量lines 中。然后用for 循环打印每一行
输出:
3.1415926535
8979323846
2643383279
filename = 'pi_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
pi_string = ""
for line in lines:
pi_string += line.strip()
print(pi_string)
print(len(pi_string))
输出:
3.141592653589793238462643383279
32
注意: 读取文本文件时,Python将其中的所有文本都解读为字符串。如果你读取的是数字,并要将其作为数值使用,就必须使用函数int() 将其转换为整数,或使用函数float() 将其转换为浮点数。
保存数据的最简单的方式之一是将其写入到文件中。
要将文本写入文件,你在调用open() 时需要提供另一个实参,告诉Python你要写入打开的文件。
file_name = 'programming.txt'
with open(file_name, 'w') as file_object:
file_object.write("I love programming.")
调用open() 时提供了两个实参。第一个实参也是要打开的文件的名称;第二个实参(‘w’ )告诉Python,我们要以写入模式 打开这个文件。打开文件时,可指定读取模式 (‘r’ )、写入模式 (‘w’ )、附加模式 (‘a’ )或让你能够读取和写入文件的模式(‘r+’ )。如果你省略了模式实参,Python将以默认的只读模式打开文件。
如果你要写入的文件不存在,函数open() 将自动创建它。然而,以写入(‘w’ )模式打开文件时千万要小心,因为如果指定的文件已经存在,Python将在返回文件对象前清空该文件。
注意: Python只能将字符串写入文本文件。要将数值数据存储到文本文件中,必须先使用函数str() 将其转换为字符串格式。
函数write() 不会在你写入的文本末尾添加换行符!
file_name = 'programming.txt'
with open(file_name, 'w') as file_object:
file_object.write("This is a test.")
file_object.write("Test again.")
打开programming.txt:
This is a test.Test again.
在代码中添加换行符
file_name = 'programming.txt'
with open(file_name, 'w') as file_object:
file_object.write("This is a test.\n")
file_object.write("Test again.\n")
再打开programming.txt
This is a test.
Test again.
像显示到终端的输出一样,还可以使用空格、制表符和空行来设置这些输出的格式。
如果你要给文件添加内容,而不是覆盖原有的内容,可以附加模式 打开文件。你以附加模式打开文件时,Python不会在返回文件对象前清空文件,而你写入到文件的行都将添加到文件末尾。如果指定的文件不存在,Python将为你创建一个空文件。
file_name = 'programming.txt'
with open(file_name, 'a') as file_object:
file_object.write("I also love finding meaning in large datasets.\n")
file_object.write("I love creating apps that can run in a browser.\n")
打开programming.txt
This is a test.
Test again.
I also love finding meaning in large datasets.
I love creating apps that can run in a browser.
Python使用被称为异常 的特殊对象来管理程序执行期间发生的错误。每当发生让Python不知所措的错误时,它都会创建一个异常对象。如果你编写了处理该异常的代码,程序将继续运行;如果你未对异常进行处理,程序将停止,并显示一个traceback,其中包含有关异常的报告。
异常是使用try-except 代码块处理的。try-except 代码块让Python执行指定的操作,同时告诉Python发生异常时怎么办。使用了try-except 代码块时,即便出现异常,程序也将继续运行:显示你编写的友好的错误消息,而不是令用户迷惑的traceback。
print(5/0)
输出:
Traceback (most recent call last):
File "d:\vspywork\write_message.py", line 1, in
print(5/0)
ZeroDivisionError: division by zero
在上述traceback中,ZeroDivisionError 是一个异常对象。Python无法按你的要求做时,就会创建这种对象。在这种情况下,Python将停止运行程序,并指出引发了哪种异常,而我们可根据这些信息对程序进行修改。下面我们将告诉Python,发生这种错误时怎么办
当你认为可能发生了错误时,可编写一个try-except 代码块来处理可能引发的异常。你让Python尝试运行一些代码,并告诉它如果这些代码引发了指定的异常,该怎么办。
try:
print(5/0)
except ZeroDivisionError:
print("You can't divide by zero!")
输出:
You can't divide by zero!
如果try-except 代码块后面还有其他代码,程序将接着运行。
发生错误时,如果程序还有工作没有完成,妥善地处理错误就尤其重要。这种情况经常会出现在要求用户提供输入的程序中;如果程序能够妥善地处理无效输入,就能再提示用户提供有效输入,而不至于崩溃。
下面来创建一个只执行除法运算的简单计算器:
print("Give me two number,and I'll divide them.")
print("Enter 'q' to end the program.")
while True:
first_number = input("请输入被除数:")
if first_number == 'q':
break
second_number = input("请输入除数:")
if second_number == 'q':
break
answer = int(first_number) / int(second_number)
print(answer)
如果用户怀有恶意,他会通过traceback获悉你不希望他知道的信息。例如,他将知道你的程序文件的名称,还将看到部分不能正确运行的代码。有时候,训练有素的攻击者可根据这些信息判断出可对你的代码发起什么样的攻击(有bear来)。
print("Give me two numbers,and I'll divide them!")
print("Enter 'q' to end the program.")
while True:
first_number = input("请输入被除数:")
if first_number == 'q':
break
second_number = input("请输入除数:")
if second_number == 'q':
break
try:
answer = int(first_number) / int(second_number)
except ZeroDivisionError:
print("You can't divide by zero.")
else:
print(answer)
通过预测可能发生错误的代码,可编写健壮的程序,它们即便面临无效数据或缺少资源,也能继续运行,从而能够抵御无意的用户错误和恶意的攻击。
使用文件时,一种常见的问题是找不到文件:你要查找的文件可能在其他地方、文件名可能不正确或者这个文件根本就不存在。对于所有这些情形,都可使用try-except 代码块以直观的方式进行处理。
file_name = "alice.txt"
with open(file_name) as f_obj:
contents = f_obj.read()
输出:
Traceback (most recent call last):
File "d:\vspywork\write_message.py", line 3, in
with open(file_name) as f_obj:
FileNotFoundError: [Errno 2] No such file or directory: 'alice.txt'
在这个示例中,这个错误是函数open() 导致的,因此要处理
这个错误,必须将try 语句放在包含open() 的代码行之前:
file_name = 'alice.txt'
try:
with open(file_name) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
print("Sorry,the file " + file_name + " does not exist.")
方法split() ,它根据一个字符串创建一个单词列表。
>>>title = "Alice in Wonderland"
>>> title.split()
>>>['Alice', 'in', 'Wonderland']
方法split() 以空格为分隔符将字符串分拆成多个部分,并将这些部分都存储到一个列表中。结果是一个包含字符串中所有单词的列表,虽然有些单词可能包含标点
从Gutenberg(http://gutenberg.org/ )下载Alicein Wonderland 的文本,并重命名为alice.txt
filename = "alice.txt"
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
msg = "Sorry, the file " + filename + " does not exist."
print(msg)
else:
"计算文件大致包含多少个单词"
words = contents.split()
num_words = len(words)
print("The file " + filename + " has about " + str(num_words) + " words.")
def count_words(filename):
"""计算一个文件包含多少单词"""
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
msg = "Sorry, the file " + filename + " is not found"
print(msg)
else:
words = contents.split()
num_words = len(words)
print("The file " + filename + " has about " + str(num_words) + " words.")
filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
count_words(filename)
其中文件siddhartha.txt不存在,输出:
The file alice.txt has about 4 words.
Sorry, the file siddhartha.txt is not found
The file moby_dick.txt has about 3 words.
The file little_women.txt has about 6 words.
Python有一个pass 语句,可在代码块中使用它来让Python 什么都不要做:
def count_words(filename):
"""计算一个文件包含多少单词"""
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
pass
else:
words = contents.split()
num_words = len(words)
print("The file " + filename + " has about " + str(num_words) + " words.")
filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
count_words(filename)
输出:
The file alice.txt has about 4 words.
The file moby_dick.txt has about 3 words.
The file little_women.txt has about 6 words.
模块json 让你能够将简单的Python数据结构转储到文件中,并在程序再次运行时加载该文件中的数据。你还可以使用json 在Python程序之间分享数据。更重要的是,JSON数据格式并非Python专用的,这让你能够将以JSON格式存储的数据与使用其他编程语言的人分享。这是一种轻便格式,很有用,也易于学习。
我们来编写一个存储一组数字的简短程序,再编写一个将这些数字读取到内存中的程序。第一个程序将使用json.dump() 来存储这组数字,而第二个程序将使用json.load() 。
函数json.dump() 接受两个实参:要存储的数据以及可用于存储数据的文件对象。下面演示了如何使用json.dump() 来存储数字列表:
import json
numbers = [2, 3, 5, 7, 11, 13]
filename = 'numbers.json'
with open(filename, 'w') as f_obj:
json.dump(numbers, f_obj)
我们先导入模块json ,再创建一个数字列表。我们指定了要将该数字列表存储到其中的文件的名称。接下来,以写入模式打开这个文件,让json 能够将数据写入其中。我们使用函数json.dump() 将数字列表存储到文件numbers.json中。
下面再编写一个程序,使用json.load() 将这个列表读取到内存中:
import json
filename = "numbers.json"
with open(filename) as f_obj:
numbers = json.load(f_obj)
print(numbers)
输出:
[2, 3, 5, 7, 11, 13]
这次我们以读取方式打开这个文件,然后使用函数json.load() 加载存储在
numbers.json中的信息,并将其存储到变量numbers 中。最后,我们打印恢复的数字列表
存储用户的名字 remember.py
import json
username = input("Whats your name?")
filename = 'username.json'
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We will remember you when you come back, " + username + "!")
向名字被存储的用户发出问候 greet_user.py
import json
filename = 'username.json'
with open(filename) as f_obj:
username = json.load(f_obj)
print("Welcome back, " + username + "!")
将上面两个程序合并到一个程序 remember_me.py
import json
#如果以前存储了用户名,就加载它
#否则,就提示用户输入用户名并存储它
filename = 'username.json'
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
username = input("What your name?")
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We'll remember you when you come back, " + username + "!")
else:
print("Welcome back, " + username +"!")
代码能够正确地运行,但可做进一步的改进——将代码划分为一系列完成具体工作的函数。这样的过程被称为重构 。重构让代码更清晰、更易于理解、更容易扩展。
要重构remember_me.py,可将其大部分逻辑放到一个或多个函数中。remember_me.py的重点是问候用户,因此我们将其所有代码都放到一个名为greet_user() 的函数中
remember_me.py
import json
def greet_user():
"""问候用户,并指出其名字"""
filename = 'username.json'
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
username = input("What your name?")
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We'll remember you when you come back, " + username + "!")
else:
print("Welcome back, " + username +"!")
greet_user()
函数greet_user() 所做的不仅仅是问候用户,还在存储了用户名时获取它,而在没有存储用户名时提示用户输入一个。
import json
def get_stored_username():
"""如果存储了用户名,就获取它"""
filename = "username.json"
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
return None
else:
return username
def greet_user():
"""问候用户,并指出其名字"""
username = get_stored_username()
if username:
print("Welcome back, " + username + "!")
else:
username = input("What's your name?")
filename = 'username.json'
with open(filename, 'w') as f_obj:
json.dump(f_obj)
print("We'll remember you when you come back," + username + ".")
greet_user()
新增的函数get_stored_username() 目标明确,❶处的文档字符串指出了这一点。如果存储了用户名,这个函数就获取并返回它;如果文件username.json不存在,这个函数就返回None
继续重构,将greet_user() 中的另一个代码块提取出来,将没有存储用户名时提示用户输入的代码放在一个独立的函数 get_new_username()
import json
def get_stored_username():
"""如果存储了用户名,就获取它"""
filename = "username.json"
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
return None
else:
return username
def get_new_username():
username = input("What's your name?")
filename = 'username.json'
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
return username
def greet_user():
"""问候用户,并指出其名字"""
username = get_stored_username()
if username:
print("Welcome back, " + username + "!")
else:
username = get_new_username()
print("We'll remember you when you come back, " + username + "!")
greet_user()
第一次打印
filename = "learning_python.txt"
with open(filename) as f_obj:
contents = f_obj.read()
print(contents)
第二次打印
filename = "learning_python.txt"
with open(filename) as f_obj:
for line in f_obj:
print(line.rstrip())
第三次打印
filename = "learning_python.txt"
with open(filename) as f_obj:
lines = f_obj.readlines()
for line in lines:
print(line.rstrip())
filename = "learning_python.txt"
with open(filename) as f_obj:
lines = f_obj.readlines()
for line in lines:
print(line.replace('Python', 'Golang').rstrip())
filename = "guest.txt"
guest = input("Please enter your name: ")
with open(filename, 'w') as f_obj:
f_obj.write(guest)
filename = "guest_book.txt"
while True:
guest = input("Please enter your name: ")
if guest == 'q':
break
else:
print("Welcome to you, " + guest + ".")
with open(filename, 'a') as f_obj:
f_obj.write(guest + "\n")
filename = "reasons_programming.txt"
while True:
name = input("What's your name?")
if name == 'q':
break
reason = input("Why are you like programming?")
if reason == 'q':
break
name_reason = name.title() + ": " + reason
with open(filename, 'a') as f_obj:
f_obj.write(name_reason + "\n")
with open(filename) as f_obj:
lines = f_obj.readlines()
for line in lines:
print(line.rstrip())
这道题按照题目的意思,应该出现TypeError 异常,然而我操作时,出现的是ValueError 异常。
while True:
first_num = input("请输入第一个数字:")
if first_num == 'q':
break
second_num = input("请输入第二个数字:")
if second_num == 'q':
break
try:
answer = int(first_num) + int(second_num)
except ValueError:
print("请输入整数,谢谢配合")
else:
print(answer)
补充一个知识点,isdigit() 方法检测字符串是否只由数字组成,返回True或False
# 见10-6
filenames = ["cat.txt", "dog.txt"]
for filename in filenames:
try:
with open(filename) as f_obj:
animals = f_obj.readlines()
except FileNotFoundError:
print("The file " + filename + " is not found.")
else:
for animal in animals:
print(animal.rstrip())
filenames = ["cat.txt", "dog.txt"]
for filename in filenames:
try:
with open(filename) as f_obj:
animals = f_obj.readlines()
except FileNotFoundError:
pass
else:
for animal in animals:
print(animal.rstrip())
我的做法,做复杂了
filenames = ["first_book.txt", "second_book.txt"]
for filename in filenames:
with open(filename) as f_obj:
lines = f_obj.readlines()
sum = 0
for line in lines:
number = line.lower().count('the')
sum += number
print("There are " + str(sum) + " 'the' in the " + filename + ".")
别人的做法:
filenames = ["first_book.txt", "second_book.txt"]
for filename in filenames:
with open(filename) as f_obj:
contents = f_obj.read()
num = contents.lower().count("the")
print("There are " + str(num) + " 'the' in the " + filename + ".")
import json
filename = "favorite_number.json"
favorite_number = input("Your favorite number is: ")
with open(filename, 'w') as f_obj:
json.dump(favorite_number, f_obj)
with open(filename) as f_obj:
favorite_number = json.load(f_obj)
print("I know your favorite number!It's " + str(favorite_number) +".")
filename = "favorite_number.json"
try:
with open(filename) as f_obj:
favorite_number = json.load(f_obj)
except FileNotFoundError:
favorite_number = int(input("Your favorite number is: "))
with open(filename, 'w') as f_obj:
json.dump(favorite_number, f_obj)
else:
print("I know your favorite number!It's " + str(favorite_number) +".")
import json
def get_stored_username():
"""如果存储了用户名,就获取它"""
filename = "username.json"
try:
with open(filename) as f_obj:
username = json.load(f_obj)
except FileNotFoundError:
return None
else:
return username
def get_new_username():
username = input("What's your name?")
filename = 'username.json'
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
return username
def greet_user():
"""问候用户,并指出其名字"""
username = get_stored_username()
if username:
active = input("Are you " + username + "?y/n: ")
if active == 'y':
print("Welcome back, " + username + "!")
elif active == 'n':
username = get_new_username()
print("We'll remember you when you come back, " + username + "!")
else:
username = get_new_username()
print("We'll remember you when you come back, " + username + "!")
if __name__=="__main__":
greet_user()