Python编程从入门到实践(九)-文件和异常

1 从文件中读取数据
1.1 读取整个文件
要读取文件,需要一个包含几行文本的文件。下面首先来创建一个文件,它包含精确到小数点后30位的圆周率值,且在小数点后每10位处都换行:

pi_digits.txt
3.1415926535
  8979323846
  2643383279

Python编程从入门到实践(九)-文件和异常_第1张图片
为何会多出这个空行呢?因为read()到达文件末尾时返回一个空字符串,而将这个空字符串显示出来时就是一个空行。要删除末尾的空行,可在print语句中使用rstrip():

with open('pi_digits.txt')as file_object:
    contents=file_object.read()
    print (contents.rstrip())

输出:
3.1415926535
  8979323846
  2643383279
1.2 文件路径
要让Python打开不与程序文件位于同一个目录中的文件,需要提供文件路径,它让Python到系统的特定位置去查找。
由于文件夹text_files位于文件夹python_work中,因此可使用相对文件路径来打开该文件夹中的文件。相对文件路径让Python到指定的位置去查找,而该位置是相对于当前运行的程序所在目录的。在Linux和OS X中,你可以这样编写代码:

with open('text_files/filename.txt') as file_object:

这行代码让Python到文件夹python_work下的文件夹text_files中去查找指定的.txt文件。在Windows系统中,在文件路径中使用反斜杠(\)而不是斜杠(/):

with open('text_files\filename.txt') as file_object:

你还可以将文件在计算机中的准确位置告诉Python,这样就不用关心当前运行的程序存储在什么地方了。这称为绝对文件路径。在相对路径行不通时,可使用绝对路径。例如,如果text_files并不在文件夹python_work中,而在文件夹other_files中,则向open()传递路径’text_files/filename.txt’行不通,因为Python只在文件夹python_work中查找该位置。为明确地指出你希望Python到哪里去查找,你需要提供完整的路径。
绝对路径通常比相对路径更长,因此将其存储在一个变量中,再将该变量传递给open()会有所帮助。在Linux和OS X中,绝对路径类似于下面这样:

file_path = '/home/ehmatthes/other_files/text_files/filename.txt'
with open(file_path) as file_object:

而在Windows系统中,它们类似于下面这样:

file_path = 'C:\Users\ehmatthes\other_files\text_files\filename.txt'
with open(file_path) as file_object:

通过使用绝对路径,可读取系统任何地方的文件。就目前而言,最简单的做法是,要么将数据文件存储在程序文件所在的目录,要么将其存储在程序文件所在目录下的一个文件夹(如text_files)中。
注意Windows系统有时能够正确地解读文件路径中的斜杠。如果你使用的是Windows系统,且结果不符合预期,请确保在文件路径中使用的是反斜杠。另外,由于反斜杠在Python即在开头的单引号前加上r。
1.3 逐行读取
要以每次一行的方式检查文件,可对文件对象使用for循环:
Python编程从入门到实践(九)-文件和异常_第2张图片
为何会出现这些空白行呢?因为在这个文件中,每行的末尾都有一个看不见的换行符,而print语句也会加上一个换行符,因此每行末尾都有两个换行符:一个来自文件,另一个来自print语句。要消除这些多余的空白行,可在print语句中使用rstrip():
Python编程从入门到实践(九)-文件和异常_第3张图片
1.4 创建一个包含文件各行内容的列表
使用关键字with时,open()返回的文件对象只在with代码块内可用。如果要在with代码块外访问文件的内容,可在with代码块内将文件的各行存储在一个列表中,并在with代码块外使用该列表:你可以立即处理文件的各个部分,也可推迟到程序后面再处理。
下面的示例在with代码块中将文件pi_digits.txt的各行存储在一个列表中,再在with代码块外打印它们:

filename='pi_digits.txt'
with open(filename)as file_object:
    lines=file_object.readlines()
for line in lines:
        print (line.rstrip())

1.5 使用文件的内容
将文件读取到内存中后,就可以以任何方式使用这些数据了。下面以简单的方式使用圆周率的值。首先,我们将创建一个字符串,它包含文件中存储的所有数字,且没有任何空格:

filename='pi_digits.txt'
with open(filename)as file_object:
    lines=file_object.readlines()
pi_string=''
for line in lines:
        pi_string+=line.rstrip()
print (pi_string)
print(pi_string.__len__())

输出:
3.1415926535  8979323846  2643383279
36
在变量pi_string存储的字符串中,包含原来位于每行左边的空格,为删除这些空格,可使用strip()而不是rstrip():

filename='pi_digits.txt'
with open(filename)as file_object:
    lines=file_object.readlines()
pi_string=''
for line in lines:
        pi_string+=line.strip()
print (pi_string)
print(pi_string.__len__())

输出:
3.141592653589793238462643383279
32
注意读取文本文件时,Python将其中的所有文本都解读为字符串。如果你读取的是数字,并要将其作为数值使用,就必须使用函数int()将其转换为整数,或使用函数float()将其转换为浮点数。
1.6 包含一百万位的大型文件
前面我们分析的都是一个只有三行的文本文件,但这些代码示例也可处理大得多的文件。如果我们有一个文本文件,其中包含精确到小数点后1000000位而不是30位的圆周率值,也可创建一个包含所有这些数字的字符串。为此,我们无需对前面的程序做任何修改,只需将这个文件传递给它即可。在这里,我们只打印到小数点后12位

filename='pi_digits.txt'
with open(filename)as file_object:
    lines=file_object.readlines()
pi_string=''
for line in lines:
        pi_string+=line.strip()
print (pi_string[:12]+"...")
print(len(pi_string))

1.7 圆周率值中包含你的生日吗
我一直想知道自己的生日是否包含在圆周率值中。下面来扩展刚才编写的程序,以确定某个人的生日是否包含在圆周率值的前1000000位中。为此,可将生日表示为一个由数字组成的字符串,再检查这个字符串是否包含在pi_string中:
 

filename='pi_digits.txt'
with open(filename)as file_object:
    lines=file_object.readlines()
pi_string=''
for line in lines:
        pi_string+=line.strip()
birthday=input("Enter you birthday,in the form mmddyy:")
if birthday in pi_string:
    print ("Your birthday appears in the first million digits of pi! ")
else:
    print("Your birthday does not appear in the first million digits of pi.")

2 写入文件
2.1 写入空文件
要将文本写入文件,你在调用open()时需要提供另一个实参,告诉Python你要写入打开的文件。我们来将一条简单的消息存储到文件中,而不是将其打印到屏幕上:

filename='pi_digits.txt'
with open(filename,'w')as file_object:
    file_object.write("I love programming!")


在这个示例中,调用open()时提供了两个实参,第一个实参也是要打开的文件的名称第二个实参('w')告诉Python,我们要以写入模式打开这个文件。打开文件时,可指定读取模式('r')写入模式('w')附加模式('a')或让你能够读取和写入文件的模式('r+')。如果你省略了模式实参,Python将以默认的只读模式打开文件。
如果你要写入的文件不存在,函数open()将自动创建它。然而,以写入('w')模式打开文件时千万要小心,因为如果指定的文件已经存在,Python将在返回文件对象前清空该文件。

注意 Python只能将字符串写入文本文件。要将数值数据存储到文本文件中,必须先使用函数str()将其转换为字符串格式。
2.2 写入多行

要让每个字符串都单独占一行,需要在write()语句中包含换行符:

filename='pi_digits.txt'
with open(filename,'w')as file_object:
    file_object.write("I love programming!\n")
    file_object.write("I love creating new games.\n")

现在,输出出现在不同行中:
I love programming.
I love creating new games.
2.3 附加到文件
如果你要给文件添加内容,而不是覆盖原有的内容,可以附加模式打开文件。你以附加模式打开文件时,Python不会在返回文件对象前清空文件,而你写入到文件的行都将添加到文件末尾。如果指定的文件不存在,Python将为你创建一个空文件

filename='pi_digits.txt'
with open(filename,'a')as file_object:
    file_object.write("I also love finding meaning in large datasets.\n")
    file_object.write("I love creating apps that can run in a browser.\n")

此时文件内容:
I love programming.
I love creating new games.
I also love finding meaning in large datasets.
I love creating apps that can run in a browser.
3 异常
异常是使用try-except代码块处理的。try-except代码块让Python执行指定的操作,同时告诉Python发生异常时怎么办。使用了try-except代码块时,即便出现异常,程序也将继续运行:显示你编写的友好的错误消息,而不是令用户迷惑的traceback。
3.1使用try-except代码块
处理ZeroDivisionError异常的try-except代码块类似于下面这样:

try:
    print(5/0)
except ZeroDivisionError:
    print("You can't divide by zero! ")

输出:
You can't divide by zero!
如果try-except代码块后面还有其他代码,程序将接着运行,因为已经告诉了Python如何处理这种错误。下面来看一个捕获错误后程序将继续运行的示例。
3.3 使用异常避免崩溃
发生错误时,如果程序还有工作没有完成,妥善地处理错误就尤其重要。这种情况经常会出现在要求用户提供输入的程序中;如果程序能够妥善地处理无效输入,就能再提示用户提供有效输入,而不至于崩溃。
下面来创建一个只执行除法运算的简单计算器:

#division.py
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
    first_number = input("\nFirst number: ")
    if first_number == 'q':
        break
    second_number = input("Second number: ")
    if second_number == 'q':
        break
    answer = int(first_number) / int(second_number)
    print(answer)

输出:
Python编程从入门到实践(九)-文件和异常_第4张图片
3.4 else代码块
依赖于try代码块成功执行的代码都应放到else代码块中:

#division.py
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
    first_number = input("\nFirst number: ")
    if first_number == 'q':
        break
    second_number = input("Second number: ")
    try:
        answer = int(first_number) / int(second_number)
    except ZeroDivisionError:
        print("You can't divide by0! ")
    else:
        print(answer)

Python编程从入门到实践(九)-文件和异常_第5张图片
try-except-else代码块的工作原理大致如下:Python尝试执行try代码块中的代码;只有可能引发异常的代码才需要放在try语句中。有时候,有一些仅在try代码块成功执行时才需要运行的代码;这些代码应放在else代码块中。except代码块告诉Python,如果它尝试运行try代码块中的代码时引发了指定的异常,该怎么办。
通过预测可能发生错误的代码,可编写健壮的程序,它们即便面临无效数据或缺少资源,也能继续运行,从而能够抵御无意的用户错误和恶意的攻击。
3.5 处理FileNotFoundError异常
下面的程序尝试读取文件alice.txt的内容,但我没有将这个文件存储在alice.py所在的目录中:

#alice.py
filename = 'alice.txt'
try:
    with open(filename) as f_obj:
        contents = f_obj.read()
except FileNotFoundError:
    msg = "Sorry, the file " + filename + " does not exist."
    print(msg)

输出:
Sorry, the file alice.txt does not exist.
3.6 分析文本
你可以分析包含整本书的文本文件。很多经典文学作品都是以简单文本文件的方式提供的,因为它们不受版权限制。本节使用的文本来自项目Gutenberg(http://gutenberg.org/),这个项目提供了一系列不受版权限制的文学作品,如果你要在编程项目中使用文学文本,这是一个很不错的资源。
下面来提取童话Alice in Wonderland的文本,并尝试计算它包含多少个单词。我们将使用方法split(),它根据一个字符串创建一个单词列表。下面是对只包含童话名"Alice in Wonderland"的字符串调用方法split()的结果:

>>> title = "Alice in Wonderland">>> title.split()['Alice', 'in', 'Wonderland']

方法split()以空格为分隔符将字符串分拆成多个部分,并将这些部分都存储到一个列表中。结果是一个包含字符串中所有单词的列表,虽然有些单词可能包含标点。为计算Alice in Wonderland包含多少个单词,我们将对整篇小说调用split(),再计算得到的列表包含多少个元素,从而确定整篇童话大致包含多少个单词:

filename = 'alice.txt'
try:
    with open(filename) as f_obj:
      contents = f_obj.read()
except FileNotFoundError:
    msg = "Sorry, the file " + filename + " does not exist."
    print(msg)
else:
    # 计算文件大致包含多少个单词
     words = contents.split()
     num_words = len(words)
     print("The file " + filename + " has about " + str(num_words) + " words.")

3.7 使用多个文件
下面多分析几本书。

#word_count.py
def count_words(filename):
     """计算一个文件大致包含多少个单词"""
        try:
            with open(filename) as f_obj:
                contents = f_obj.read()
        except FileNotFoundError:
            msg = "Sorry, the file " + filename + " does not exist."
            print(msg)
        else:
            # 计算文件大致包含多少个单词       
           words = contents.split()
           num_words = len(words)
           print("The file " + filename + " has about " + str(num_words) +" words.")
filename = 'alice.txt'
count_words(filename)

 

def count_words(filename):
    --snip--
filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
   count_words(filename)


文件siddhartha.txt不存在,但这丝毫不影响这个程序处理其他文件:
The file alice.txt has about 29461 words.
Sorry, the file siddhartha.txt does not exist.
The file moby_dick.txt has about 215136 words.
The file little_women.txt has about 189079 words.
在这个示例中,使用try-except代码块提供了两个重要的优点:避免让用户看到traceback;让程序能够继续分析能够找到的其他文件。如果不捕获因找不到siddhartha.txt而引发的FileNotFoundError异常,用户将看到完整的traceback,而程序将在尝试分析Siddhartha后停止运行——根本不分析Moby Dick和Little Women。
3.8 失败时一声不吭
Python有一个pass语句,可在代码块中使用它来让Python什么都不要做:

def count_words(filename):
    """计算一个文件大致包含多少个单词"""
        try:
            --snip--
        except FileNotFoundError:
           pass
        else:
            --snip--

filenames = ['alice.txt', 'siddhartha.txt', 'moby_dick.txt', 'little_women.txt']
for filename in filenames:
     count_words(filename)


相比于前一个程序,这个程序唯一不同的地方是pass语句。现在,出现FileNotFoundError异常时,将执行except代码块中的代码,但什么都不会发生。这种错误发生时,不会出现traceback,也没有任何输出。用户将看到存在的每个文件包含多少个单词,但没有任何迹象表明有一个文件未找到:
The file alice.txt has about 29461 words.
The file moby_dick.txt has about 215136 words.
The file little_women.txt has about 189079 words.
pass语句还充当了占位符,它提醒你在程序的某个地方什么都没有做,并且以后也许要在这里做些什么。例如,在这个程序中,我们可能决定将找不到的文件的名称写入到文件missing_files.txt中。用户看不到这个文件,但我们可以读取这个文件,进而处理所有文件找不到的问题。
4 存储数据
一种简单的方式是使用模块json来存储数据。
模块json让你能够将简单的Python数据结构转储到文件中,并在程序再次运行时加载该文件中的数据。你还可以使用json在Python程序之间分享数据。更重要的是,JSON数据格式并非Python专用的,这让你能够将以JSON格式存储的数据与使用其他编程语言的人分享。
注意 JSON(JavaScript Object Notation)格式最初是为JavaScript开发的,但随后成了一种常见格式,被包括Python在内的众多语言采用。
4.1 使用json.dump()和json.load()
我们来编写一个存储一组数字的简短程序,再编写一个将这些数字读取到内存中的程序。第一个程序将使用json.dump()来存储这组数字,而第二个程序将使用json.load()。
函数json.dump()接受两个实参:要存储的数据以及可用于存储数据的文件对象。
Python编程从入门到实践(九)-文件和异常_第6张图片
Python编程从入门到实践(九)-文件和异常_第7张图片
下面再编写一个程序,使用json.load()将这个列表读取到内存中:

#number_reader.py
import json
filename = 'numbers.json'
with open(filename) as f_obj:
    numbers = json.load(f_obj)
print(numbers)

我们使用函数json.load()加载存储在numbers.json中的信息,并将其存储到变量numbers中。最后,我们打印恢复的数字列表:
[2, 3, 5, 7, 11, 13]
这是一种在程序之间共享数据的简单方式。
4.2 保存和读取用户生成的数据
对于用户生成的数据,使用json保存它们大有裨益,因为如果不以某种方式进行存储,等程序停止运行时用户的信息将丢失。下面来看一个这样的例子:用户首次运行程序时被提示输入自己的名字,这样再次运行程序时就记住他了。
我们先来存储用户的名字:

#remember_me.py
import json
username = input("What is your name? ")
filename = 'username.json'
with open(filename, 'w') as f_obj:
    json.dump(username, f_obj)
    print("We'll remember you when you come back, " + username + "! ")

Python编程从入门到实践(九)-文件和异常_第8张图片
现在再编写一个程序,向其名字被存储的用户发出问候:

#greet_user.py
import json
filename = 'username.json'
with open(filename) as f_obj:
    username = json.load(f_obj)
    print("Welcome back, " + username + "! ")


我们使用json.load()将存储在username.json中的信息读取到变量username中。恢复用户名后,我们就可以欢迎用户回来了:
Python编程从入门到实践(九)-文件和异常_第9张图片
我们需要将这两个程序合并到一个程序(remember_me.py)中。这个程序运行时,我们将尝试从文件username.json中获取用户名,因此我们首先编写一个尝试恢复用户名的try代码块。如果这个文件不存在,我们就在except代码块中提示用户输入用户名,并将其存储在username.json中,以便程序再次运行时能够获取它:

#remember_me.py
import json
# 如果以前存储了用户名,就加载它#  否则,就提示用户输入用户名并存储它  
filename = 'username.json'
try:
    with open(filename) as f_obj:
        username = json.load(f_obj)
except FileNotFoundError:
            username = input("What is your name? ")
            with open(filename, 'w') as f_obj:
                 json.dump(username, f_obj)
                 print("We'll remember you when you come back, " + username + "! ")
else:
    print("Welcome back, " + username + "! ")


无论执行的是except代码块还是else代码块,都将显示用户名和合适的问候语。如果这个程序是首次运行,输出将如下:

What is your name? Alena
We'll remember you when you come back, Alena!

否则,输出将如下:

Welcome back, Alena!

4.3 重构
你经常会遇到这样的情况:代码能够正确地运行,但可做进一步的改进——将代码划分为一系列完成具体工作的函数。这样的过程被称为重构。重构让代码更清晰、更易于理解、更容易扩展。
要重构remember_me.py,可将其大部分逻辑放到一个或多个函数中。remember_me.py的重点是问候用户,因此我们将其所有代码都放到一个名为greet_user()的函数中:

#remember_me.py
import json
def greet_user():
    """问候用户,并指出其名字"""
       filename = 'username.json'
       try:
           with open(filename) as f_obj:
               username = json.load(f_obj)
       except FileNotFoundError:
           username = input("What is your name? ")
           with open(filename, 'w') as f_obj:
               json.dump(username, f_obj)
               print("We'll remember you when you come back, " + username + "! ")
       else:
           print("Welcome back, " + username + "! ")
greet_user()

函数greet_user()所做的不仅仅是问候用户,还在存储了用户名时获取它,而在没有存储用户名时提示用户输入一个。
下面来重构greet_user(),让它不执行这么多任务。为此,我们首先将获取存储的用户名的代码移到另一个函数中:
 

 #import json
 def get_stored_username():
     """如果存储了用户名,就获取它"""
        filename = 'username.json'
        try:
            with open(filename) as f_obj:
                username = json.load(f_obj)
        except FileNotFoundError:
           return None
        else:
            return username

def greet_user():
        """问候用户,并指出其名字"""
        username = get_stored_username()
       if username:
            print("Welcome back, " + username + "! ")
        else:
            username = input("What is your name? ")
            filename = 'username.json'
            with open(filename, 'w') as f_obj:
                json.dump(username, f_obj)
                print("We'll rememberyou when you come back, " + username + "! ")

greet_user()


我们还需将greet_user()中的另一个代码块提取出来:将没有存储用户名时提示用户输入的代码放在一个独立的函数中:

#import json
def get_stored_username():
    """如果存储了用户名,就获取它"""
        --snip--

def get_new_username():
        """提示用户输入用户名"""
        username = input("What is your name? ")
        filename = 'username.json'
        with open(filename, 'w') as f_obj:
            json.dump(username, f_obj)
        return username

def greet_user():
        """问候用户,并指出其名字"""
        username = get_stored_username()
        if username:
            print("Welcome back, " + username + "! ")
        else:
            username = get_new_username()
            print("We'll remember you when you come back, " + username + "! ")

greet_user()


在remember_me.py的这个最终版本中,每个函数都执行单一而清晰的任务。我们调用greet_user(),它打印一条合适的消息:要么欢迎老用户回来,要么问候新用户。为此,它首先调用get_stored_username(),这个函数只负责获取存储的用户名(如果存储了的话),再在必要时调用get_new_username(),这个函数只负责获取并存储新用户的用户名。

你可能感兴趣的:(python)