你已经学过了 raw_input 和 argv,这些是你开始学习读取文件的必备基础。你可能需要多多实验才能明白它的工作原理,所以你要细心做练习,并且仔细检查结果。处理文件需要非常仔细,如果不仔细的话,你可能会吧有用的文件弄坏或者清空。导致前功尽弃。
这节练习涉及到写两个文件。一个正常的 ex15.py 文件,另外一个是 ex15_sample.txt,第二个文件并不是脚本,而是供你的脚本读取的文本文件。以下是后者的内容:This is stuff I typed into a file.
It is really cool stuff.
Lots and lots of fun to have in here.
我们要做的是把该文件用我们的脚本“打开(open)”,然后打印出来。然而把文件名ex15_sample.txt 写死(hardcode)在代码中不是一个好主意,这些信息应该是用户输入的才对。如果我们碰到其他文件要处理,写死的文件名就会给你带来麻烦了。我们的解决方案是使用 argv 和 raw_input 来从用户获取信息,从而知道哪些文件该被处理。# -*- coding:utf-8 -*-
from sys import argv #导入sys模块中的argv
script, filename = argv # argv 赋值给script, filename
txt = open(filename) #打开filename的txt文件
print "Here's your file %r:" % filename #输出打开文件名名字
print txt.read() #输出txt的内容
print "Type the filename again:"
file_again = raw_input(">") #输入信息
txt_again = open(file_again) #再次打开文件
print txt_again.read()
这个脚本中有一些新奇的玩意,我们来快速地过一遍:
代码的 1-3 行使用 argv 来获取文件名,这个你应该已经熟悉了。接下来第 5 行我们看到 open 这个新命令。现在请在命令行运行 pydoc open 来读读它的说明。你可以看到它和你自己的脚本、或者raw_input 命令类似,它会接受一个参数,并且返回一个值,你可以将这个值赋予一个变量。这就是
你打开文件的过程。
第 7 行我们打印了一小行,但在第 8 行我们看到了新奇的东西。我们在 txt 上调用了一个函数。你从open 获得的东西是一个 file ( 文件 ) ,文件本身也支持一些命令。它接受命令的方式是使用句点 . ( 英文称作 dot 或者 period) ,紧跟着你的命令,然后是类似 open 和 raw_input 一样的参数。不同点是:当你说 txt.read 时,你的意思其实是:“嘿 txt !执行你的 read 命令,无需任何参数!”
脚本剩下的部分基本差不多,不过我就把剩下的分析作为加分习题留给你自己了。
运行结果:D:\python\----python>python 习题15.py ex15_sample.txt
Here's your file 'ex15_sample.txt':
This is stuff I typed into a file.
It is really cool stuff.
Lots and lots of fun to have in here.
Type the filename again:
>ex15_sample.txt
This is stuff I typed into a file.
It is really cool stuff.
Lots and lots of fun to have in here.
加分习题
这节的难度跨越有点大,所以你要尽量做好这节加分习题,然后再继续后面的章节。
1.在每一行的上面用注解说明这一行的用途。
2. 如果你不确定答案,就问别人,或者上网搜索。大部分时候,只要搜索 “python” 加上你要搜的东西就能得到你要的答案。比如搜索一下“ python open” 。
3. 我使用了“命令”这个词,不过实际上它们的名字是“函数( function )”和“方法( method )。上网搜索一下这两者的意义和区别。看不明白也没关系,迷失在别的程序员的知识海洋里是很正常的一件事情。
4. 删掉 10-15 行使用到 raw_input 的部分,再运行一遍脚本。D:\python\----python>python 习题15.py ex15_sample.txt
Here's your file 'ex15_sample.txt':
This is stuff I typed into a file.
It is really cool stuff.
Lots and lots of fun to have in here.
5. 只是用 raw_input 写这个脚本,想想那种得到文件名称的方法更好,以及为什么。
当输入为纯数字时
input返回的是数值类型,如int(证书),float(浮点数)
raw_inpout返回的是字符串类型,string(字符串)类型
输入字符串为表达式
input会计算在字符串中的数字表达式,而raw_input不会。
如输入 “57 + 3”:
input会得到整数60
raw_input会得到字符串”57 + 3”
使用raw_input保证用户输入什么,就显示什么
6. 运行 pydoc file 向下滚动直到看见 read() 命令(函数 / 方法)。看到很多别的命令了吧,你可以找几条试试看。不需要看那些包含 __ (两个下划线)的命令,这些只是垃圾而已。
7. 再次运行 python 在命令行下使用 open 打开一个文件,这种 open 和 read 的方法也值得你一学。
8. 让你的脚本针对 txt and txt_again 变量执行一下 close() ,处理完文件后你需要将其关闭,这是很重要的一点。
常见问题回答
txt = open(filename) 返回的是文件的内容吗?
不是,它返回的是一个叫做“ file object” 的东西,你可以把它想象成一个磁带机或者 DVD 机。你可以随意访问内容的任意位置,并且去读取这些内容,不过这个 object 本身并不是它的内容。
我没法在我的 Terminal/PowerShell 命令行下输入 python 代码。
首先,在命令行输入 python 然后敲回车。现在你就在 python 环境中了。接下来你就可以输入
并运行一句一句的代码。试着玩玩,如果想退出就输入 quit() 再敲回车。
from sys import argv 是什么意思?
现在能告诉你的是, sys 是一个代码库,这句话的意思是从库里取出 argv 这个功能来,供我使用。后面你会学到更多相关知识。
我把文件名写进去写成 script, ex15_sample.txt = argv 不过这样不灵。
这么做是错的。把代码写成和我一模一样,然后从命令行运行,照着我的方式。你不需要把文件名放到代码中,而是让 Python 把文件名当做参数接纳进去。
为什么打开了两次文件没有报错?
Python 不会限制你打开文件的次数,事实上有时候多次打开同一个文件是一件必须的事情。