logging
1.把print()替换为logging是第三种方式,和assert比,logging不会抛出错误,而且可以输出到文件。
2.logging.info()可以输出一段文字。
3.优点:
允许你指定记录信息的级别,有debug,info,warning,error等几个级别,当我们指定level = INFO时,logging.debug就不起作用了,同理,指定level = WARNING后,debug和info就不起作用了,这样一来,可以放心地输出不同级别的信息,也不用删除,最后统一控制输出哪个级别的信息。
通过简单的配置,一条语句可以同时输出到不同地方,比如console和文件
pdb
Python的调试器pdb,让程序以单步方式运行,可以随时查看运行状态。
1.以参数-m pdb启动后,pdb定位到下一步要执行的代码-> s = '0'。
2.输入命令 n 来执行代码。
3.任何时候输入命令p变量名来查看变量
4.输入命令q结束调试,退出程序
方法比较麻烦,如果一行行执行,代码短还好,长了就好好好麻烦
pdb.set_trace()
这个方法也是用pdb,我们在可能出错的地方放一个pdb.set_trace(),就可以设置一个断点,运行代码,程序自动在pdb.set_trace()暂停并进入pdb调试环境,可以用命令p来查看变量,或者用命令c继续运行
相对于上个方法好点
IDE
一个支持调试功能的IDE。可以比较爽的设置断点、单步执行。
Eclipse加上pydev插件也可以调试Python程序。
总结:这几种调试方法:IDE比较直接,但logging在实际工作中是比较好用的。
单元测试
测试驱动开发:TDD:Test-Driven Develpment
单元测试时用来对一个模块、一个函数或者一个类来进行正确性检验的测试工作。
单元测试通过就说明测试的函数可以正常运行,如果没通过则可能函数有bug,或测试条件输入不正确,总之需要修复使单元测试通过。
单元测试的意义:
如果我们对被测试函数代码做了修改,只需要跑一遍代码,如果通过,说明我们的修改不会对该函数的原有行为造成影响,如果测试不通过,说明我们的修改与原有行为不一致,要么修改代码,要么修改测试。
这种以测试为驱动的开发模式最大的好处就是确保一个模块的行为符合我们设计的测试用例。在将来修改时可以极大程度地保证该模块行为仍然是正确的。
在编写单元测试时,我们需要编写一个测试类,从unittest.TestCase继承。
以test开头的方法就是测试方法,不以test开头的方法不被认为是测试方法,测试的时候不会被执行。
对每一类测试都需要编写一个test_xxx()方法。由于unittest.TestCase提供了很多内置的条件判断,我们只需要调用这些方法就可以断言输出是否是我们所要的。
最常用的断言
assertEqual():
self.assertEqual(abs(-1),1) 断言函数返回的结果与1相等
另一个重要的断言就是抛出指定类型的Error,比如通过d['empty']访问不存在的key时,断言会抛出keyError:
withself.assertRaises(KeyError):
value = d['empty']
而通过d.empty访问不存在的key时,我们期待抛出AttributeError:
withself.assertRaises(AttributeError):
value = d.empty
运行单元测试
编写好单元测试,我们就可以运行单元测试。最简单的运行方式是代码的最后加上两行代码:
if__name__=='__main__':
unittest.main()
另一种方法是在命令行通过参数-m unittest直接运行单元测试。推荐做法,这样可以一次性运行多个单元测试,并且有很多工具可以自动来运行这些单元测试。
setUp和tearDown
可以在单元测试中编写两个特殊的setUp()和tearDown()方法,这两个方法分别在每调用一个测试方法的前后分别执行,这样如果一个单元测试中有需要启动数据库时,我们可以用setUp()来链接数据库,用tearDown()来关闭数据库,这样就不必在每个测试方法中重复相同的代码。
总结:
单元测试可以有效测试某个程序模块的行为,是未来重构代码的信心
单元测试的测试用例要覆盖常用的输入组合、边界条件和异常
单元测试代码要非常简单,如果测试代码太复杂,那么测试代码本身就可能有bug
单元测试通过了并不意味着程序没有bug,但不通过程序肯定有bug
文档测试
Python内置的“文档测试”(doctest)模块可以直接提取注释中的代码并执行测试。
doctest严格按照Python交互式命令行的输入和输出来判断测试结果是否正确。只有测试异常的时候,可以用...来表示中间一大段烦人的输出。
在代码最后加上下面这段代码,就可以直接运行了:
if__name__ =='__main__':
importdoctest
doctest.testmod()
doctest非常有用,不但可以用来测试,还可以直接示例代码,通过某种文档生成工具,就可以自动把包含doctest的注释提取出来。用户看文档时同时可以看到doctest。
IO编程
IO=Input/Output
Stream(流)
在IO编程中,由于CPU和内存的速度远远高于外设的速度,所以会出现速度严重不匹配的问题。这种时候有两种方法解决:
1.同步IO:CPU等着,即程序暂停执行后续代码。等数据写入磁盘,再接着往下执行。
2.异步IO:CPU不等待,接着去干其他事,后续代码接着执行,数据慢慢写入磁盘中。
异步和同步的优缺点:
在使用中异步IO来编写程序性能远远高于同步IO
但异步IO的缺点是编程模型复杂
每一种编程语言都会把操作系统提供的低级C接口封装起来方便使用。
文件读写
Python内置了读写文件的函数,用法和C是兼容的。
读文件
Python内置函数open()函数可以打开一个文件对象。
标识符‘r’代表读,
举例:
f =open('/Users/desk/test.text','r')
如果文件不存在,会抛出IOError的错误,并且给出错误码和详细的信息告诉你文件不存在。
如果打开成功,那我们就可以用read()方法可以一次读取文件的全部内容,Python把内容读到内存中,用一个str对象来表示
最后一步是调用close()方法来关闭文件。注意:文件使用完毕后必须关闭,因为文件对象会在占用操作系统的资源,并且操作系统同一时间能打开的文件数量也是有限的。
try......finally
由于文件读写时都有可能出现IOError,一旦出错,后面的f.close()就不会调用。所以,为了保证无论是否出错都能正确地关闭文件,我们可以使用try.....finally来实现:
try:
f =open('/path/to/file','r')
print(f.read())
finally:
iff:
f.close()
使用with语句可以有更简便的写法:
withopen('/path/to/file','r')asf:
print(f.read())
调用read()会一次性读取文件的全部内容如果文件比较大,内存可能会爆,所以为了保险起见,可以反复调用read(size)方法,每次最多读取size个字节的内容。
调用readline()可以方便读取一行内容
调用readlines()可以一次读取所有内容并按行进行返回list
如果文件小,可以用read()调用
不能确定文件大小则反复调用read(size)比较保险
如果是配置文件则采用readlines()最方便:
forlineinf.readlines():
print(line.strip())#把末尾的'/n'删除掉
file-like Object
像open()函数返回的这种有个read()方法的对象,在Python中统称为file-like Object。除了file外,还可以是内存的字节流,网络流,自定义流等等,file-like Object不要求从特定类继承,只要是read()方法就行。
二进制文件
以上讲的文章都是UTF-8编码的文本文件。要读取二进制文件。比如视频、图片等等,用‘rb’模式打开文件即可。
字符编码
要读取非UTF-8编码的文本文件,需要给open()函数传入encoding参数,例如,读取GBK编码的文件:
f =open('/path/to/file','r',encoding ='gbk')
遇到有些编码不规范的文件,会有UnicodeDecodeError,因为在文本中可能夹杂了一些非法编码的字符,遇到这种情况,open()函数还接收一个error参数,表示如果遇到编码错误后如何处理,最简单的就是直接忽略:
f =open('/path/to/file','r',encoding ='gbk', error ='ignore')
写文件
在调用open()函数时,传入标识符'w'或者‘wb’表示写文本或写二进制文件:
f =open('/Users/desk/test.text','w')
你可以反复用write()来写入文件,但是务必要调用f.close()来关闭文件,因为当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候在慢慢写入,只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘,不关闭的话,数据可能只写了一部分到磁盘,剩下的就丢失了,所以还是用with()语句保险:
withopen('/path/to/file','w')asf:
f.write('Hello world!')
当然和读文件一样,要写入特定编码的文本文件,要给open()函数传入encoding参数,将字符=串自动转换成指定编码。
注意:以'w'模式写入文件时,如果文件已存在,会被直接覆盖掉,如果想追加到文章末尾就以‘a’以追加(append)模式写入。
StringIO和BytesIO
StringIO
数据读写也可以在内存中。
StringIO顾名思义就是在内存中读写str。
写入SttingIO
要把str写入SttingIO,我们需要先创建一个StringIO,然后像文件一样写入即可:
from io import StringIO
f = StringIO()
f.write('hello',' ','world!')
f.write(' ')
f.write('world!')
print(f.getvalue())
hello world!
getvalue()方法用于获得写入后的str。
读取StringIO
可以用str初始化StringIO,然后像读文件一样读取:
fromioimportStringIO
f = StringIO('Hello!\nHi!\nGoodbye!')
whileTrue:
s = f.readline()
ifs ==' ':
break
print(s.strip())
Hello!
Hi!
Goodbye!
BytesIO
操作二进制数据。BytesIO实现了在内存中读写bytes,
写入BytesIO
fromioimportBytesIO
f = BytesIO()
f.write('中文'.encode('utf-8'))
print(f.getvalue())
b'\xe4\xb8\xad\xe6\x96\x87'
注意:写入的不是str,而是经过UTF-8编码的bytes。
读入BytesIO
和StringIO类似,可以用一个bytes初始化BytesIO,然后像读文件一样读取:
fromioimportBytesIO
f = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
f.read()
b'\xe4\xb8\xad\xe6\x96\x87'
小结:
StringIO和BytesIO是在内存中操作str和bytes的方法,使得和读写工具有一致的接口。