好记性不如烂笔头,看到Python Optional Variables这一块,把学习的东西记录下来
一. 可选的环境变量设置
会写Java Hello World的同学一定知道如何设置环境变量,比如:JAVA_HOME,CLASSPATH等。
Python中也一样有类似的环境变量,有一些还是可选的(比如:PYTHONPATH, PYTHONSTARTUP等)
设置PYTHONPATH
这个环境变量有什么用呢?
我们知道在导入模块时(比如:import some_module_name),Python需要在某些路径(即sys.path这个列表中的路径)中去寻找相应的模块,而PYTHONPATH这个变量就是告诉Python,将它的值也加入到搜索路径中(即将PYTHONPATH的值合并到sys.path列表中)。
export PYTHONPATH=/tmp python -c "import sys; print 'found' if '/tmp' in sys.path else '' "
输出结果是:found
说明/tmp在sys.path中被找到了(即/tmp附加到了sys.path中)
2. 设置PYTHONSTARTUP
如果这个环境变量的值是一个可读的文件,那么该文件中的Python命令会在交互模式启动之前执行。
echo "print 'hello world'" > /tmp/a.py export PYTHONSTARTUP=/tmp/a.py python
在启动python交互模式后,会看到有hello world已经被输出了。
3. 设置PYTHONHOME
一般在这个变量没有被设置的情况下,Python中的sys.path会列出一些模块的搜索路径。
# 比如: ['', '/usr/lib/python2.7', '/usr/lib/python2.7/plat-linux2', '/usr/lib/python2.7/lib-tk', '/usr/lib/python2.7/lib-old', '/usr/lib/python2.7/lib-dynload', '/usr/local/lib/python2.7/dist-packages', '/usr/lib/python2.7/dist-packages']
Python模块的搜索路径一般默认是sys.prefix/lib,可以看到很多路径是 /usr/lib/... 这种,其中/usr 就是sys.prefix这个变量的值(windows上可能是你安装Python的目录,比如: C:\Python2.7)。
如果人工指定了PYTHONHOME,那么sys.prefix的值就会被替换。
随便替换PYTHONHOME的值,可能造成Python无法启动,替换前请备份sys.prefix的值
4. 设置PYTHONCASEOK
这个变量只对Windows起效,可以设置为任意的值(比如:SET PYTHONCASEOK=OK)
设置了以后,Python对模块的导入,将忽略大小写(只对用户module忽略大小写,对built-in module还是大小写敏感)
5. 设置PYTHONIOENCODING
看这个名字,IO Encoding可以猜到这个东西是和输入输出有关的。对,这个环境变量的作用就是指定Python程序标准输入输出(stdin,stdout,stderr)的编码。
关于这个东西的运用,请参考:http://www.soimort.org/posts/118/ 太长不看 :D
再补充一些关于encode和decode的要点:
在Python 2.x中,str类型的字符串,都是指string of bytes(二进制流的表示形式),一般来说
1). '...'.decode([encoding_name])是将string of bytes转化成unicode string
运用场景是,从网络或者文件中读取了二进制流,然后将其转化为unicode字符串,便于阅读。
2). u'....'.encode([encoding_name])是将unicode string转化成string of bytes
运用场景是,将unicode字符串转化成二进制流(Java的叫法也称为字节流),然后推向网络或者文件中。
另外,还有两个方法,str.encode和unicode.decode,这两个方法意义不大(几乎很少运用)
"...".encode() 会先默认隐式的用default encoding去decode,即调用"...".decode(sys.getdefaultencoding()) ,然后再继续调用"...".encode()
而u"...".decode()也会先默认隐式的调用u"...".encode(sys.getdefaultencoding()),然后继续调用u"...".decode()
二. 使用pdb模块调试、跟踪脚本
有些时候,需要在没有IDE帮助的情况下,对脚本的运行情况进行调试、跟踪,可以使用Python内置的pdb模块(参考:https://docs.python.org/2/library/pdb.html)
一个简单的例子:
对脚本test.py进行跟踪调试
#! /usr/bin/env python def foo(): s = 0 for i in range(3): s += i print s if __name__ == "__main__": foo()
运行命令:
python -m pdb test.py
显示类似如下所示:
> /tmp/test.py(3)<module>() -> def foo(): (Pdb) l 1 #! /usr/bin/env python 2 3 -> def foo(): 4 s = 0 5 for i in range(3): 6 s += i 7 print s 8 9 10 if __name__ == "__main__": 11 foo() (Pdb) n > /tmp/test.py(10)<module>() -> if __name__ == "__main__": (Pdb)
(pdb)是调试提示符,在提示符下可以输入命令(具体参考文档)
可以在(pdb)提示符下,查看标量的值,可以使用print 语句打印
常用的简单命令有:
命令全称 |
简写 |
命令描述 |
|
list |
l |
列出当前执行脚本的内容(其中有箭头标注当前执行到的位置) |
|
next |
n |
执行下一步,遇到函数不进入其内部。(相当于IDE中的step over) |
|
step |
s |
执行下一步,遇到函数进入其内部。(相当于IDE中的step into) |
|
break |
b |
设置断点,如果不带参数,则列出当前执行脚本中的所有断点(号)。 也可以带参数,比如,执行: b 6)代表在脚本的第6行设置断点,如右边所示,它的断点号是1。 |
(Pdb) b 6 Breakpoint 1 at /tmp/test.py:6 (Pdb) l 5 for i in range(3): 6 B s += i 7 print s 8 9 10 -> if __name__ == "__main__": 11 foo() |
clear |
cl |
清除脚本中的断点。 1)不带参数,会询问是否清除脚本中的所有断点 2)带参数会清除指定的断点。(注意清除的格式) |
所以,要清除上面设置的第6行的断点,要么使用 cl 1 (清除断点号是1的断点);要么使用 cl test.py:6 (清除test.py中的第6行) 使用 cl 6是错误的,因为目前为止,没有标号是6的断点!! |
continue |
c |
继续执行脚本,直到遇到断点停止。 |
|
quit |
q |
退出调试 |
That's it!