python的pep8编码规范和代码调试(pdb,ipdb,debug)_第1张图片

一、python的pep8编码规范

通常会听别人提到PEP8,但是具体指什么内容呢?《Python Enhancement Proposal #8》 (8号python增强提案)又叫PEP8,它是针对python而编订的代码格式指南。

编程语言不是艺术,而是工作或者工具,所以整理并遵循一套编码规范十分必要。

1、每个缩进层级使用4个空格。
2、每行最多79个字符。
3、顶层的函数(def)或类(class)的定义之间空两行。
4、采用ASCII或UTF-8编码文件。(就是在里面表明编码格式,ASCII编码格式或者是UTF-8的编码格式)
5、在文件的顶端,注释和文档说明之下,每行每条import语句只导入一个模块,
同时要按标准库、第三方库和本地库的导入顺序进行分组。(标准库是下载python后就有的,也就是python自带的,要是需要下载,无论是pip还是其他,都是第三方库。而本地库就是自己创建的)
6、在小括号、中括号、大括号之间或者括号之前没有额外的空格
7、类(class)的命名采用驼峰命名法,如CamelCase;异常的定义使用Error前缀(如适用的话);函数的命名采用下划线分隔的小写字母,如separateed_by_underscores;用下划线开头定义私有的属性或方法,如_private

自动检查代码标准的pep8工具

pep8会在哪里显示哪行哪里违反了pep8的,并为每个问题提供了其错误码,要是违反了那些必要的遵守规范,p便会爆出错误(以E开头的的错误码),如果是细微的问题则会报警告(以W开头的
错误码)。跟在字母后面的3位数则是错误或者警告,可以从中看出大概的错误类别。例如以E2开
头的错误通常是与空格有关,以3开头的错误通常与空行有关,而以w6开头的警告则表明使用已
经废弃的功能。

1. 代码布局

1.1 缩进

  • 每级缩进用4个空格
  • 括号中使用垂直隐式缩进或悬挂缩进
  • 不使用Tap,更不能混合使用Tap和空格
正确示范
# (垂直隐式缩进)对准左括号起的第一个字符
foo = long_function_name(var_one, var_two,
                         var_three, var_four)

# (悬挂缩进) 以行首字符为基准,缩进(一般情况只需一层缩进)
foo = long_function_name(
    var_one, var_two,
    var_three, var_four)

# (悬挂缩进) 但下面情况, 需再加多一层缩进,和函数体的语句块区分开
def long_function_name(
        var_one, var_two, var_three,
        var_four):
    print(var_one)

# 右括号回退
my_list = [
    1, 2, 3,
    4, 5, 6,
]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
)123456789101112131415161718192021222324
错误示范
# 使用悬挂缩进时,第一行有参数。
foo = long_function_name(var_one, var_two,
    var_three, var_four)

# 参数的悬挂缩进和后续代码块缩进不能区别。
def long_function_name(
    var_one, var_two, var_three,
    var_four):
    print(var_one)

# 右括号不回退,不推荐
my_list = [
    1, 2, 3,
    4, 5, 6,
    ]

result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
    )1234567891011121314151617181920

1.2 最大行宽

  • 每行最大行宽不超过 79 个字符
  • 无括号续行,可使用反斜杠
  • 括号内续行不需要使用反斜杠
# 无括号续行, 可使用反斜杠
with open('/path/to/some/file/you/want/to/read') as file_1, \
     open('/path/to/some/file/being/written', 'w') as file_2:
    file_2.write(file_1.read())

# 括号内续行,尽量在运算符后再续行
class Rectangle(Blob):
    def __init__(self, width, height,
                 color='black', emphasis=None, highlight=0):
        if (width == 0 and height == 0 and
                color == 'red' and emphasis == 'strong' or
                highlight > 100):
            raise ValueError("sorry, you lose")
        if width == 0 and height == 0 and (color == 'red' or
                                           emphasis is None):
            raise ValueError("I don't think so, values are %s,%s"%                             (width, height))12345678910111213141516

1.3 空行

  • 两行空行用于分割顶层函数和类的定义
  • 单个空行用于分割类定义中的方法
  • 函数内逻辑无关段落之间空一行;其他地方尽量不要再空行
  • 虽然可以使用‘;’,但尽量不要把多个语句写在同一行
  • if/for/while语句中,即使执行语句只有一句,也必须另起一行
class A(object):     # 类的方法定义用单个空行分割
    def method1():
        pass

    def method2():
        pass

def method3():       # 两行空行分割顶层函数和类的定义
    pass12345678910

1.4 模块导入

  • 导入的每个模块应该单独成行
  • 导入顺序如下: 先标准库,再相关的第三方库,最后本地库。(导入不同类型的模块之间,要有空行分割,各组里面的模块顺序按首字母自上而下升序排列)
# 正确示范
import active   # 按模块首字母排序导入, 依此递推
import adidas
import create

# 错误示范
import sys, os, knife  # 错误:一行导入多模块

import create          # 错误:不按模块首字母导入
import active
import beyond1234567891011

1.5 字符串

单引号和双引号作用是一样的,但必须保证成对存在,不能夹杂使用。
(建议句子使用双引号, 单词使用单引号, 但不强制。)

# 单引号和双引号效果一样

name = 'JmilkFan'
name = "Hey Guys!"1234

1.6 表达式和语句中的空格

括号里边避免空格
spam(ham[1], {eggs: 2})        # 正确示范

spam( ham[ 1 ], { eggs: 2 } )  # 错误示范123
逗号,冒号,分号之前避免空格
if x == 4: print x, y; x, y = y, x       # 正确示范

if x == 4 : print x , y ; x , y = y , x  # 错误示范123
函数调用的左括号之前不能有空格
spam(1)
dct['key'] = lst[index]     # 正确示范

spam (1)
dct ['key'] = lst [index]   # 错误示范12345
赋值等操作符前后不能因为对齐而添加多个空格
x = 1                # 正确示范
y = 2
long_variable = 3

x             = 1    # 错误示范
y             = 2
long_variable = 31234567
二元运算符两边各放置一个空格
  • 涉及 = 的复合操作符 ( += , -=等)
  • 比较操作符 ( == , < , > , != , <> , <= , >= , in , not in , is , is not )
  • 逻辑操作符( and , or , not )
a = b
a or b

# 括号内的操作符两边不需要空格
name = get_name(age, sex=None, city=Beijing)12345

1.7 注释

总体原则,错误的注释不如没有注释。所以当一段代码发生变化时,第一件事就是修改注释。

  • 注释块
    • 注释块通常应用在代码前,并和代码有同样的缩进。每行以 ‘# ’ 开头, 而且#后面有单个空格。段落之间以只有‘#’的行间隔
# Have to define the param `args(List)`, 
# otherwise will be capture the CLI option when execute `python manage.py server`.
# oslo_config: (args if args is not None else sys.argv[1:])
CONF(args=[], default_config_files=[CONFIG_FILE])1234
  • 单行注释(这种方式尽量少使用)
x = x + 1 # Compensate for border1
  • 文档字符串
# 多行文档, 首行首字母大写,结尾的 """ 应该单独成行
"""Return a foobang
Optional plotz says to frobnicate the bizbaz first.
"""

# 单行的文档, 结尾的 """ 在同一行。
"""Return a foobang"""1234567
  • 为共有的模块、函数、类、方法写docstrings;非共有的没有必要写docstrings,但是可以写注释(在def的下一行)
  • 应避免无谓的注释

1.8 命名规则

  • 包和模块名
    包和模块名应该简短,全部用小写字母, 多字母之间可以使用单下划线连接。
  • 类名
    遵循驼峰命名。
class MyClass(object):
    pass12
  • 全局变量名
    全局变量名应尽量只在模块内部使用, 对可能使用语句from moduleName import variableName而被导入的模块,应采用__all__机制来防止全局变量被别的模块导入, 或者在全局变量名开头加一个前置下划线。
_name = 'name'1
  • 函数名
    函数名应该为全部小写的凹驼峰规则。
vcenter_connection = ''1
  • 常量名
    常量全部使用大写字母的凹驼峰规则来表示, 通常在模块顶格定义。
MAX_OVERFLOW = ''
TOTAL = 112
  • 方法名和实例变量
    • 非公开方法和实例变量开头使用前置下划线
    • 有时候可能会为了避免与子类命名冲突,采用两个前置下划线
      需要注意的是: 若 class Foo 的属性名为 a, 该属性是不能以 Foo.a 的方式访问的(执著的用户还是可以通过Foo._Foo__a 来访问), 所以通常双前置下划线仅被用来避免与基类的属性发生命名冲突。

2. 编程建议

  • 编码中应考虑到其他python实现的效率问题,比如运算符‘+’在CPython中效率很高,在Jython中却非常低
  • None 的比较用 is 或 is not,而不要用 ==;尽可能使用‘is’‘is not’取代‘==’;用 is not 代替 not … is, 前者的可读性更好
if foo is not None     # Yes

if not foo is None     # No123
if x is not None       # if x is not None 要优于if x

if x123
  • 使用函数定义关键字 def 代替 lambda 赋值给标识符, 这样更适合于回调和字符串表示
def f(x):              # Yes
    return 2*x

f = lambda x: 2*x      # No1234
  • 异常类应该继承自Exception,而不是 BaseException;捕获异常时尽量指明具体异常, 尽量不用 except Exception;应该捕获出了什么问题,而不是问题发生
try:                                   # Yes (捕获具体异常)
    import platform_specific_module    
except ImportError:
    platform_specific_module = None

try:                                   # No (不要全局捕获)
    import platform_specific_module
except:
    platform_specific_module = None123456789
  • try/except 子句中的代码要尽可能的少, 以免屏蔽掉其他的错误
try:                            # Yes
    value = collection[key]
except KeyError:
    return key_not_found(key)
else:
    return handle_value(value)

try:                            # No
    return handle_value(collection[key])
except KeyError:
    # 可能会捕捉到handle_value()中的 KeyError, 而不是collection的
    return key_not_found(key)12345678910111213
  • 函数或者方法在没有返回值时要明确返回 None
def foo():        # Yes
    return None

def foo():        # No
    return12345
  • 使用字符串方法而不是 string 模块
    python 2.0 以后字符串方法总是更快,而且与 Unicode 字符串使用了相同的 API
  • 使用使用 .startswith() 和 .endswith() 代替字符串切片来检查前缀和后缀
    startswith() 和 endswith 更简洁,利于减少错误
if foo.startswith('bar'):   # Yes

if foo[:3] == 'bar':        # No123
  • 使用 isinstance() 比较对象的类型
if isinstance(obj, int):   # Yes

if type(obj) is type(1):   # No123
  • 判断序列空或不空
    空序列类型对象的 bool 为 False:
if not seq:       # Yes
   pass
if seq:
   pass

if len(seq):      # No
   pass
if not len(seq):
   pass123456789
  • 不要使用 == 进行 bool 比较
 # Yes
if greeting:          
   pass

# No
if greeting == True
   pass
if greeting is True: # Worse
   pass123456789
  • 字符串不要以空格收尾
  • 二进制数据判断使用if boolvalue的方式
  • 使用Map和Reduce,不要使用循环

二、pdb代码调试

程序能一次写完并正常运行的概率很小,基本不超过1%。总会有各种各样的bug需要修正。有的bug很简单,看看错误信息就知道,有的bug很复杂,我们需要知道出错时,哪些变量的值是正确的,哪些变量的值是错误的,因此,需要一整套调试程序的手段来修复bug。

安装ipdb库

PS G:\四期\python> pip install pdb

G:\四期\python\4\1.py文件内容如下:

import pdb
s = '0'
n = int(s)
pdb.set_trace()
print(10/n)

调试一下

PS G:\四期\python\4> python 2.py
> g:\四期\python\4\2.py(5)()
-> print(10/n)

1、使用pdb进行调试:

pdb 是 python 自带的一个包,为 python 程序提供了一种交互的源代码调试功能,主要特性包括设置断点、单步调试、进入函数调试、查看当前代码、查看栈片段、动态改变变量的值等。pdb 提供了一些常用的调试命令,详情见表 1。

pdb 常用命令

命令 解释
break 或 b 设置断点 设置断点
continue 或 c 继续执行程序
list 或 l 查看当前行的代码段
step 或 s 进入函数
return 或 r 执行代码直到从当前函数返回
exit 或 q 中止并退出
next 或 n 执行下一行
pp 打印变量的值
help 帮助

下面结合具体的实例讲述如何使用 pdb 进行调试。

2、测试代码示例

 import pdb 
 a = "aaa"
 pdb.set_trace() 
 b = "bbb"
 c = "ccc"
 final = a + b + c 
 print final

开始调试:直接运行脚本,会停留在 pdb.set_trace() 处,选择 n+enter 可以执行当前的 statement。在第一次按下了 n+enter 之后可以直接按 enter 表示重复执行上一条 debug 命令。

(1)利用 pdb 调试

[root@rcc-pok-idg-2255 ~]#  python epdb1.py 
 > /root/epdb1.py(4)?() 
 -> b = "bbb"
 (Pdb) n 
 > /root/epdb1.py(5)?() 
 -> c = "ccc"
 (Pdb) 
 > /root/epdb1.py(6)?() 
 -> final = a + b + c 
 (Pdb) list 
  1     import pdb 
  2     a = "aaa"
  3     pdb.set_trace() 
  4     b = "bbb"
  5     c = "ccc"
  6  -> final = a + b + c 
  7     print final 
 [EOF] 
 (Pdb) 
 [EOF] 
 (Pdb) n 
 > /root/epdb1.py(7)?() 
 -> print final 
 (Pdb)

退出 debug:使用 quit 或者 q 可以退出当前的 debug,但是 quit 会以一种非常粗鲁的方式退出程序,其结果是直接 crash。

(2)退出 debug

[root@rcc-pok-idg-2255 ~]#  python epdb1.py 
 > /root/epdb1.py(4)?() 
 -> b = "bbb"
 (Pdb) n 
 > /root/epdb1.py(5)?() 
 -> c = "ccc"
 (Pdb) q 
 Traceback (most recent call last): 
  File "epdb1.py", line 5, in ? 
    c = "ccc"
  File "epdb1.py", line 5, in ? 
    c = "ccc"
  File "/usr/lib64/python2.4/bdb.py", line 48, in trace_dispatch 
    return self.dispatch_line(frame) 
  File "/usr/lib64/python2.4/bdb.py", line 67, in dispatch_line 
    if self.quitting: raise BdbQuit 
 bdb.BdbQuit

打印变量的值:如果需要在调试过程中打印变量的值,可以直接使用 p 加上变量名,但是需要注意的是打印仅仅在当前的 statement 已经被执行了之后才能看到具体的值,否则会报 NameError: < exceptions.NameError … ....> 错误。

(3)debug 过程中打印变量

[root@rcc-pok-idg-2255 ~]#  python epdb1.py 
 > /root/epdb1.py(4)?() 
 -> b = "bbb"
 (Pdb) n 
 > /root/epdb1.py(5)?() 
 -> c = "ccc"
 (Pdb) p b 
'bbb'
 (Pdb) 
'bbb'
 (Pdb) n 
 > /root/epdb1.py(6)?() 
 -> final = a + b + c 
 (Pdb) p c 
'ccc'
 (Pdb) p final 
 *** NameError:  
 (Pdb) n 
 > /root/epdb1.py(7)?() 
 -> print final 
 (Pdb) p final 
'aaabbbccc'
 (Pdb)

使用 c 可以停止当前的 debug 使程序继续执行。如果在下面的程序中继续有 set_statement() 的申明,则又会重新进入到 debug 的状态,读者可以在代码 print final 之前再加上 set_trace() 验证。

(4)停止 debug 继续执行程序

[root@rcc-pok-idg-2255 ~]#  python epdb1.py 
 > /root/epdb1.py(4)?() 
 -> b = "bbb"
 (Pdb) n 
 > /root/epdb1.py(5)?() 
 -> c = "ccc"
 (Pdb) c 
 aaabbbccc

显示代码:在 debug 的时候不一定能记住当前的代码块,如要要查看具体的代码块,则可以通过使用 list 或者 l 命令显示。list 会用箭头 -> 指向当前 debug 的语句。

(5)debug 过程中显示代码

[root@rcc-pok-idg-2255 ~]#  python epdb1.py 
 > /root/epdb1.py(4)?() 
 -> b = "bbb"
 (Pdb) list 
  1     import pdb 
  2     a = "aaa"
  3     pdb.set_trace() 
  4  -> b = "bbb"
  5     c = "ccc"
  6     final = a + b + c 
  7     pdb.set_trace() 
  8     print final 
 [EOF] 
 (Pdb) c 
 > /root/epdb1.py(8)?() 
 -> print final 
 (Pdb) list 
  3     pdb.set_trace() 
  4     b = "bbb"
  5     c = "ccc"
  6     final = a + b + c 
  7     pdb.set_trace() 
  8  -> print final 
 [EOF] 
 (Pdb)

在使用函数的情况下进行 debug

(6)使用函数的例子

import pdb 
 def combine(s1,s2):      # define subroutine combine, which... 
    s3 = s1 + s2 + s1    # sandwiches s2 between copies of s1, ... 
    s3 = '"' + s3 +'"'   # encloses it in double quotes,... 
    return s3            # and returns it. 
 a = "aaa"
 pdb.set_trace() 
 b = "bbb"
 c = "ccc"
 final = combine(a,b) 
 print final

如果直接使用 n 进行 debug 则到 final=combine(a,b) 这句的时候会将其当做普通的赋值语句处理,进入到 print final。如果想要对函数进行 debug 如何处理呢 ? 可以直接使用 s 进入函数块。函数里面的单步调试与上面的介绍类似。如果不想在函数里单步调试可以在断点处直接按 r 退出到调用的地方。

(8)对函数进行 debug

[root@rcc-pok-idg-2255 ~]# python epdb2.py 
 > /root/epdb2.py(10)?() 
 -> b = "bbb"
 (Pdb) n 
 > /root/epdb2.py(11)?() 
 -> c = "ccc"
 (Pdb) n 
 > /root/epdb2.py(12)?() 
 -> final = combine(a,b) 
 (Pdb) s 
 --Call-- 
 > /root/epdb2.py(3)combine() 
 -> def combine(s1,s2):      # define subroutine combine, which... 
 (Pdb) n 
 > /root/epdb2.py(4)combine() 
 -> s3 = s1 + s2 + s1    # sandwiches s2 between copies of s1, ... 
 (Pdb) list 
  1     import pdb 
  2 
  3     def combine(s1,s2):      # define subroutine combine, which... 
  4  ->     s3 = s1 + s2 + s1    # sandwiches s2 between copies of s1, ... 
  5         s3 = '"' + s3 +'"'   # encloses it in double quotes,... 
  6         return s3            # and returns it. 
  7 
  8     a = "aaa"
  9     pdb.set_trace() 
 10     b = "bbb"
 11     c = "ccc"
 (Pdb) n 
 > /root/epdb2.py(5)combine() 
 -> s3 = '"' + s3 +'"'   # encloses it in double quotes,... 
 (Pdb) n 
 > /root/epdb2.py(6)combine() 
 -> return s3            # and returns it. 
 (Pdb) n 
 --Return-- 
 > /root/epdb2.py(6)combine()->'"aaabbbaaa"'
 -> return s3            # and returns it. 
 (Pdb) n 
 > /root/epdb2.py(13)?() 
 -> print final 
 (Pdb)

在调试的时候动态改变值 。在调试的时候可以动态改变变量的值,具体如下实例。需要注意的是下面有个错误,原因是 b 已经被赋值了,如果想重新改变 b 的赋值,则应该使用! B。

(7)在调试的时候动态改变值

[root@rcc-pok-idg-2255 ~]# python epdb2.py 
 > /root/epdb2.py(10)?() 
 -> b = "bbb"
 (Pdb) var = "1234"
 (Pdb) b = "avfe"
 *** The specified object '= "avfe"' is not a function 
 or was not found along sys.path. 
 (Pdb) !b="afdfd"
 (Pdb)

补充

  • 在命令行中进入调试模式的方法:python -m pdb demo.py
  • 在调试模式中按一下Enter键表示执行一下上一条命令。
  • 在ipython中使用PDB(体验更好):%run -d demo.py

参考1

参考2