python代码风格指南:PEP8 中文

摘要

本文给出主Python版本标准库的编码约定。CPython的C代码风格参见​PEP7。

本文和​PEP 257 文档字符串标准改编自Guido最初的《Python Style Guide》, 并增加了Barry的​GNU Mailman Coding Style Guide的部分内容。

本文会随着语言改变等而改变。 许多项目都有自己的编码风格指南,冲突时自己的指南为准。

目录

 

  • 一致性考虑
  • 代码布局
    1. 缩进
    2. 空格或Tab?
    3. 最大行宽
    4. 空行
    5. 源文件编码
    6. 导入
  • 字符串引用
  • 表达式和语句中的空格
    1. 强制要求
    2. 其他建议
  • 注释
    1. 注释块
    2. 行内注释
    3. 文档字符串
  • 版本标签
  • 命名约定
    1. 最重要的原则
    2. 描述:命名风格
    3. 命名约定规范
    4. 公共和内部接口
  • 编程建议
  • 参考资料

 

 

 

一致性考虑

Guido的关键点之一是:代码更多是用来读而不是写。本指南旨在改善Python代码的可读性,即PEP 20所说的“可读性计数"(Readability counts)。

风格指南强调一致性。项目、模块或函数保持一致都很重要。

最重要的是知道何时不一致, 有时风格指南并不适用。当有疑惑时运用你的最佳判断,参考其他例子并多问!

特别注意:不要因为遵守本PEP而破坏向后兼容性!

部分可以违背指南情况:

  • 遵循指南会降低可读性。

  • 与周围其他代码不一致。

  • 代码在引入指南完成,暂时没有理由修改。

  • 旧版本兼容。

代码布局

缩进

每级缩进用4个空格。

括号中使用垂直隐式缩进或使用悬挂缩进。后者应该注意第一行要没有参数,后续行要有缩进。

  • Yes

 1 # 对准左括号
 2 foo = long_function_name(var_one, var_two,
 3                          var_three, var_four)
 4  
 5 # 不对准左括号,但加多一层缩进,以和后面内容区别。
 6 def long_function_name(
 7         var_one, var_two, var_three,
 8         var_four):
 9     print(var_one)
10  
11 # 悬挂缩进必须加多一层缩进.
12 foo = long_function_name(
13     var_one, var_two,
14     var_three, var_four)
  • No
1 # 不使用垂直对齐时,第一行不能有参数。
2 foo = long_function_name(var_one, var_two,
3     var_three, var_four)
4  
5 # 参数的缩进和后续内容缩进不能区别。
6 def long_function_name(
7     var_one, var_two, var_three,
8     var_four):
9     print(var_one)

4个空格的规则是对续行可选的。

1 # 悬挂缩进不一定是4个空格
2 foo = long_function_name(
3   var_one, var_two,
4   var_three, var_four)

if 语句跨行时,两个字符关键字(比如if)加上一个空格,再加上左括号构成了很好的缩进。后续行暂时没有规定,至少有如下三种格式,建议使用第3种

 1 # 没有额外缩进,不是很好看,个人不推荐.
 2 if (this_is_one_thing and
 3     that_is_another_thing):
 4     do_something()
 5  
 6 # 添加注释
 7 if (this_is_one_thing and
 8     that_is_another_thing):
 9     # Since both conditions are true, we can frobnicate.
10     do_something()
11  
12 # 额外添加缩进,推荐。
13 # Add some extra indentation on the conditional continuation line.
14 if (this_is_one_thing
15         and that_is_another_thing):
16     do_something()

右边括号也可以另起一行。有两种格式,建议第2种。

# 右括号不回退,个人不推荐
my_list = [
    1, 2, 3,
    4, 5, 6,
    ]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
    )
 
# 右括号回退
my_list = [
    1, 2, 3,
    4, 5, 6,
]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
)

空格或Tab?

  • 空格是首选的缩进方法。

  • Tab仅仅在已经使用tab缩进的代码中为了保持一致性而使用。

  • Python 3中不允许混合使用Tab和空格缩进。

  • Python 2的包含空格与Tab和空格缩进的应该全部转为空格缩进。

Python2命令行解释器使用-t选项时有非法混合Tab和空格的情况会告警。当使用-tt警告提升为错误。强烈推荐这些选项!另外个人推荐pep8和autopep8模块。

最大行宽

限制所有行的最大行宽为79字符。

文本长块,比如文档字符串或注释,行长度应限制为72个字符。

多数工具默认的续行功能会破坏代码结构,使它更难理解,不推荐使用。但是超过80个字符加以提醒是必要的。一些工具可能根本不具备动态换行功能。

一些团队强烈希望更长的行宽。如果能达成一致,可以从从80提高到100个字符(最多99个字符)增加了标称线的长度,不过依旧建议文档字符串和注释保持在72的长度。

Python标准库比较保守,限制行宽79个字符(文档字符串/注释72)。

续行的首选方法是使用小括号、中括号和大括号反斜线仍可能在适当的时候。其次是反斜杠。

比如with语句中:

1 with open('/path/to/some/file/you/want/to/read') as file_1, \
2      open('/path/to/some/file/being/written', 'w') as file_2:
3     file_2.write(file_1.read())

类似的还有assert。

注意续行要尽量不影响可读性。比如通常在二元运算符之后续行:

 1 class Rectangle(Blob):
 2  
 3     def __init__(self, width, height,
 4                  color='black', emphasis=None, highlight=0):
 5         if (width == 0 and height == 0 and
 6                 color == 'red' and emphasis == 'strong' or
 7                 highlight > 100):
 8             raise ValueError("sorry, you lose")
 9         if width == 0 and height == 0 and (color == 'red' or
10                                            emphasis is None):
11             raise ValueError("I don't think so -- values are %s, %s" %
12                              (width, height))
13         Blob.__init__(self, width, height,
14                       color, emphasis, highlight)

空行

  • 两行空行分割顶层函数和类的定义。

  • 类的方法定义用单个空行分割。

  • 额外的空行可以必要的时候用于分割不同的函数组,但是要尽量节约使用。

  • 额外的空行可以必要的时候在函数中用于分割不同的逻辑块,但是要尽量节约使用。

  • Python接 contol-L作为空白符;许多工具视它为分页符,这些要因编辑器而异。

源文件编码

在核心Python发布的代码应该总是使用UTF-8(ASCII在Python 2)。

ASCII文件(Python 2)或UTF-8(Python 3)不应有编码声明。

标准库中非默认的编码应仅用于测试或当注释或文档字符串,比如包含非ASCII字符的作者姓名,尽量使用\x , \u , \U , or \N。

Python 3.0及以后版本,PEP 3131可供参考,部分内容如下:在Python标准库必须使用ASCII标识符,并尽量只使用英文字母。此外字符串和注释也必须用ASCII。唯一的例外是:(a)测试非ASCII的功能,和(b)作者的名字不是拉丁字母。

导入

  • 导入在单独行

Yes:

1 import os
2 import sys
3 from subprocess import Popen, PIPE

No:

1 import sys, os
  • 导入始终在文件的顶部,在模块注释和文档字符串之后,在模块全局变量和常量之前。

        导入顺序如下:标准库进口,相关的第三方库,本地库。各组的导入之间要有空行。

        相关的all放在导入之后。

  • 推荐绝对路径导入,因为它们通常更可读,而且往往是表现更好的(或至少提供更好的错误消息。

1 import mypkg.sibling
2 from mypkg import sibling
3 from mypkg.sibling import example

在绝对路径比较长的情况下,也可以使用相对路径:

1 from . import sibling
2 from .sibling import example

Python 3中已经禁止隐式的相对导入。

  • 导入类的方法:
1 from myclass import MyClass
2 from foo.bar.yourclass import YourClass

如果和本地名字有冲突:

1 import myclass
2 import foo.bar.yourclass
  • 禁止使用通配符导入。

通配符导入(from <module> import *)应该避免,因为它不清楚命名空间有哪些名称存,混淆读者和许多自动化的工具。

唯一的例外是重新发布对外的API时可以考虑使用。

字符串引用

Python中单引号字符串和双引号字符串都是相同的。注意尽量避免在字符串中的反斜杠以提高可读性。

根据PEP 257, 三个引号都使用双引号。

表达式和语句中的空格

强制要求

  • 括号里边避免空格

1 # 括号里边避免空格
2 # Yes
3 spam(ham[1], {eggs: 2})
4 # No
5 spam( ham[ 1 ], { eggs: 2 } )
  • 逗号,冒号,分号之前避免空格
1 # 逗号,冒号,分号之前避免空格
2 # Yes
3 if x == 4: print x, y; x, y = y, x
4 # No
5 if x == 4 : print x , y ; x , y = y , x
  • 索引操作中的冒号当作操作符处理前后要有同样的空格(一个空格或者没有空格,个人建议是没有。
 1 # Yes
 2 ham[1:9], ham[1:9:3], ham[:9:3], ham[1::3], ham[1:9:]
 3 ham[lower:upper], ham[lower:upper:], ham[lower::step]
 4 ham[lower+offset : upper+offset]
 5 ham[: upper_fn(x) : step_fn(x)], ham[:: step_fn(x)]
 6 ham[lower + offset : upper + offset]
 7 # No
 8 ham[lower + offset:upper + offset]
 9 ham[1: 9], ham[1 :9], ham[1:9 :3]
10 ham[lower : : upper]
11 ham[ : upper]
  • 函数调用的左括号之前不能有空格
1 # Yes
2 spam(1)
3 dct['key'] = lst[index]
4  
5 # No
6 spam (1)
7 dct ['key'] = lst [index]
  • 赋值等操作符前后不能因为对齐而添加多个空格
1 # Yes
2 x = 1
3 y = 2
4 long_variable = 3
5  
6 # No
7 x             = 1
8 y             = 2
9 long_variable = 3

其他建议

  • 二元运算符两边放置一个空格:

涉及 =、符合操作符 ( += , -=等)、比较( == , < , > , != , <> , <= , >= , in , not in , is , is not )、布尔( and , or , not )。

  • 优先级高的运算符或操作符的前后不建议有空格。

 1 # Yes
 2 i = i + 1
 3 submitted += 1
 4 x = x*2 - 1
 5 hypot2 = x*x + y*y
 6 c = (a+b) * (a-b)
 7  
 8 # No
 9 i=i+1
10 submitted +=1
11 x = x * 2 - 1
12 hypot2 = x * x + y * y
13 c = (a + b) * (a - b)
  • 关键字参数和默认值参数的前后不要加空格
1 # Yes
2 def complex(real, imag=0.0):
3     return magic(r=real, i=imag)
4  
5 # No
6 def complex(real, imag = 0.0):
7     return magic(r = real, i = imag)
  • 函数注释中,=前后要有空格,冒号和"->"的前面无空格,后面有空格。
 1 # Yes
 2 def munge(input: AnyStr):
 3 def munge(sep: AnyStr = None):
 4 def munge() -> AnyStr:
 5 def munge(input: AnyStr, sep: AnyStr = None, limit=1000):
 6  
 7 # No
 8 def munge(input: AnyStr=None):
 9 def munge(input:AnyStr):
10 def munge(input: AnyStr)->PosInt:
  • 通常不推荐复合语句(Compound statements: 多条语句写在同一行)。
# Yes
if foo == 'blah':
    do_blah_thing()
do_one()
do_two()
do_three()
 
# No
if foo == 'blah': do_blah_thing()
do_one(); do_two(); do_three()
  • 尽管有时可以在if/for/while 的同一行跟一小段代码,但绝不要跟多个子句,并尽量避免换行。
1 # No
2 if foo == 'blah': do_blah_thing()
3 for x in lst: total += x
4 while t < 10: t = delay()

更不是:

# No
if foo == 'blah': do_blah_thing()
else: do_non_blah_thing()
 
try: something()
finally: cleanup()
 
do_one(); do_two(); do_three(long, argument,
                             list, like, this)
 
if foo == 'blah': one(); two(); three()

注释

与代码自相矛盾的注释比没注释更差。修改代码时要优先更新注释!

注释是完整的句子。如果注释是断句,首字母应该大写,除非它是小写字母开头的标识符(永远不要修改标识符的大小写)。

如果注释很短,可以省略末尾的句号。注释块通常由一个或多个段落组成。段落由完整的句子构成且每个句子应该以点号(后面要有两个空格)结束,并注意断词和空格。

非英语国家的程序员请用英语书写你的注释,除非你120%确信代码永远不会被不懂你的语言的人阅读。

注释块

注释块通常应用在代码前,并和这些代码有同样的缩进。每行以 '# '(除非它是注释内的缩进文本,注意#后面有空格)。

注释块内的段落用仅包含单个 '#' 的行分割。

行内注释

慎用行内注释(Inline Comments) 节俭使用行内注释。

行内注释是和语句在同一行,至少用两个空格和语句分开。

行内注释不是必需的,重复罗嗦会使人分心。不要这样做:

1 x = x + 1 # Increment x

但有时很有必要:

1 x = x + 1 # Compensate for border

文档字符串

文档字符串的标准参见:PEP 257。

  • 为所有公共模块、函数、类和方法书写文档字符串。非公开方法不一定有文档字符串,建议有注释(出现在 def 行之后)来描述这个方法做什么。

  • 更多参考:PEP 257 文档字符串约定。注意结尾的 """ 应该单独成行,例如:

1 """Return a foobang
2 Optional plotz says to frobnicate the bizbaz first.
3 """
  • 单行的文档字符串,结尾的 """ 在同一行。

版本标签

版本注记 (Version Bookkeeping)

如果你必须在源文件中包含git、Subversion、CVS或RCS crud信息,放置在模块的文档字符串之后,任何其他代码之前,上下各用一个空行:

1 version__ = "$Revision$"# $Source$

命名约定

Python库的命名约定有点混乱,不可能完全一致。但依然有些普遍推荐的命名规范的。新的模块和包 (包括第三方的框架) 应该遵循这些标准。对不同风格的已有的库,建议保持内部的一致性。

最重要的原则

用户可见的API命名应遵循使用约定而不是实现。

描述:命名风格

有多种命名风格:

  • b(单个小写字母)

  • B(单个大写字母)

  • lowercase(小写串)

  • lower_case_with_underscores(带下划线的小写)

  • UPPERCASE(大写串)

  • UPPER_CASE_WITH_UNDERSCORES(带下划线的大写串)

  • CapitalizedWords(首字母大写的单词串或驼峰缩写)

注意: 使用大写缩写时,缩写使用大写字母更好。故 HTTPServerError 比 HttpServerError 更好。

  • mixedCase(混合大小写,第一个单词是小写)

  • Capitalized_Words_With_Underscores(带下划线,首字母大写,丑陋)

还有一种风格使用短前缀分组名字。这在Python中不常用, 但出于完整性提一下。例如,os.stat()返回的元组有st_mode, st_size, st_mtime等等这样的名字(与POSIX系统调用结构体一致)。

X11库的所有公开函数以X开头, Python中通常认为是不必要的,因为属性和方法名有对象作前缀,而函数名有模块名为前缀。

下面讲述首尾有下划线的情况:

  • _single_leading_underscore:(单前置下划线): 弱内部使用标志。 例如"from M import " 不会导入以下划线开头的对象。

  • single_trailing_underscore_(单后置下划线): 用于避免与 Python关键词的冲突。 例如:

1 Tkinter.Toplevel(master, class_='ClassName')
  • __double_leading_underscore(双前置下划线): 当用于命名类属性,会触发名字重整。 (在类FooBar中,__boo变成 _FooBar__boo)。

  • __double_leading_and_trailing_underscore__(双前后下划线):用户名字空间的魔法对象或属性。例如:__init__ , __import__ or __file__,不要自己发明这样的名字。

命名约定规范

  • 避免采用的名字

决不要用字符'l'(小写字母el),'O'(大写字母oh),或 'I'(大写字母eye) 作为单个字符的变量名。一些字体中,这些字符不能与数字1和0区别。用'L' 代替'l'时。

  • 包和模块名

模块名要简短,全部用小写字母,可使用下划线以提高可读性。包名和模块名类似,但不推荐使用下划线。

模块名对应到文件名,有些文件系统不区分大小写且截短长名字,在 Unix上不是问题,但当把代码迁移到 Mac、Windows 或 DOS 上时,就可能是个问题。当然随着系统的演进,这个问题已经不是经常出现。

另外有些模块底层用C或C++ 书写,并有对应的高层Python模块,C/C++模块名有一个前置下划线 (如:_socket)。

  • 类名

遵循CapWord。

接口需要文档化并且可以调用时,可能使用函数的命名规则。

注意大部分内置的名字是单个单词(或两个),CapWord只适用于异常名称和内置的常量。

  • 异常名

如果确实是错误,需要在类名添加后缀 "Error"。

  • 全局变量名

变量尽量只用于模块内部,约定类似函数。

对设计为通过 "from M import " 来使用的模块,应采用 __all__ 机制来防止导入全局变量;或者为全局变量加一个前置下划线。

  • 函数名

函数名应该为小写,必要时可用下划线分隔单词以增加可读性。 mixedCase(混合大小写)仅被允许用于兼容性考虑(如: threading.py)。

  • 函数和方法的参数

实例方法第一个参数是 'self'。

类方法第一个参数是 'cls'。

如果函数的参数名与保留关键字冲突,通常在参数名后加一个下划线。

  • 方法名和实例变量

同函数命名规则。

非公开方法和实例变量增加一个前置下划线。

为避免与子类命名冲突,采用两个前置下划线来触发重整。类Foo属性名为__a, 不能以 Foo.__a访问。(执著的用户还是可以通过Foo._Foo__a。) 通常双前置下划线仅被用来避免与基类的属性发生命名冲突。

  • 常量

常量通常在模块级定义,由大写字母用下划线分隔组成。比如括MAX_OVERFLOW和TOTAL。

  • 继承设计

考虑类的方法和实例变量(统称为属性)是否公开。如果有疑问,选择不公开;把其改为公开比把公开属性改为非公开要容易。

公开属性可供所有人使用,并通常向后兼容。非公开属性不给第三方使用、可变甚至被移除。

这里不使用术语"private", Python中没有属性是真正私有的。

另一类属性是子类API(在其他语言中通常称为 "protected")。 一些类被设计为基类,可以扩展和修改。

谨记这些Python指南:

  1. 公开属性应该没有前导下划线。

  2. 如果公开属性名和保留关键字冲突,可以添加后置下划线

  3. 简单的公开数据属性,最好只公开属性名,没有复杂的访问/修改方法,python的Property提供了很好的封装方法。 d.如果不希望子类使用的属性,考虑用两个前置下划线(没有后置下划线)命名。

公共和内部接口

任何向后兼容的保证只适用于公共接口。

文档化的接口通常是公共的,除非明说明是临时的或为内部接口、其他所有接口默认是内部的。

为了更好地支持内省,模块要在__all__属性列出公共API。

内部接口要有前置下划线。

如果命名空间(包、模块或类)是内部的,里面的接口也是内部的。

导入名称应视为实现细节。其他模块不能间接访名字,除非在模块的API文档中明确记载,如os.path中或包的__init__暴露了子模块。

  • 考虑多种Python实现(PyPy, Jython, IronPython,Pyrex, Psyco, 等等)。

例如,CPython对a+=b或a=a+b等语句有高效的实现,但在Jython中运行很慢,尽量改用.join()。

  • None比较用'is'或'is not',不要用等号。

注意"if x is not None" 与"if x" 的区别。

  • 用"is not"代替"not ... is"。前者的可读性更好。

1 # Yes
2 if foo is not None
3 
4 # No
5 if not foo is None
  • 使用基于类的异常。

比较排序操作最好是实现所有六个操作,而不是代码中实现比较逻辑。functools.total_ordering()装饰符可以生成缺失的比较方法。

1 _eq__,__ne____lt____lt____gt______

PEP207 比较标准表明反射规则由Python完成。因此解释器可能会交换参数的位置,比如替换y > x为x < y,所以有必要实现这5种方法。

  • 使用函数定义def代替lambda赋值给标识符:

1 # Yes
2 def f(x): 
3     return 2*x
4  
5 # No
6 f = lambda x: 2*x

前者更适合回调和字符串表示。

  • 异常类继承自Exception,而不是BaseException。

源于异常,而不是BaseException例外。从BaseException直接继承的例外情况追赶他们几乎总是错误的事情做保留。

要设计基于层次的异常,捕捉到需要的异常,而不是异常引发的位置。能回答:“出了什么问题?”,而不是仅仅指出“问题发生”(更多参考:PEP3151 重构OS和IO异常层次)

  • 适当使用异常链。在Python3中"raise X from Y"明确表示更换且保留了原来的traceback。

替换内部异常(在Python2: "raise X"或"raise X from None")时,确保相关细节转移到新的异常(如转换KeyError为AttributeError保存属性名,或在新的异常中嵌入原始异常)。

  • Python2中用" raise ValueError('message')"代替"raise ValueError, 'message'"

后者不兼容Python3语法。前者续行方便。

  • 捕获异常时尽量指明具体异常,而不是空"except:"子句。比如:

1 # Yes
2 try:
3     import platform_specific_module
4 except ImportError:
5     platform_specific_module = None

空"except:"子句(相当于except Exception)会捕捉SystemExit和KeyboardInterrupt异常,难以用Control-C中断程序,并可掩盖其他问题。如果 你捕捉信号错误之外所有的异常,使用"except Exception"。

空"except:"子句适用的情况两种情况:

a, 打印出或记录了traceback,至少让用户将知道已发生错误。 b, 代码需要做一些清理工作,并用 raise转发了异常。这样try...finally可以捕捉到它。
  • Python 2.6以后建议用as显示绑定异常名:
1 # Yes
2 try:
3     process_data()
4 except Exception as exc:
5     raise DataProcessingFailedError(str(exc))

这样才能兼容Python3语法并避免歧义。

  • 捕捉操作系统错误时,建议使用Python 3.3引入显式异常层次,支持内省errno值。

  • 此外所有try/except子句的代码要尽可的少,以免屏蔽其他的错误。

 1 # Yes
 2 try:
 3     value = collection[key]
 4 except KeyError:
 5     return key_not_found(key)
 6 else:
 7     return handle_value(value)
 8  
 9 # No
10 try:
11     # 太泛了!
12     return handle_value(collection[key])
13 except KeyError:
14     # 会捕捉到handle_value()中的KeyError
15     return key_not_found(key)
  • 本地资源建议使用with语句,以确保即时清理。当然try / finally语句也是可以接受的。

  • 上下文管理器在做获取和释放资源之外的事情时,应通过独立的函数或方法。例如:

1 # Yes
2 with conn.begin_transaction():
3     do_stuff_in_transaction(conn)
4  
5 # No
6 with conn:
7     do_stuff_in_transaction(conn)

后者指明enter和exit方法。

  • 函数或者方法在没有返回时要明确返回None。

 1 # Yesdef foo(x):
 2     if x >= 0:
 3         return math.sqrt(x)
 4     else:
 5         return Nonedef bar(x):
 6     if x < 0:
 7         return None
 8     return math.sqrt(x)# Nodef foo(x):
 9     if x >= 0:
10         return math.sqrt(x)def bar(x):
11     if x < 0:
12         return
13     return math.sqrt(x)
  • 使用字符串方法而不是string模块。

python 2.0以后字符串方法总是更快,且Unicode字符串相同的API。

  • 使用使用 .startswith()和.endswith()代替字符串切片来检查前缀和后缀。and

startswith()和endswith更简洁,利于减少错误。例如:

1 # Yes
2 if foo.startswith('bar'):
3  
4 # No
5 if foo[:3] == 'bar':
  • 使用isinstance()代替对象类型的比较:
1 # Yes
2 if isinstance(obj, int):
3  
4 # No
5 if type(obj) is type(1):

检查是否是字符串时,注意Python 2中str和unicode有公共的基类:

if isinstance(obj, basestring): 在 Python 2.2 中,types 模块为此定义了 StringTypes 类型,例如:

1 # Yes
2 if isinstance(obj, basestring):

Python3中Unicode和basestring的不再存在(只有str)和字节对象不再是字符串(是整数序列)

  • 对序列(字符串、列表 、元组), 空序列为false:

 1 # Yes
 2 if not seq:
 3    pass
 4 if seq:
 5    pass
 6  
 7 # No
 8 if len(seq):
 9    pass
10 if not len(seq):
11    pass
  • 字符串后面不要有大量拖尾空格。

  • 不要用 == 进行布尔比较

1 # Yes
2 if greeting::
3    pass
4  
5 # No
6 if greeting == True
7    pass
8 if greeting is True: # Worse
9    pass
  • Python标准库不使用的功能注释,这块有待用户去发现和体验有用的注释风格。下面有些第三方的建议(略)。

参考资料

  • PEP 8 - Style Guide for Python Code

  • 作者博客:http://my.oschina.net/u/1433482
  • http://my.oschina.net/u/1433482/blog/464444

 

 

PEP8 Python 编码规范整理:

一 代码编排
1 缩进。4个空格的缩进(编辑器都可以完成此功能),不使用Tap,更不能混合使用Tap和空格。
2 每行最大长度79,换行可以使用反斜杠,最好使用圆括号。换行点要在操作符的后边敲回车。
3 类和top-level函数定义之间空两行;类中的方法定义之间空一行;函数内逻辑无关段落之间空一行;其他地方尽量不要再空行。

二 文档编排
1 模块内容的顺序:模块说明和docstring—import—globals&constants—其他定义。其中import部分,又按标准、三方和自己编写顺序依次排放,之间空一行。
2 不要在一句import中多个库,比如import os, sys不推荐。
3 如果采用from XX import XX引用库,可以省略‘module.’,都是可能出现命名冲突,这时就要采用import XX。

三 空格的使用
        总体原则,避免不必要的空格。
1 各种右括号前不要加空格。
2 逗号、冒号、分号前不要加空格。
3 函数的左括号前不要加空格。如Func(1)。
4 序列的左括号前不要加空格。如list[2]。
5 操作符左右各加一个空格,不要为了对齐增加空格。
6 函数默认参数使用的赋值符左右省略空格。
7 不要将多句语句写在同一行,尽管使用‘;’允许。
8 if/for/while语句中,即使执行语句只有一句,也必须另起一行。

四 注释
        总体原则,错误的注释不如没有注释。所以当一段代码发生变化时,第一件事就是要修改注释!
        注释必须使用英文,最好是完整的句子,首字母大写,句后要有结束符,结束符后跟两个空格,开始下一句。如果是短语,可以省略结束符。
1 块注释,在一段代码前增加的注释。在‘#’后加一空格。段落之间以只有‘#’的行间隔。比如:
# Description : Module config.
#
# Input : None
#
# Output : None
2 行注释,在一句代码后加注释。比如:x = x + 1 # Increment x
但是这种方式尽量少使用。
3 避免无谓的注释。

五 文档描述
1 为所有的共有模块、函数、类、方法写docstrings;非共有的没有必要,但是可以写注释(在def的下一行)。
2 如果docstring要换行,参考如下例子,详见PEP 257
"""Return a foobang

Optional plotz says to frobnicate the bizbaz first.

"""

六 命名规范
        总体原则,新编代码必须按下面命名风格进行,现有库的编码尽量保持风格。
1 尽量单独使用小写字母‘l’,大写字母‘O’等容易混淆的字母。
2 模块命名尽量短小,使用全部小写的方式,可以使用下划线。
3 包命名尽量短小,使用全部小写的方式,不可以使用下划线。
4 类的命名使用CapWords的方式,模块内部使用的类采用_CapWords的方式。
5 异常命名使用CapWords+Error后缀的方式。
6 全局变量尽量只在模块内有效,类似C语言中的static。实现方法有两种,一是__all__机制;二是前缀一个下划线。
7 函数命名使用全部小写的方式,可以使用下划线。
8 常量命名使用全部大写的方式,可以使用下划线。
9 类的属性(方法和变量)命名使用全部小写的方式,可以使用下划线。
9 类的属性有3种作用域public、non-public和subclass API,可以理解成C++中的public、private、protected,non-public属性前,前缀一条下划线。
11 类的属性若与关键字名字冲突,后缀一下划线,尽量不要使用缩略等其他方式。
12 为避免与子类属性命名冲突,在类的一些属性前,前缀两条下划线。比如:类Foo中声明__a,访问时,只能通过Foo._Foo__a,避免歧义。如果子类也叫Foo,那就无能为力了。
13 类的方法第一个参数必须是self,而静态方法第一个参数必须是cls。

七 编码建议
1 编码中考虑到其他python实现的效率等问题,比如运算符‘+’在CPython(Python)中效率很高,都是Jython中却非常低,所以应该采用.join()的方式。
2 尽可能使用‘is’‘is not’取代‘==’,比如if x is not None 要优于if x。
3 使用基于类的异常,每个模块或包都有自己的异常类,此异常类继承自Exception。
4 异常中不要使用裸露的except,except后跟具体的exceptions。
5 异常中try的代码尽可能少。比如:
try:
value = collection[key]
except KeyError:
return key_not_found(key)
else:
return handle_value(value)
要优于
try:
# Too broad!
return handle_value(collection[key])
except KeyError:
# Will also catch KeyError raised by handle_value()
return key_not_found(key)
6 使用startswith() and endswith()代替切片进行序列前缀或后缀的检查。比如:
Yes: if foo.startswith('bar'):优于
No: if foo[:3] == 'bar':
7 使用isinstance()比较对象的类型。比如
Yes: if isinstance(obj, int): 优于
No: if type(obj) is type(1):
8 判断序列空或不空,有如下规则
Yes: if not seq:
if seq:
优于
No: if len(seq)
if not len(seq)
9 字符串不要以空格收尾。
10 二进制数据判断使用 if boolvalue的方式。

 

你可能感兴趣的:(python代码风格指南:PEP8 中文)