Python(英语发音:/ˈpʌɪθ(ə)n/),是一种面向对象、直译式电脑编程语言,也是一种功能强大的通用型语言,已经具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法非常简捷和清晰,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。
Python支持命令式程序设计、面向对象程序设计、函数式编程、面向切面编程、泛型编程多种编程范式。与Scheme、Ruby、Perl、Tcl等动态语言一样,Python具备垃圾回收功能,能够自动管理存储器使用。它经常被当作脚本语言用于处理系统管理任务和网络程序编写,然而它也非常适合完成各种高级任务。Python虚拟机本身几乎可以在所有的作业系统中运行。使用一些诸如py2exe、PyPy、PyInstaller之类的工具可以将Python源代码转换成可以脱离Python解释器运行的程序。
Python的主要参考实现是CPython,它是一个由社区驱动的自由软件。目前由Python软件基金会管理。基于这种语言的相关技术正在飞快的发展,用户数量快速扩大,相关的资源非常多。
目录
|
Python的创始人为吉多·范罗苏母(Guido van Rossum)。在1989年圣诞节期间的阿姆斯特丹,吉多为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,作为ABC语言的一种继承。之所以选中Python作为程序的名字,是因为他是一个蒙提·派森的飞行马戏团的爱好者。ABC是由吉多参加设计的一种教学语言。就吉多本人看来,ABC这种语言非常优美和强大,是专门为非专业程序员设计的。但是ABC语言并没有成功,究其原因,吉多认为是非开放造成的。吉多决心在Python中避免这一错误,并取得了非常好的效果,完美结合了如C、C++和Java等其他语言。[1]
就这样,Python在吉多手中诞生了。实际上,第一个实现是在Mac机上。可以说,Python是从ABC发展起来,主要受到了Modula-3(另一种相当优美且强大的语言,为小型团体所设计的)的影响。并且结合了Unix shell和C的习惯。
目前吉多·范罗苏母仍然是Python的主要开发者,决定整个Python语言的发展方向,Python社区经常称呼他是仁慈的独裁者。
Python 2.0于2000年10月16日发布,主要是实现了完整的垃圾回收,并且支持Unicode。同时,整个开发过程更加透明,社区对开发进度的影响逐渐扩大。Python 3.0于2008年12月3日发布,此版不完全兼容之前的Python源代码。不过,很多新特性后来也被移植到旧的Python 2.6/2.7版本。
Python的设计哲学是“优雅”、“明确”、“简单”。因此,Perl语言中“总是有多种方法来做同一件事”的理念在Python开发者中通常是难以忍受的。Python开发者的哲学是“用一种方法,最好是只有一种方法来做一件事”。在设计Python语言时,如果面临多种选择,Python开发者一般会拒绝花俏的语法,而选择明确的没有或者很少有歧义的语法。由于这种设计观念的差异,Python源代码通常被认为比Perl具备更好的可读性,并且能够支撑大规模的软件开发。这些准则被称为Python格言。在Python解释器内运行import this
可以获得完整的列表。
Python开发人员尽量避开不成熟或者不重要的优化。一些针对非重要部位的加快运行速度的补丁通常不会被合并到Python内。所以很多人认为Python很慢。不过,根据二八定律,大多数程序对速度要求不高。在某些对运行速度要求很高的情况,Python设计师倾向于使用JIT技术,或者用使用C/C++语言改写这部分程序。目前可用的JIT技术是PyPy。
Python是完全面向对象的语言。函数、模块、数字、字符串都是对象。并且完全支持继承、重载、派生、多继承,有益于增强源代码的复用性。Python支持重载运算符,因此Python也支持泛型设计。相对于Lisp这种传统的函数式编程语言,Python对函数式设计只提供了有限的支持。有两个标准库(functools, itertools)提供了Haskell和Standard ML中久经考验的函数式程序设计工具。
虽然Python可能被粗略地分类为“脚本语言”(script language),但实际上一些大规模软件开发计划例如Zope、Mnet及BitTorrent,Google也广泛地使用它。Python的支持者较喜欢称它为一种高级动态编程语言,原因是“脚本语言”泛指仅作简单程序设计任务的语言,如shell script、VBScript等只能处理简单任务的编程语言,并不能与Python相提并论。
Python本身被设计为可扩充的。并非所有的特性和功能都集成到语言核心。Python提供了丰富的API和工具,以便程序员能够轻松地使用C语言、C++、Cython来编写扩充模块。Python编译器本身也可以被集成到其它需要脚本语言的程序内。因此,很多人还把Python作为一种“胶水语言”(glue language)使用。使用Python将其他语言编写的程序进行集成和封装。在Google内部的很多项目使用C++编写性能要求极高的部分,然后用Python调用相应的模块。[来源请求]
Python经常被用于Web开发。比如,通过mod_wsgi模块,Apache可以运行用Python编写的Web程序。Python定义了WSGI标准应用接口来协调Http服务器与基于Python的Web程序之间的沟通。一些Web框架,如Django、TurboGears、web2py、Zope、flask等,可以让程序员轻松地开发和管理复杂的Web程序。
在很多作业系统里,Python是标准的系统组件。大多数Linux发布版以及NetBSD、OpenBSD和Mac OS X都集成了Python,可以在终端机下直接运行Python。有一些Linux发布版的安装器使用Python语言编写,比如Ubuntu的Ubiquity安装器、Red Hat Linux和Fedora的Anaconda安装器。Gentoo Linux使用Python来编写它的Portage包管理系统。Python标准库包含了多个调用作业系统功能的库。通过pywin3这个第三方软件包,Python能够访问Windows的COM服务及其它Windows API。使用IronPython,Python程序能够直接调用 .Net Framework。一般说来,Python编写的系统管理脚本在可读性、性能、源代码重用度、扩展性几方面都优于普通的shell脚本。
NumPy、SciPy、Matplotlib可以让Python程序员编写科学计算程序。PyQt、PySide、wxPython、PyGTK是Python快速开发桌面应用程序的利器。
Python对于各种网络协定的支持很完善,因此经常被用于编写服务器软件、网络蠕虫。第三方库Twisted支持异步联机编写程序和多数标准的网络协定(包含客户端和服务器),并且提供了多种工具,被广泛用于编写高性能的服务器软件。
很多游戏使用C++编写图形显示等高性能模块,而使用Python或者Lua编写游戏的逻辑、服务器。相较于Python,Lua的功能更简单、体积更小;而Python则支持更多的特性和数据类型。
YouTube、Google、Yahoo!、NASA都在内部大量地使用Python。OLPC的作业系统Sugar项目的大多数软件都是使用Python编写。
很多游戏,如 EVE Online 使用Python来处理游戏中繁多的逻辑。
下面是一个在标准输设备上输出Hello World的简单程序,这种程序通常作为开始学习编程语言时的第一个程序:
print("Hello, world!")
print "Hello, world!"
将这行程序码保存为myhello.py。然后在Linux终端机下输入python myhello.py
,或者在Windows命令编辑字符下输入myhello.py
运行。Python也可以单步直译运行。运行Python解释器进入交互式命令行的环境,你可以在提示符号>>>旁输入print("Hello, world!"),按Enter键输出结果:
>>> print("Hello, world!") Hello, world!
>>> print "Hello, world!" Hello, world!
注意,低于3.0版本的Python,"Hello, world!"周围不需要括号。Python 3.x与Python 2.x的print语法是不一样的。
Python的设计目标之一是让代码具备高度的可阅读性。它设计时尽量使用其它语言经常使用的标点符号和英文单字,让代码看起来整洁美观。它不像其他的静态语言如C、Pascal那样需要重复书写声明语句,也不像它们的语法那样经常有特殊情况和惊喜。
Python开发者有意让违反了缩进规则的程序不能通过编译,以此来强制程序员养成良好的编程习惯。并且Python语言利用缩进表示语句块的开始和退出(Off-side规则),而非使用花括号或者某种关键字。增加缩进表示语句块的开始,而减少缩进则表示语句块的退出。缩进成为了语法的一部分。例如if
语句:
if age < 21: print("你不能買酒。") print("不過你能買口香糖。") print("這句話處於if語句塊的外面。")
注:上述例子为python 3.0版本的代码
根据PEP的规定,必须使用4个空格来表示每级缩进。使用Tab字符和其它数目的空格虽然都可以编译通过,但不符合编码规范。支持Tab字符和其它数目的空格仅仅是为兼容很旧的的Python程序和某些有问题的编辑程序。
if
语句,当条件成立时运行语句块。经常与else
, elif
(相当于else if
) 配合使用。for
语句,遍列列表、字符串、字典、集合等迭代器,依次处理迭代器中的每个元素。while
语句,当条件为真时,循环运行语句块。try
语句。与except
,finally
配合使用处理在程序运行中出现的异常情况。class
语句。用于定义类型。def
语句。用于定义函数和类型的方法。pass
语句。表示此行为空,不运行任何操作。assert
语句。用于程序调适阶段时测试运行条件是否满足。with
语句。Python2.6以后定义的语法,在一个场景中运行语句块。比如,运行语句块前加密,然后在语句块运行退出后解密。yield
语句。在迭代器函数内使用,用于返回一个元素。自从Python 2.5版本以后。这个语句变成一个运算符。raise
语句。制造一个错误。import
语句。导入一个模块或包。from import
语句。从包导入模块或从模块导入某个对象。import as
语句。将导入的对象赋值给一个变量。in
语句。判断一个对象是否在一个字符串/列表/元组里。Python的表达式写法与C/C++类似。只是在某些写法有所差别。
+, -, *, /, //, **, ~, %
分别表示加法或者取正、减法或者取负、乘法、除法、整除、乘方、取补、取模。>>, <<
表示右移和左移。&, |, ^
表示二进制的AND, OR, XOR
运算。>, <, ==, !=, <=, >=
用于比较两个表达式的值,分别表示大于、小于、等于、不等于、小于等于、大于等于。在这些运算符里面,~, |, ^, &, <<, >>
必须应用于整数。and
, or
, not
表示逻辑运算。is, is not
用于比较两个变量是否是同一个对象。in, not in
用于判断一个对象是否属于另外一个对象。>>> sum(x * x for x in range(10)) 285
lambda
表示匿名函数。匿名函数体只能是表达式。比如:>>> add=lambda x, y : x + y >>> add(3,2) 5
y if cond else x
表示条件表达式。意思是当cond
为真时,表达式的值为y
,否则表达式的值为x
。相当于C++和Java里的cond?y:x
。[1,2,3]
,而tuple的写法是(1,2,3)
。可以改变list中的元素,而不能改变tuple。在某些情况下,tuple的括号可以省略。tuple对于赋值语句有特殊的处理。因此,可以同时赋值给多个变量,比如:>>> x, y=1, 2 #同时给x,y赋值,最终结果:x=1, y=2
特别地,可以使用以下这种形式来交换两个变量的值:
>>> x, y=y, x #最终结果:y=1, x=2
\n
表示换行符。表达式前加r
指示Python不解释字符串中出现的\。这种写法通常用于编写正则表达式或者Windows文件路径。str, bytes, list, tuple
等。它的语法是...[left:right]
或者...[left:right:stride]
。假定nums
变量的值是[1, 3, 5, 7, 8, 13, 20]
,那么下面几个语句为真:nums[2:5] == [5, 7, 8]
从下标为2的元素切割到下标为5的元素,但不包含下标为5的元素。nums[1:] == [3, 5, 7, 8, 13, 20]
切割到最后一个元素。nums[:-3] == [1, 3, 5, 7]
从最开始的元素一直切割到倒数第3个元素。nums[:] == [1, 3, 5, 7, 8, 13, 20]
返回所有元素。改变新的列表不会影响到nums。nums[1:5:2] == [3, 7]
从下标为1的元素切割到下标为5的元素但不包含下标为5的元素,且步长为2Python的函数支持递归、默认参数值、可变参数,但不支持函数重载。为了增强代码的可读性,可以在函数后书写“文档字符串”(Documentation Strings,或者简称docstrings),用于解释函数的作用、参数的类型与意义、返回值类型与取值范围等。可以使用内置函数help()
打印出函数的使用帮助。比如:
>>> def randint(a, b): ... "Return random integer in range [a, b], including both end points." ... >>> help(randint) Help on function randint in module __main__: randint(a, b) Return random integer in range [a, b], including both end points.
对象的方法是指绑定到对象的函数。调用对象方法的语法是instance.method(arguments)
。它等价于调用Class.method(instance, arguments)
。当定义对象方法时,必须显式地定义第一个参数,一般该参数名都使用self
,用于访问对象的内部数据。这里的self
相当于C++, Java里面的this
变量,但是我们还可以使用任何其它合法的参数名,比如this
和 mine
等,self
与C++,Java里面的this
不完全一样,它可以被看作是一个习惯性的用法,我们传入任何其它的合法名称都行,比如:
class Fish: def eat(self, food): if food is not None: self.hungry=False class User: def __init__(myself, name): myself.name = name #构造Fish的实例: f=Fish() #以下两种调用形式是等价的: Fish.eat(f, "earthworm") f.eat("earthworm") u = User('username') u.name
Python认识一些以“__”开始并以“__”结束的特殊方法名,它们用于实现运算符重载和实现多种特殊功能。
Python采用动态类型系统。在编译的时候,Python不会检查对象是否拥有被调用的方法或者属性,而是直至运行时,才做出检查。所以操作对象时可能会抛出异常。不过,虽然Python采用动态类型系统,它同时也是强类型的。Python禁止没有明确定义的操作,比如数字加字符串。
与其它面向对象语言一样,Python允许程序员定义类型。构造一个对象只需要像函数一样调用类型即可,比如,对于前面定义的Fish
类型,使用Fish()
。类型本身也是特殊类型type
的对象(type
类型本身也是type
对象),这种特殊的设计允许对类型进行反射编程。
Python内置丰富的数据类型。与Java、C++相比,这些数据类型有效地减少代码的长度。下面这个列表简要地描述了Python内置数据类型(适用于Python 3.x):
类型 | 描述 | 例子 |
---|---|---|
str |
一个由字符组成的不可更改的有串行。在Python 3.x里,字符串由Unicode字符组成。 | 'Wikipedia' "Wikipedia" """Spanning |
bytes |
一个由字节组成的不可更改的有串行。 | b'Some ASCII' b"Some ASCII" |
list |
可以包含多种类型的可改变的有串行 | [4.0, 'string', True] |
tuple |
可以包含多种类型的不可改变的有串行 | (4.0, 'string', True) |
set , frozenset |
与数学中集合的概念类似。无序的、每个元素唯一。 | {4.0, 'string', True} frozenset([4.0, 'string', True]) |
dict |
一个可改变的由键值对组成的无串行。 | {'key1': 1.0, 3: False} |
int |
精度不限的整数 | 42 |
float |
浮点数。精度与系统相关。 | 3.1415927 |
complex |
复数 | 3+2.7j |
bool |
逻辑值。只有两个值:真、假 | True False |
除了各种数据类型,Python语言还用类型来表示函数、模块、类型本身、对象的方法、编译后的Python代码、运行时信息等等。因此,Python具备很强的动态性。
Python使用与C、Java类似的运算符,支持整数与浮点数的数学运算。同时还支持复数运算与无穷位数(实际受限于计算机的能力)的整数运算。除了求绝对值函数abs()
外,大多数数学函数处于math
和cmath
模块内。前者用于实数运算,而后者用于复数运算。使用时需要先导入它们,比如:
>>> import math >>> print(math.sin(math.pi/2)) 1.0
fractions
模块用于支持分数运算;decimal
模块用于支持高精度的浮点数运算。
Python定义求余运行a % b
的值处于开区间[0, b)
内,如果b
是负数,开区间变为(b, 0]
。这是一个很常见的定义方式。不过其实它依赖于整除的定义。为了让方程式:b * (a // b) + a % b = a
恒真,整除运行需要向负无穷小方向取值。比如7 // 3
的结果是2
,而(-7) // 3
的结果却是-3
。这个算法与其它很多编程语言不一样,需要注意,它们的整除运算会向0的方向取值。
Python允许像数学的常用写法那样连着写两个比较运行符。比如a < b < c
与a < b and b < c
等价。C++的结果与Python不一样,首先它会先计算a < b
,根据两者的大小获得0或者1两个值之一,然后再与c进行比较。
Python拥有一个强大的标准库[2]。Python语言的核心只包含数字、字符串、列表、字典、文件等常见类型和函数,而由Python标准库提供了系统管理、网络通信、文本处理、数据库接口、图形系统、XML处理等额外的功能。Python标准库命名接口清晰、文档良好,很容易学习和使用。
Python社区提供了大量的第三方模块,使用方式与标准库类似。它们的功能无所不包,覆盖科学计算、Web开发、数据库接口、图形系统多个领域,并且大多成熟而稳定。第三方模块可以使用Python或者C语言编写。SWIG,SIP常用于将C语言编写的程序库转化为Python模块。Boost C++ Libraries 包含了一组库,Boost.Python,使得以 Python 或 C++ 编写的程序能互相调用。借助于拥有基于标准库的大量工具、能够使用低级语言如C和可以作为其他库接口的C++,Python已成为一种强大的应用于其他语言与工具之间的胶水语言。
Python标准库的主要功能有:
Python的3.0版本,常被称为Python 3000,或简称Py3k[3]。相对于Python的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0在设计的时候没有考虑向下兼容。许多针对早期Python版本设计的程序都无法在Python 3.0上正常运行。为了照顾现有程序,Python 2.6作为一个过渡版本,基本使用了Python 2.x的语法和库,同时考虑了向Python 3.0的迁移,允许使用部分Python 3.0的语法与函数。基于早期Python版本而能正常运行于Python 2.6并无警告的程序可以通过一个2 to 3的转换工具无缝迁移到Python 3.0[4]。
新的Python程序建议使用Python 3.0版本的语法[5]。除非运行环境无法安装Python 3.0或者程序本身使用了不支持Python 3.0的第三方库。目前不支持Python 3.0的第三方库有Django, Twisted, py2exe, PIL等。大多数第三方库都正在努力地兼容Python 3.0版本。即使无法立即使用Python 3.0,也建议编写兼容Python 3.0版本的程序,然后使用Python 2.6, Python 2.7来运行。Python 2.7被确定为最后一个Python 2.x版本,它除了支持Python 2.x语法外,还支持部分Python 3.1语法。
Python 3.0的变化主要在以下几个方面[6]:
print
语句没有了,取而代之的是print()
函数。可以使用2to3
工具自动地转换print
语句。Python 2.6与Python 2.7部分地支持这种形式的print
语法。在Python 2.6与Python 2.7里面,以下三种形式是等价的:print "fish" print ("fish") #注意print后面有个空格 print("fish") #print()不能带有任何其它参数
然而,Python 2.6实际已经支持新的print()
语法。方法是:
from __future__ import print_function print("fish", "panda", sep=', ')
str
类型表示一个Unicode字符串,相当于Python 2.x版本的unicode
类型。而字节串行则用类似b"abc"
的语法表示,用bytes
类表示,相当于Python 2.x的str
类型。现在两种类型不能再隐式地自动转换,因此在Python 3.x里面"fish"+b"panda"
是错误。正确的写法是"fish"+b"panda".decode("utf-8")
。Python 2.6可以自动地将字节串行识别为Unicode字符串,方法是:from __future__ import unicode_literals print(repr("fish"))
/
在Python 3.x内总是返回浮点数。而在Python 2.6内会判断被除数与除数是否是整数。如果是整数会返回整数值,相当于整除;浮点数则返回浮点数值。为了让Python 2.6统一返回浮点数值,可以:from __future__ import division print(3/2)
except exc, var
改为except exc as var
。使用语法except (exc1, exc2) as var
可以同时捕获多种类型的异常。Python 2.6已经支持这两种语法。{expr1: expr2 for k, v in d}
,这个语法等价于:result={} for k, v in d.items(): result[expr1]=expr2 return result
{1,2,3,4}
。注意{}
仍然表示空的字典(dict)。0o777
,原来的形式0777
不能用了;二进制必须写成0b111
。新增了一个bin()
函数用于将一个整数转换成二进制字符串。Python 2.6已经支持这两种语法。dict.keys(), dict.values(), dict.items(), map(), filter(), range(), zip()
不再返回列表,而是迭代器。<, >, <=, >=
比较它们会抛出异常。比如1 < ""
在Python 2.6里面会返回True
,而在Python 3.0里面会抛出异常。现在cmp(), instance.__cmp__()
函数已经被删除。def sendMail(from_:"[email protected]", \ to:"[email protected]", \ title:"hello", \ body:"Just say hello to you.") -> True: pass
旧的名字 | 新的名字 |
---|---|
_winreg | winreg |
ConfigParser | configparser |
copy_reg | copyreg |
Queue | queue |
SocketServer | socketserver |
repr | reprlib |
StringIO
模块现在被合并到新的io
模块内。new, md5, gopherlib
等模块被删除。Python 2.6已经支持新的io
模块。httplib, BaseHTTPServer, CGIHTTPServer, SimpleHTTPServer, Cookie, cookielib
被合并到http
包内。exec
语句,只剩下exec()
函数。Python 2.6已经支持exec()
函数。Python是一门跨平台的脚本语言,Python规定了一个Python语法规则,实现了Python语法的解释程序就成为了Python的解释器。
适用于Python的集成开发环境(IDE)软件,除了标准二进制发布包所附的IDLE之外,还有许多其他选择。其中有些软件设计有语法着色、语法检查、运行调试、自动补全、智能感知等便利功能。由于Python的跨平台出身,这些软件往往也具备各种操作系统的版本或一定的移植性。
而很多并非集成开发环境软件的文本编辑器,也对Python有不同程度的支持,并且加上专门为Python设计的编辑器插件也会有很高的可用性。
专门为Python设计的IDE软件:
通用IDE / 文本编辑器:
隐藏▲
计算机语言
|
|||||||||
---|---|---|---|---|---|---|---|---|---|
.NET Framework平台语言 |
C++/CLI
· C#
· F#
· IronPython
· J#
· Visual C#
· Visual Basic .NET
· Small Basic
|
||||||||
C/C++语言 |
C
· C++
· Turbo C++
· Borland C++
· C++ Builder- C++/CLI
· C++/CX
· Objective-C
· Microsoft Visual C++
|
||||||||
BASIC语言 |
|
||||||||
Pascal/Delphi语言 |
|
||||||||
ECMAScript语言 |
ActionScript
· DMDScript
· JavaScript
· JScript
|
||||||||
数据库相关编程语言 |
Clipper
· Visual FoxPro
· SQL( PL/SQL
· T-SQL)
· SQL预存程序
|
||||||||
GPU用着色器语言 |
Cg
· GLSL
· HLSL
|
||||||||
函数式编程语言 |
Haskell
· Scala
· Erlang
· Clean
· Miranda
|
||||||||
各种Shell语言 |
bash
· sed
· awk
· PowerShell
|
||||||||
专业工具语言 |
|
||||||||
置标语言 |
|
||||||||
Java虚拟机上的语言 |
Java
· Jython
· JRuby
· JScheme
· Groovy
· Kawa
· Scala
· Clojure
|
||||||||
视觉化程序设计语言 |
LabVIEW
· Quartz Composer
|
||||||||
脚本语言 |
JavaScript
· Lua
· Perl
· PHP
·
Python
· Ruby
· Tcl/Tk
· VBScript
· ActionScript
|
||||||||
其他编程语言 |
汇编语言
· A+
· ALGOL
· APL/ J
· Ada
· B
· Brainfuck
· COBOL
· Curl
· D
· Eiffel
· Forth
· Go
· Io语言
· Jess
· Logo
· MUMPS
· Nuva
· PL/I
· PostScript
· Prolog
· REXX
· SAC
· Self
· Simula
· Smalltalk
· 易语言
|