前言
如果你是刚接触 Python 的初学者,那你可能是直接学习 Python 3.x 版本。对于 Python 2.x 的版本是不会有所接触。官方也宣布在 2020 停止对 Python 2.x 的维护。我也建议初学者直接去学 Python 3.x 版本。但我们还是要去了解下 Python 3.x 与 Python 2.x 之间都有哪些改变,通过对比能让你对 Python 有更加深刻的理解。并且在很多面试过程中,面试官都会问:Python 2.x 与 Python 3.x 的区别。今天就给大家列举 Python 3.0 主要改变的几个方面。
Py3K
Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3K。
为了照顾现有程式,Python 2.6 作为一个过度版本,基本使用了 Python 2.x 得语法和库,同时考虑了向 Pythn 3.0 得迁移,允许使用部分 Python 3.0 的语法与函数。
Python 3.0 的变化主要在以下几个方面:
1 print 函数
print 语句没有了,取而代之的是 print() 函数。Python 2.6 与 Python 2.7 部分地支持这种形式的 print 语法。在 Python 2.6 与 Python 2.7 里面,以下三种形式是等价的:
print "fish"
print ("fish") # 注意 print 后面有个空格
print("fish") # print() 不能带有任何其它参数
复制代码
然后,Python 2.6 实际已经支持新得 print() 语法:
from __future__ import print_function
print("fish", "panda", sep=", ")
复制代码
2 Unicode
Python 2 有 ASCII str() 类型,unicode() 是单独的,不是 byte 类型。
现在,在 Python 3 ,我们最终有了 Unicode(utf-8) 字符串,以及一个字节类:byte 和 bytearrays。
由于 Python 3.x 源码文件默认使用 uft-8 编码,这就使得以下代码是合法的:
>>> 中国 = 'china'
>>> print(中国)
china
复制代码
Python 2.x
>>> str = '我爱北京天安门'
>>> str
'\xe6\x88\x91\xe7\x88\xb1\xe5\x8c\x97\xe4\xba\xac\xe5\xa4\xa9\xe5\xae\x89\xe9\x97\xa8'
>>> str = u'我爱北京天安门'
>>> str
复制代码
Python 3.x
>>> str = "我爱北京天安门"
>>> str
'我爱北京天安门'
复制代码
3 除法运算
Python 中的除法较其它语言显得非常高端,有套很复杂的规则。Python 中的除法有两个运算符,/ 和 // 首先来说下 / 除法:
在 python 2.x 中 / 除法就跟我们熟悉的大多数语言,比如 Java、C 差不多,整数相除的结果是一个整数,把小数部分完全忽略掉,浮点数除法会保留小数点的部分得到一个浮点数的结果。
在 python3.x 中 / 除法不再这么做了,对于整数之间的相除,结果也会是浮点数。
Python 2.x
>>> 1 / 2
0
>>> 1.0 / 2.0
0.5
复制代码
Python 3.x
>>> 1/2
0.5
复制代码
而对于 // 除法,这种除法叫做 floor 除法,会对除法的结果自动进行一个 floor 操作,在 python 2.x 和 python 3.x 中是一致的。
而 floor 除法指的是返回数字的下舍整数,在 Python 中有个 floor 函数,它不能直接访问,需要导入 math 模块,通过静态对象调用该方法。举个例子:
import math # This will import math module
print "math.floor(-45.17) : ", math.floor(-45.17)
复制代码
输出结果:
math.floor(-45.17) : -46.0
复制代码
python 2.x:
>>> -1 // 2
-1
复制代码
注意的是并不是舍弃小数部分,而是执行 floor 操作,如果要截取小数部分,那么需要使用 math 模块的 trunc 函数
python 3.x
>>> import math
>>> math.trunc(1 / 2)
0
>>> math.trunc(-1 / 2)
0
复制代码
4 异常
在 Python 3 中处理异常也轻微的改变了,在 Python 3 中我们现在使用 as 作为关键词。
捕获异常的语法由 except exc, var 改为 except exc as var。
使用语法 except (exc1, exc2) as var 可以同时捕获多种类别的异常。 Python 2.6 已经支持这两种语法。
1. 在 2.x 时代,所有类型的对象都是可以被直接抛出的,在 3.x 时代,只有继承自 BaseException 的对象才可以被抛出。
2. 2.x raise 语句使用逗号将抛出对象类型和参数分开,3.x 取消了这种奇葩的写法,直接调用构造函数抛出对象即可。
在 2.x 时代,异常在代码中除了表示程序错误,还经常做一些普通控制结构应该做的事情,在 3.x 中可以看出,设计者让异常变的更加专一,只有在错误发生的情况才能去用异常捕获语句来处理。
5 xrange
在 Python 2 中 xrange() 创建迭代对象的用法是非常流行的。比如: for 循环或者是列表/集合/字典推导式。
这个表现十分像生成器(比如。"惰性求值")。但是这个 xrange-iterable 是无穷的,意味着你可以无限遍历。
由于它的惰性求值,如果你不得仅仅不遍历它一次,xrange() 函数 比 range() 更快(比如 for 循环)。尽管如此,对比迭代一次,不建议你重复迭代多次,因为生成器每次都从头开始。
惰性求值:惰性求值,也就是延迟求值,表达式不会在它被绑定到变量之后就立即求值,而是等用到时再求值。
作用:这个特性可以解决一些巨大甚至无限的集合列表,延迟求值的一个好处是能够建立可计算的无限列表,而没有妨碍计算的无限循环或大小问题。
Python 中的很多方法没有直接返回列表,而是返回了一个可迭代的 generator (生成器)对象,这便是 python 的惰性求值。
在 Python 3 中,range() 是像 xrange() 那样实现以至于一个专门的 xrange() 函数都不再存在(在 Python 3 中 xrange() 会抛出命名异常)。
import timeit
n = 10000
def test_range(n):
return for i in range(n):
pass
def test_xrange(n):
for i in xrange(n):
pass
复制代码
Python 2
print 'Python', python_version()
print '\ntiming range()'
%timeit test_range(n)
print '\n\ntiming xrange()'
%timeit test_xrange(n)
Python 2.7.6
timing range()
1000 loops, best of 3: 433 µs per loop
timing xrange()
1000 loops, best of 3: 350 µs per loop
复制代码
Python 3
print('Python', python_version())
print('\ntiming range()')
%timeit test_range(n)
Python 3.4.1
timing range()
1000 loops, best of 3: 520 µs per loop
复制代码
print(xrange(10))
---------------------------------------------------------------------------
NameError Traceback (most recent call last)
in ()
----> 1 print(xrange(10))
NameError: name 'xrange' is not defined
复制代码
6 八进制字面量表示
八进制数必须写成 0o777,原来的形式 0777 不能用了;二进制必须写成 0b111。
新增了一个 bin() 函数用于将一个整数转换成二进制字串。 Python 2.6 已经支持这两种语法。
在 Python 3.x 中,表示八进制字面量的方式只有一种,就是 0o1000。
pyhon 2.x
>>> 0o1000
512
>>> 01000
512
复制代码
python 3.x
>>> 01000
File "" , line 1
01000
^
SyntaxError: invalid token
>>> 0o1000
512
复制代码
7 不等运算符
Python 2.x 中不等于有两种写法 != 和 <>
Python 3.x 中去掉了 <>,只有 != 一种写法。
8 去掉了 repr 表达式 ``
Python 2.x 中反引号 相当于 repr 函数的作用 Python 3.x 中去掉了
这种写法,只允许使用 repr 函数。
repr 是什么:repr() 函数将对象转化为供解释器读取的形式,返回一个对象的 string 格式。
9 多个模块被改名(根据 PEP8)
httplib, BaseHTTPServer, CGIHTTPServer, SimpleHTTPServer, Cookie, cookielib 被合并到 http 包内。StringIO 模块现在被合并到新的 io 模组内。 new, md5, gopherlib 等模块被删除。 Python 2.6 已经支援新的 io 模组。
取消了 exec 语句,只剩下 exec() 函数。 Python 2.6 已经支援 exec() 函数。
10 数据类型
1)Py3.X 去除了 long 类型,现在只有一种整型——int,但它的行为就像 2.X 版本的 long。
2)新增了 bytes 类型,对应于 2.x 版本的八位串,定义一个 bytes 字面量的方法如下:
>>> b = b'china'
>>> type(b)
<type 'bytes'>
复制代码
str 对象和 bytes 对象可以使用 .encode() (str -> bytes) or .decode() (bytes -> str) 方法相互转化。
>>> s = b.decode()
>>> s
'china'
>>> b1 = s.encode()
>>> b1
b'china'
复制代码
3)dict 的 .keys()、.items 和 .values() 方法返回迭代器,而之前的 iterkeys() 等函数都被废弃。同时去掉的还有 dict.has_key(),用 in 替代它。
11 打开文件
原先有两种打开方式:
file( ..... )
或
open(.....)
复制代码
现在改成只能用
open(......)
复制代码
12 从键盘录入一个字符串
raw_input("提示信息")
复制代码
现在:
input("提示信息")
复制代码
在 python2.x 中 raw_input() 和 input( ),两个函数都存在,其中区别为:
raw_input():将所有输入作为字符串看待,返回字符串类型
input():只能接收"数字"的输入,在对待纯数字输入时具有自己的特性,它返回所输入的数字的类型(int, float )
在 python3.x 中 raw_input() 和 input( ) 进行了整合,去除了 raw_input(),仅保留了 input() 函数,其接收任意任性输入,将所有输入默认为字符串处理,并返回字符串类型。
本文首发于公众号「痴海」,后台回复「1024」,领取最新 Python 教程。