Python算法的分享(一)

Python

Python是一门现代、易学、面向对象的编程语言。它拥有强大的內建数据类型以及简单易用的控制语句。由于Python是一门解释型语言,因此只需要查看和描述交互式会话就能进行学习。你应该记得,解释器会显示提示符>>>,然后计算你提供的Python语句。例如,以下代码显示了提示符、print函数、结果,以及下一个提示符。

>>> print("Algorithms and Data Structures")
>>> Algorithms and Data Structures
>>>

数据

前面提到,Python支持面向对象编程范式。这意味着Python认为数据是问题解决过程中的关键点。在Python以及其他所有面向对象编程语言中,类都是对数据的构成(状态)以及数据能做什么(行为)的描述。由于类的使用者只能看到数据项的状态和行为,因此类与抽象数据类型是相似的。在面向对象编程范式中,数据项被称作对象。一个对象就是类的一个实例。

1内建原子数据类型

我们首先复习原子数据类型。Python有两大內建数据类实现了整数类型和浮点数类型,相应的Python类就是int和float。标准的数学运算符,即+、-、*、/以及**(幂),可以和能够改变运算优先级的括号一起使用。其他非常有用的运算符包括取余(取模)运算符%,以及整除运算符//。注意,当两个整数相除时,其结果是一个浮点数,而整除运算符截去小数部分,只返回商的整数部分。

>>> 2+3*4
14
>>> (2+3)*4
20
>>> 2**10
1024
>>> 6/3
2.0
>>> 7/3
2.3333333333333335
>>> 7//3
2
>>> 7%3
1
>>> 3/6
0.5
>>> 3//6
0
>>> 3%6
3
>>> 2**100
1267650600228229401496703205376
>>>

Python通过bool类实现对表达真值非常有用的布尔数据类型。布尔对象可能的状态值是True或者False,布尔运算符有and、or以及not。

>>> True
True
>>> False
False
>>> False or True
True
>>> not (False or True)
False
>>> True and True
True

布尔对象也被用作相等(==)、大于(>)等比较运算符的计算结果。此外,结合使用关系运算符与逻辑运算符可以表达复杂的逻辑问题。表展示了关系运算符和逻辑运算符。

关系运算符和逻辑运算符

Python算法的分享(一)_第1张图片

>>> 5 == 10
False
>>> 10 > 5
True
>>> (5 >= 1) and (5 <= 10)
True

标识符在编程语言中被用作名字。Python中的标识符以字母或者下划线(_)开头,区分大小写,可以是任意长度。需要记住的一点是,采用能表达含义的名字是良好的编程习惯,这使程序代码更易阅读和理解。

当一个名字第一次出现在赋值语句的左边部分时,会创建对应的Python变量。赋值语句将名字与值关联起来。变量存的是指向数据的引用,而不是数据本身。来看看下面的代码。

>>> theSum = 0
>>> theSum
0
>>> theSum = theSum + 1
>>> theSum
1
>>> theSum = True
>>> theSum
True

赋值语句theSum = 0会创建变量theSum,并且令其保存指向数据对象0的引用(如图1-3所示)。Python会先计算赋值运算符右边的表达式,然后将指向该结果数据对象的引用赋给左边的变量名。在本例中,由于theSum当前指向的数据是整数类型,因此该变量类型为整型。如果数据的类型发生改变(如图1-4所示),正如上面的代码给theSum赋值True,那么变量的类型也会变成布尔类型。赋值语句改变了变量的引用,这体现了Python的动态特性。同样的变量可以指向许多不同类型的数据。

变量指向数据对象的引用

Python算法的分享(一)_第2张图片

赋值语句改变变量的引用

Python算法的分享(一)_第3张图片

2内建集合数据类型

除了数值类和布尔类,Python还有众多强大的內建集合类。列表、字符串以及元组是概念上非常相似的有序集合,但是只有理解它们的差别,才能正确运用。集(set)和字典是无序集合。

列表是零个或多个指向Python数据对象的引用的有序集合,通过在方括号内以逗号分隔的一系列值来表达。空列表就是[]。列表是异构的,这意味着其指向的数据对象不需要都是同一个类,并且这一集合可以被赋值给一个变量。下面的代码段展示了列表含有多个不同的Python数据对象。

>>> [1,3,True,6.5]
[1, 3, True, 6.5]
>>> myList = [1,3,True,6.5]
>>> myList
[1, 3, True, 6.5]

注意,当Python计算一个列表时,这个列表自己会被返回。然而,为了记住该列表以便后续处理,其引用需要被赋给一个变量。

由于列表是有序的,因此它支持一系列可应用于任意Python序列的运算,如表1-2所示。

可应用于任意Python序列的运算

Python算法的分享(一)_第4张图片

需要注意的是,列表和序列的下标从0开始。myList[1:3]会返回一个包含下标从1到2的元素列表(并没有包含下标为3的元素)。

如果需要快速初始化列表,可以通过重复运算来实现,如下所示。

>>> myList = [0] * 6
>>> myList
[0, 0, 0, 0, 0, 0]

非常重要的一点是,重复运算返回的结果是序列中指向数据对象的引用的重复。下面的例子可以很好地说明这一点。

>>> myList = [1,2,3,4]
>>> A = [myList]*3
>>> A
[[1, 2, 3, 4], [1, 2, 3, 4], [1, 2, 3, 4]]
>>> myList[2] = 45
>>> A
[[1, 2, 45, 4], [1, 2, 45, 4], [1, 2, 45, 4]]
>>>

变量A包含3个指向myList的引用。myList中的一个元素发生改变,A中的3处都随即改变。

列表支持一些用于构建数据结构的方法,如表所示。后面的例子展示了用法。

Python列表提供的方法

Python算法的分享(一)_第5张图片

>>> myList
[1024, 3, True, 6.5]
>>> myList.append(False)
>>> myList
[1024, 3, True, 6.5, False]
>>> myList.insert(2,4.5)
>>> myList
[1024, 3, 4.5, True, 6.5, False]
>>> myList.pop()
False
>>> myList
[1024, 3, 4.5, True, 6.5]
>>> myList.pop(1)
3
>>> myList
[1024, 4.5, True, 6.5]
>>> myList.pop(2)
True
>>> myList
[1024, 4.5, 6.5]
>>> myList.sort()
>>> myList
[4.5, 6.5, 1024]
>>> myList.reverse()
>>> myList
[1024, 6.5, 4.5]
>>> myList.count(6.5)
1
>>> myList.index(4.5)
2
>>> myList.remove(6.5)
>>> myList
[1024, 4.5]
>>> del myList[0]
>>> myList
[4.5]

你会发现,像pop这样的方法在返回值的同时也会修改列表的内容,reverse等方法则仅修改列表而不返回任何值。pop默认返回并删除列表的最后一个元素,但是也可以用来返回并删除特定的元素。这些方法默认下标从0开始。你也会注意到那个熟悉的句点符号,它被用来调用某个对象的方法。myList.append(False)可以读作“请求myList调用其append方法并将False这一值传给它”。就连整数这类简单的数据对象都能通过这种方式调用方法。

>>> (54).__add__(21)
75
>>>

在上面的代码中,我们请求整数对象54执行其add方法(该方法在Python中被称为__add__),并且将21作为要加的值传给它。其结果是两数之和,即75。我们通常会将其写作54+21。稍后会更多地讨论这些方法。

range是一个常见的Python函数,我们常把它与列表放在一起讨论。range会生成一个代表值序列的范围对象。使用list函数,能够以列表形式看到范围对象的值。下面的代码展示了这一点。

>>> range(10)
range(0, 10)
>>> list(range(10))
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> range(5,10)
range(5, 10)
>>> list(range(5,10))
[5, 6, 7, 8, 9]
>>> list(range(5,10,2))
[5, 7, 9]
>>> list(range(10,1,-1))
[10, 9, 8, 7, 6, 5, 4, 3, 2]
>>>

范围对象表示整数序列。默认情况下,它从0开始。如果提供更多的参数,它可以在特定的点开始和结束,并且跳过中间的值。在第一个例子中,range(10)从0开始并且一直到9为止(不包含10);在第二个例子中,range(5,10)从5开始并且到9为止(不包含10);range(5,10,2)的结果类似,但是元素的间隔变成了2(10还是没有包含在其中)。

字符串是零个或多个字母、数字和其他符号的有序集合。这些字母、数字和其他符号被称为字符。常量字符串值通过引号(单引号或者双引号均可)与标识符进行区分。

>>> "David"
'David'
>>> myName = "David"
>>> myName[3]
'i'
>>> myName*2
'DavidDavid'
>>> len(myName)
5
>>>

由于字符串是序列,因此之前提到的所有序列运算符都能用于字符串。此外,字符串还有一些特有的方法,列举了其中一些。

Python字符串提供的方法

Python算法的分享(一)_第6张图片

>>> myName
'David'
>>> myName.upper()
'DAVID'
>>> myName.center(10)
'  David   '
>>> myName.find('v')
2
>>> myName.split('v')
['Da', 'id']

split在处理数据的时候非常有用。split接受一个字符串,并且返回一个由分隔字符作为分割点的字符串列表。在本例中,v就是分割点。如果没有提供分隔字符,那么split方法将会寻找如制表符、换行符和空格等空白字符。

列表和字符串的主要区别在于,列表能够被修改,字符串则不能。列表的这一特性被称为可修改性。列表具有可修改性,字符串则不具有。例如,可以通过使用下标和赋值操作来修改列表中的一个元素,但是字符串不允许这一改动。

>>> myList
[1, 3, True, 6.5]
>>> myList[0]=2**10
>>> myList
[1024, 3, True, 6.5]
>>>
>>> myName
'David'
>>> myName[0]='X'

Traceback (most recent call last):
  File "", line 1, in -toplevel-
    myName[0]='X'
TypeError: object doesn't support item assignment
>>>

由于都是异构数据序列,因此元组与列表非常相似。它们的区别在于,元组和字符串一样是不可修改的。元组通常写成由括号包含并且以逗号分隔的一系列值。与序列一样,元组允许之前描述的任一操作。

>>> myTuple = (2,True,4.96)
>>> myTuple
(2, True, 4.96)
>>> len(myTuple)
3
>>> myTuple[0]
2
>>> myTuple * 3
(2, True, 4.96, 2, True, 4.96, 2, True, 4.96)
>>> myTuple[0:2]
(2, True)
>>>

然而,如果尝试改变元组中的一个元素,就会遇到错误。请注意,错误消息指明了问题的出处及原因。

>>> myTuple[1]=False
Traceback (most recent call last):
  File "", line 1, in -toplevel-
    myTuple[1]=False
TypeError: object doesn't support item assignment
>>>

集(set)是由零个或多个不可修改的Python数据对象组成的无序集合。集不允许重复元素,并且写成由花括号包含、以逗号分隔的一系列值。空集由set()来表示。集是异构的,并且可以通过下面的方法赋给变量。

>>> {
     3, 6, "cat", 4.5, False}
{
     False, 4.5, 3, 6, 'cat'}
>>> mySet = {
     3, 6, "cat", 4.5, False}
>>> mySet
{
     False, 4.5, 3, 6, 'cat'}
>>>

尽管集是无序的,但它还是支持之前提到的一些运算,如下所示。

Python集支持的运算

Python算法的分享(一)_第7张图片

>>> mySet
{
     False, 4.5, 3, 6, 'cat'}
>>> len(mySet)
5
>>> False in mySet
True
>>> "dog" in mySet
False
>>>

集支持一系列方法,如表1-6所示。在数学中运用过集合概念的人应该对它们非常熟悉。注意,union、intersection、issubset和difference都有可用的运算符。

Python集提供的方法

Python算法的分享(一)_第8张图片

>>> mySet
{
     False, 4.5, 3, 6, 'cat'}
>>> yourSet = {
     99,3,100}
>>> mySet.union(yourSet)
{
     False, 4.5, 3, 100, 6, 'cat', 99}
>>> mySet | yourSet
{
     False, 4.5, 3, 100, 6, 'cat', 99}
>>> mySet.intersection(yourSet)
{
     3}
>>> mySet & yourSet
{
     3}
>>> mySet.difference(yourSet)
{
     False, 4.5, 6, 'cat'}
>>> mySet - yourSet
{
     False, 4.5, 6, 'cat'}
>>> {
     3,100}.issubset(yourSet)
True
>>> {
     3,100}<=yourSet
True
>>> mySet.add("house")
>>> mySet
{
     False, 4.5, 3, 6, 'house', 'cat'}
>>> mySet.remove(4.5)
>>> mySet
{
     False, 3, 6, 'house', 'cat'}
>>> mySet.pop()
False
>>> mySet
{
     3, 6, 'house', 'cat'}
>>> mySet.clear()
>>> mySet
set()
>>>

最后要介绍的Python集合是字典。字典是无序结构,由相关的元素对构成,其中每对元素都由一个键和一个值组成。这种键–值对通常写成键:值的形式。字典由花括号包含的一系列以逗号分隔的键–值对表达,如下所示。

>>> capitals = {
     'Iowa':'DesMoines','Wisconsin':'Madison'}
>>> capitals
{
     'Wisconsin':'Madison', 'Iowa':'DesMoines'}
>>>

可以通过键访问其对应的值,也可以向字典添加新的键–值对。访问字典的语法与访问序列的语法十分相似,只不过是使用键来访问,而不是下标。添加新值也类似。

>>> capitals['Iowa']
'DesMoines'
>>> capitals['Utah']='SaltLakeCity'
>>> capitals
{
     'Utah':'SaltLakeCity', 'Wisconsin':'Madison', 'Iowa':'DesMoines'}
>>> capitals['California']='Sacramento'
>>> capitals
{
     'Utah':'SaltLakeCity', 'Wisconsin':'Madison', 'Iowa':'DesMoines', 'California':'Sacramento'}
>>> len(capitals)
4
>>>

需要谨记,字典并不是根据键来进行有序维护的。第一个添加的键–值对(‘Utah’:‘SaltLakeCity’)被放在了字典的第一位,第二个添加的键–值对(‘California’:‘Sacramento’)则被放在了最后。键的位置是由散列来决定的,第5章会详细介绍散列。以上示例也说明,len函数对字典的功能与对其他集合的功能相同。

字典既有运算符,又有方法。表1-7和表1-8分别展示了它们。keys、values和items方法均会返回包含相应值的对象。可以使用list函数将字典转换成列表。在表1-8中可以看到,get方法有两种版本。如果键没有出现在字典中,get会返回None。然而,第二个可选参数可以返回特定值。

Python字典支持的运算

Python算法的分享(一)_第9张图片

Python字典提供的方法

Python算法的分享(一)_第10张图片

>>> phoneext={
     'david':1410, 'brad':1137}
>>> phoneext
{
     'brad':1137, 'david':1410}
>>> phoneext.keys()
dict_keys(['brad', 'david'])
>>> list(phoneext.keys())
['brad', 'david']
>>> phoneext.values()
dict_values([1137, 1410])
>>> list(phoneext.values())
[1137, 1410]
>>> phoneext.items()
dict_items([('brad', 1137), ('david', 1410)])
>>> list(phoneext.items())
[('brad', 1137), ('david', 1410)]
>>> phoneext.get("kent")
>>> phoneext.get("kent", "NO ENTRY")
'NO ENTRY'
>>>

推荐参考书籍:

Python算法的分享(一)_第11张图片

你可能感兴趣的:(Python数据分析,人工智能,Python库,python算法)