To_be_brave1

Python数据分析四剑客：IPython、Numpy、pandas、Matplotlib

转http://python.jobbole.com/87465/

5.1 Python简介

本章将介绍Python的最基本语法，以及一些和深度学习还有计算机视觉最相关的基本使用。

5.1.1 Python简史

Python是一门解释型的高级编程语言，特点是简单明确。Python作者是荷兰人Guido van Rossum，1982年他获得数学和计算机硕士学位后，在荷兰数学与计算科学研究所（Centrum Wiskunde & Informatica, CWI）谋了份差事。在CWI期间，Guido参与到了一门叫做ABC的语言开发工作中。ABC是一门教学语言，所以拥有简单，可读性好，语法更接近自然语言等特点。在那个C语言一统天下的年代，ABC就是一股简单的清流，毕竟是门教学语言，最后没有流行起来，不过这段经历影响了Guido。1989年的圣诞假期，闲得蛋疼的Guido决定设计一门简单易用的新语言，要介于C和Shell之间，同时吸取ABC语法中的优点。Guido用自己喜欢的一部喜剧电视剧来命名这门语言：《Monty Python‘s Flying Circus》。

1991年，第一版基于C实现的Python编译器诞生，因为简单，拓展性好，Python很快就在Guido的同事中大受欢迎，不久Python的核心开发人员就从Guido一人变成了一个小团队。后来随着互联网时代的到来，开源及社区合作的方式蓬勃发展，Python也借此上了发展的快车道。因为Python非常容易拓展，在不同领域的开发者贡献下，许多受欢迎的功能和特征被开发出来，渐渐形成了各种各样的库，其中一部分被加入到Python的标准库中，这让本来就不需要过多思考底层细节的Python变得更加强大好用。在不过多考虑执行效率的前提下，使用Python进行开发的周期相比传统的C/C++甚至Java等语言都大大缩短，代码量也大幅降低，所以出bug的可能性也小了很多。因此有了语言专家Bruce Eckel的那句名言：Life is short, you need Python. 后来这句话的中文版“人生苦短，我用Python”被Guido印在了T恤上。发展至今，Python渐渐成了最流行的语言之一，在编程语言排行榜TOBIE中常年占据前5的位置。另外随着Python的用户群越来越壮大，慢慢在本身特点上发展出了自己的哲学，叫做Python的禅（The Zen of Python）。遵循Python哲学的做法叫做很Python（Pythonic），具体参见：

PEP 20 — The Zen of Python

或者在Python中执行：

Python
 
           1 
         
        >>   import   this

Python拥有很好的扩充性，可以非常轻松地用其他语言编写模块供调用，用Python编写的模块也可以通过各种方式轻松被其他语言调用。所以一种常见的Python使用方式是，底层复杂且对效率要求高的模块用C/C++等语言实现，顶层调用的API用Python封装，这样可以通过简单的语法实现顶层逻辑，故而Python又被称为“胶水语言”。这种特性的好处是，无需花费很多时间在编程实现上，更多的时间可以专注于思考问题的逻辑。尤其是对做算法和深度学习的从业人员，这种方式是非常理想的，所以如今的深度学习框架中，除了MATLAB，或是Deeplearning4j这种摆明了给Java用的，其他框架基本上要么官方接口就是Python，要么支持Python接口。

5.1.2 安装和使用Python

Python有两个大版本，考虑到用户群数量和库的各种框架的兼容性，本文以Python2（2.7）为准，语法尽量考虑和Python3的兼容。

Unix/Linux下的Python基本都是系统自带的，一般默认为Python2，使用时在终端直接键入python就能进入Python解释器界面：

在解释器下就已经可以进行最基本的编程了，比如：

写程序的话还是需要保存成文件再执行，比如我们写下面语句，并且保存为helloworld.py：

print(“Hello world!”)

然后在终端里执行：

安装更多的python库一般有两种方法，第一是用系统的软件包管理，以Ubuntu 16.04 LTS为例，比如想要安装numpy库（后面会介绍这个库），软件包的名字就是python-numpy，所以在终端中输入：

>> sudo apt install python-numpy

Python自己也带了包管理器，叫做pip，使用如下：

>> pip install numpy

安装和深度学习相关的框架时，一般来说推荐使用系统自带的包管理，出现版本错误的可能性低一些。另外也可以使用一些提前配置好很多第三方库的Python包，这些包通常已经包含了深度学习框架中绝大多数的依赖库，比如最常用的是Anaconda：

Download Anaconda Now!

Windows下的Python安装简单一些，从官方网站下载相应的安装程序就可以了，当然也有更方便的已经包含了很全的第三方库的选择，WinPython：

WinPython

并且是绿色的，直接执行就可以用了。

5.2 Python基本语法

There should be one– and preferably only one –obvious way to do it.

对于一个特定的问题，应该只用最好的一种方法来解决。

— Tim Peters

5.2.1 基本数据类型和运算

基本数据类型

Python中最基本的数据类型包括整型，浮点数，布尔值和字符串。类型是不需要声明的，比如：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
        a   =   1         # 整数 
         
 b   =   1.2       # 浮点数 
         
 c   =   True      # 布尔类型 
         
 d   =   "False"   # 字符串 
         
 e   =   None      # NoneType

其中#是行内注释的意思。最后一个None是NoneType，注意不是0，在Python中利用type函数可以查看一个变量的类型：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
        type ( a )       #  
         
 type ( b )       #  
         
 type ( c )       #  
         
 type ( d )       #  
         
 type ( e )       #

注释中是执行type()函数后的输出结果，可以看到None是单独的一种类型NoneType。在很多API中，如果执行失败就会返回None。

变量和引用

Python中基本变量的赋值一般建立的是个引用，比如下面的语句：

a赋值为1后，b=a执行时并不会将a的值复制一遍，然后赋给b，而是简单地为a所指的值，也就是1建立了一个引用，相当于a和b都是指向包含1这个值的这块内存的指针。所以c=1执行的也是个引用建立，这三个变量其实是三个引用，指向同一个值。这个逻辑虽然简单，不过也还是常常容易弄混，这没关系，Python内置了id函数，可以返回一个对象的地址，用id函数可以让我们知道每个变量指向的是不是同一个值：

Python
 
           1 
         
           2 
         
           3 
         
        id ( a )     # 35556792L 
         
 id ( b )     # 35556792L 
         
 id ( c )     # 35556792L

注释中表示的仍是执行后的结果。如果这时候我们接下面两个语句：

Python
 
           1 
         
           2 
         
        b   =   2     # b的引用到新的一个变量上 
         
 id ( b )     # 35556768L

可以看到b引用到了另一个变量上。

运算符

Python中的数值的基本运算和C差不多，字符串的运算更方便，下面是常见的例子：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
        a   =   2 
         
 b   =   2.3           
         
 c   =   3 
         
 a   +   b             # 2 + 2.3 = 4.3 
         
 c  –   a             # 3 - 2 = 1 
         
 a   /   b             # 整数除以浮点数，运算以浮点数为准，2 / 2.3 = 0.8695652173913044 
         
 a   /   c             # Python2中，整数除法，向下取整 2 / 3 = 0 
         
 a   * *   c            # a的c次方，结果为8 
         
 a   +=   1            # Python中没有i++的用法，自增用+= 
         
 c   -=   3            # c变成0了 
         
 d   =   'Hello'       
         
 d   +   ' world!'     # 相当于字符串拼接，结果为'Hello world!' 
         
 d   +=   ' "world"!' # 相当于把字符串接在当前字符串尾，d变为'Hello "world"!' 
         
 e   =   r '\n\t\\'     
         
 print ( e )          # '\\n\\t\\\\'

需要提一下的几点：1）字符串用双引号和单引号都可以，区别主要是单引号字符串中如果出现单引号字符则需要用转义符，双引号也是一样，所以在单引号字符串中使用双引号，或者双引号字符串中使用单引号就会比较方便。另外三个双引号或者三个单引号围起来的也是字符串，因为换行方便，更多用于文档。2）Python2中两个数值相除会根据数值类型判断是否整数除法，Python3种则都按照浮点数。想要在Python2种也执行Python3中的除法只要执行下面语句：

Python
 
           1 
         
           2 
         
        from   __future__   import   division       # 使用Python3中的除法 
         
 1   /   2

3）字符串前加r表示字符串内容严格按照输入的样子，好处是不用转义符了，非常方便。

Python中的布尔值和逻辑的运算非常直接，下面是例子：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
        a   =   True 
         
 b   =   False 
         
 a   and   b       # False 
         
 a   or   b        # True 
         
 not   a         # False

基本上就是英语，操作符优先级之类的和其他语言类似。Python中也有位操作：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
        ~ 8        # 按位翻转，1000 --> -(1000+1) 
         
 8   >>   3    # 右移3位，1000 --> 0001 
         
 1   <<   3    # 左移3位，0001 --> 1000 
         
 5   &   2     # 按位与，101 & 010 = 000 
         
 5   |   2     # 按位或，101 | 010 = 111 
         
 4   ^   1     # 按位异或，100 ^ 001 = 101

==, !=和is

判断是否相等或者不等的语法和C也一样，另外在Python中也常常见到is操作符，这两者的区别在于==和!=比较引用指向的内存中的内容，而is判断两个变量是否指向一个地址，看下面的代码例子：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
        a   =   1 
         
 b   =   1.0 
         
 c   =   1 
         
 a   ==   b    # True，值相等 
         
 a   is   b    # False，指向的不是一个对象，这个语句等效于 id(a) == id(b) 
         
 a   is   c    # True，指向的都是整型值1

所以一定要分清要比较的对象应该用那种方式，对于一些特殊的情况，比如None，本着Pythonic的原则，最好用is None。

注意关键字

Python中，万物皆对象。不过这并不是这里要探讨的话题，想说的是一定要注意关键字，因为所有东西都是对象，所以一个简简单单的赋值操作就可以把系统内置的函数给变成一个普通变量，来看下边例子：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
        id ( type )                              # 506070640L 
         
 type   =   1                              # type成了指向1的变量 
         
 id ( type )                              # 35556792L 
         
 id   =   2                                # id成了指向2的变量 
         
 from   __future__   import   print_function 
         
 print   =   3                             # print成了指向3的变量

注意print是个很特殊的存在，在Python3中是按照函数用，在Python2中却是个命令式的语句，最早print的用法其实是下边这样：

Python
 
           1 
         
        print   "Hello world!"

这么用主要是受到ABC语法的影响，但这个用法并不Pythonic，后来加入了print函数，为了兼容允许两种用法并存。所以单纯给print赋值是不灵的，在Python2中使用Python3中的一些特性都是用from __future__ import来实现。

模块导入

因为提到了对象名覆盖和import，所以简单讲一下。import是利用Python中各种强大库的基础，比如要计算cos(π)的值，可以有下面4种方式：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
        # 直接导入Python的内置基础数学库 
         
 import   math 
         
 print ( math . cos ( math . pi ) ) 
         
 # 从math中导入cos函数和pi变量 
         
 from   math   import   cos ,   pi 
         
 print ( cos ( pi ) ) 
         
 # 如果是个模块，在导入的时候可以起个别名，避免名字冲突或是方便懒得打字的人使用 
         
 import   math   as   m 
         
 print ( m . cos ( m . pi ) ) 
         
 # 从math中导入所有东西 
         
 from   math   import   * 
         
 print ( cos ( pi ) )

一般来说最后一种方式不是很推荐，因为不知道import导入的名字里是否和现有对象名已经有冲突，很可能会不知不觉覆盖了现有的对象。

5.2.2 容器

列表

Python中的容器是异常好用且异常有用的结构。这节主要介绍列表（list），元组（tuple），字典（dict）和集合（set）。这些结构和其他语言中的类似结构并无本质不同，来看例子了解下使用：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
        a   =   [ 1 ,   2 ,   3 ,   4 ] 
         
 b   =   [ 1 ] 
         
 c   =   [ 1 ] 
         
 d   =   b 
         
 e   =   [ 1 ,   "Hello world!" ,   c ,   False ] 
         
 print ( id ( b ) ,   id ( c ) )                   # (194100040L, 194100552L) 
         
 print ( id ( b ) ,   id ( d ) )                   # (194100040L, 194100040L) 
         
 print ( b   ==   c )                         # True 
         
 f   =   list ( "abcd" ) 
         
 print ( f )                              # ['a', 'b', 'c', 'd'] 
         
 g   =   [ 0 ] * 3   +   [ 1 ] * 4   +   [ 2 ] * 2       # [0, 0, 0, 1, 1, 1, 1, 2, 2]

因为变量其实是个引用，所以对列表而言也没什么不同，所以列表对类型没什么限制。也正因为如此，和变量不同的是，即使用相同的语句赋值，列表的地址也是不同的，在这个例子中体现在id(b)和id(c)不相等，而内容相等。列表也可以用list()初始化，输入参数需要是一个可以遍历的结构，其中每一个元素会作为列表的一项。“*”操作符对于列表而言是复制，最后一个语句用这种办法生成了分段的列表。

列表的基本操作有访问，增加，删除，和拼接：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
        a . pop ( )               # 把最后一个值4从列表中移除并作为pop的返回值 
         
 a . append ( 5 )           # 末尾插入值，[1, 2, 3, 5] 
         
 a . index ( 2 )            # 找到第一个2所在的位置，也就是1 
         
 a [ 2 ]                  # 取下标，也就是位置在2的值，也就是第三个值3 
         
 a   +=   [ 4 ,   3 ,   2 ]        # 拼接，[1, 2, 3, 5, 4, 3, 2] 
         
 a . insert ( 1 ,   0 )        # 在下标为1处插入元素0，[1, 0, 2, 3, 5, 4, 3, 2] 
         
 a . remove ( 2 )           # 移除第一个2，[1, 0, 3, 5, 4, 3, 2] 
         
 a . reverse ( )           # 倒序，a变为[2, 3, 4, 5, 3, 0, 1] 
         
 a [ 3 ]   =   9              # 指定下标处赋值，[2, 3, 4, 9, 3, 0, 1] 
         
 b   =   a [ 2 : 5 ]            # 取下标2开始到5之前的子序列，[4, 9, 3] 
         
 c   =   a [ 2 : - 2 ]           # 下标也可以倒着数，方便算不过来的人，[4, 9, 3] 
         
 d   =   a [ 2 : ]             # 取下标2开始到结尾的子序列，[4, 9, 3, 0, 1] 
         
 e   =   a [ : 5 ]             # 取开始到下标5之前的子序列，[2, 3, 4, 9, 3] 
         
 f   =   a [ : ]              # 取从开头到最后的整个子序列，相当于值拷贝，[2, 3, 4, 9, 3, 0, 1] 
         
 a [ 2 : - 2 ]   =   [ 1 ,   2 ,   3 ]   # 赋值也可以按照一段来，[2, 3, 1, 2, 3, 0, 1] 
         
 g   =   a [ :: - 1 ]       # 也是倒序，通过slicing实现并赋值，效率略低于reverse() 
         
 a . sort ( ) 
         
 print ( a )              # 列表内排序，a变为[0, 1, 1, 2, 2, 3, 3]

因为列表是有顺序的，所以和顺序相关的操作是列表中最常见的，首先我们来打乱一个列表的顺序，然后再对这个列表排序：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
        import   random 
         
 a   =   range ( 10 )                   # 生成一个列表，从0开始+1递增到9 
         
 print ( a )                         # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 
         
 random . shuffle ( a )               # shuffle函数可以对可遍历且可变结构打乱顺序 
         
 print ( a )                         # [4, 3, 8, 9, 0, 6, 2, 7, 5, 1] 
         
 b   =   sorted ( a )                 
         
 print ( b )                         # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 
         
 c   =   sorted ( a ,   reverse = True ) 
         
 print ( c )                         # [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

元组

元组和列表有很多相似的地方，最大的区别在于不可变，还有如果初始化只包含一个元素的tuple和列表不一样，因为语法必须明确，所以必须在元素后加上逗号。另外直接用逗号分隔多个元素赋值默认是个tuple，这在函数多返回值的时候很好用：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
        a   =   ( 1 ,   2 ) 
         
 b   =   tuple ( [ '3' ,   4 ] )   # 也可以从列表初始化 
         
 c   =   ( 5 , ) 
         
 print ( c )              # (5,) 
         
 d   =   ( 6 ) 
         
 print ( d )              # 6 
         
 e   =   3 ,   4 ,   5 
         
 print ( e )              # (3, 4, 5)

集合

集合是一种很有用的数学操作，比如列表去重，或是理清两组数据之间的关系，集合的操作符和位操作符有交集，注意不要弄混：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
        A   =   set ( [ 1 ,   2 ,   3 ,   4 ] ) 
         
 B   =   { 3 ,   4 ,   5 ,   6 } 
         
 C   =   set ( [ 1 ,   1 ,   2 ,   2 ,   2 ,   3 ,   3 ,   3 ,   3 ] ) 
         
 print ( C )          # 集合的去重效果，set([1, 2, 3]) 
         
 print ( A   |   B )      # 求并集，set([1, 2, 3, 4, 5, 6]) 
         
 print ( A   &   B )      # 求交集，set([3, 4]) 
         
 print ( A   -   B )      # 求差集，属于A但不属于B的，set([1, 2]) 
         
 print ( B   -   A )      # 求差集，属于B但不属于A的，set([5, 6]) 
         
 print ( A   ^   B )      # 求对称差集，相当于(A-B)|(B-A)，set([1, 2, 5, 6])

字典

字典是一种非常常见的“键-值”(key-value)映射结构，键无重复，一个键不能对应多个值，不过多个键可以指向一个值。还是通过例子来了解，构建一个名字->年龄的字典，并执行一些常见操作：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
        a   =   { 'Tom' :   8 ,   'Jerry' :   7 } 
         
 print ( a [ 'Tom' ] )               # 8 
         
 b   =   dict ( Tom = 8 ,   Jerry = 7 )      # 一种字符串作为键更方便的初始化方式 
         
 print ( b [ 'Tom' ] )               # 8 
         
 if   'Jerry'   in   a :              # 判断'Jerry'是否在keys里面 
         
      print ( a [ 'Jerry' ] )          # 7 
         
 print ( a . get ( 'Spike' ) )         # None，通过get获得值，即使键不存在也不会报异常 
         
 a [ 'Spike' ]   =   10 
         
 a [ 'Tyke' ]   =   3 
         
 a . update ( { 'Tuffy' :   2 ,   'Mammy Two Shoes' :   42 } ) 
         
 print ( a . values ( ) )     # dict_values([8, 2, 3, 7, 10, 42]) 
         
 print ( a . pop ( 'Mammy Two Shoes' ) )       # 移除'Mammy Two Shoes'的键值对，并返回42 
         
 print ( a . keys ( ) )       # dict_keys(['Tom', 'Tuffy', 'Tyke', 'Jerry', 'Spike'])

注意到初始化字典和集合很像，的确如此，集合就像是没有值只有键的字典。既然有了人名到年龄的映射，也许你立马想到是否可以给字典排序？在Python3.6之前，这个问题是错误的，字典是一种映射关系，没有顺序。当然了，如果要把(键, 值)的这种对进行排序，是没有问题的，前提是先把字典转化成可排序的结构，items()或者iteritems()可以做到这件事，接上段代码继续：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
        b   =   a . items ( ) 
         
 print ( b )    # [('Tuffy', 2), ('Spike', 10), ('Tom', 8), ('Tyke', 3), ('Jerry', 7)] 
         
 from   operator   import   itemgetter 
         
 c   =   sorted ( a . items ( ) ,   key = itemgetter ( 1 ) ) 
         
 print ( c )    # [('Tuffy', 2), ('Tyke', 3), ('Jerry', 7), ('Tom', 8), ('Spike', 10)] 
         
 d   =   sorted ( a . iteritems ( ) ,   key = itemgetter ( 1 ) ) 
         
 print ( d )    # [('Tuffy', 2), ('Tyke', 3), ('Jerry', 7), ('Tom', 8), ('Spike', 10)] 
         
 e   =   sorted ( a ) 
         
 print ( e )    # 只对键排序，['Jerry', 'Spike', 'Tom', 'Tuffy', 'Tyke']

items()可以把字典中的键值对转化成一个列表，其中每个元素是一个tuple，tuple的第一个元素是键，第二个元素是值。变量c是按照值排序，所以需要一个操作符itemgetter，去位置为1的元素作为排序参考，如果直接对字典排序，则其实相当于只是对键排序。字典被当作一个普通的可遍历结构使用时，都相当于遍历字典的键。如果觉得字典没有顺序不方便，可以考虑使用OrderedDict，使用方式如下：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
        from   collections   import   OrderedDict 
         
 a   =   { 1 :   2 ,   3 :   4 ,   5 :   6 ,   7 :   8 ,   9 :   10 } 
         
 b   =   OrderedDict ( { 1 :   2 ,   3 :   4 ,   5 :   6 ,   7 :   8 ,   9 :   10 } ) 
         
 print ( a )      # {1: 2, 3: 4, 9: 10, 5: 6, 7: 8} 
         
 print ( b )      # OrderedDict([(1, 2), (3, 4), (9, 10), (5, 6), (7, 8)])

这样初始化时的顺序就保留了，除了有序的特性以外，用法上和字典没有区别。2016年9月，Guido宣布在Python3.6中，字典将默认有序，这样就不用纠结了。另外需要注意的一点是字典是通过哈希表实现的，所以键必须是可哈希的， list不能被哈希，所以也不能作为字典的键，而tuple就可以。

因为上上段代码中用到了iteritems()，所以这里顺带提一下迭代器（iterator），迭代器相当于一个函数，每次调用都返回下一个元素，从遍历的角度来看就和列表没有区别了。iteritems()就是一个迭代器，所以效果一样，区别是迭代器占用更少内存，因为不需要一上来就生成整个列表。一般来说，如果只需要遍历一次，用迭代器是更好的选择，若是要多次频繁从一个可遍历结构中取值，且内存够，则直接生成整个列表会更好。当然，用迭代器生成一个完整列表并不麻烦，所以有个趋势是把迭代器作为默认的可遍历方式，比如前面我们使用过用来生成等差数列列表的range()，在Python2中对应的迭代器形式是xrange()。在Python3中，range()就不再产生一个列表了，而是作为迭代器，xrange()直接没了。

5.2.3 分支和循环

从这节开始，代码就未必适合在Python终端中输入了，选个顺手的编辑器或者IDE。作者良心推荐PyCharm，虽然慢，但好用，社区版免费：

PyCharm

for循环

上面提到的4种容器类型都是可遍历的，所以该讲讲用来遍历的for循环了。for循环的语法也是简单的英语：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
        a   =   [ 'This' ,   'is' ,   'a' ,   'list' ,   '!' ] 
         
 b   =   [ 'This' ,   'is' ,   'a' ,   'tuple' ,   '!' ] 
         
 c   =   { 'This' :   'is' ,   'an' :   'unordered' ,   'dict' :   '!' } 
         
 # 依次输出：'This', 'is', 'a', 'list', '!' 
         
 for   x   in   a : 
         
      print ( x ) 
         
 # 依次输出：'This', 'is', 'a', 'tuple', '!' 
         
 for   x   in   b : 
         
      print ( x ) 
         
 # 键的遍历。不依次输出：'This', 'dict', 'an' 
         
 for   key  in   c : 
         
      print ( key ) 
         
 # 依次输出0到9 
         
 for   i   in   range ( 10 ) : 
         
      print ( i )

注意到每个for循环中，print都有缩进，这是Python中一个让人爱恨交织的特点：强行缩进来表明成块的代码。这样做的好处是代码十分清晰工整，还有助于防止写出过长的函数或者过深的嵌套，坏处是有时候不知为什么tab和空格就一起出现了，又或是多重if-else不知怎得就没对齐，还是挺麻烦的。

回到for循环上，这种把每个元素拿出来的遍历方式叫做for_each风格，熟悉Java的话就不会陌生，C++11中也开始支持这种for循环方式。不过如果还是需要下标呢？比如遍历一个list的时候，希望把对应下标也打印出来，这时可以用enumerate：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
        names   =   [ "Rick" ,   "Daryl" ,   "Glenn" ] 
         
 # 依次输出下标和名字 
         
 for   i ,   name  in   enumerate ( names ) : 
         
      print ( i ,   name )

需要注意的是，通过取下标遍历当然是可行的，比如用len()函数获得列表长度，然后用range()/xrange()函数获得下标，但是并不推荐这样做：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
        words   =   [ "This" ,   "is" ,   "not" ,   "recommended" ] 
         
 # not pythonic :( 
         
 for   i   in   xrange ( len ( words ) ) : 
         
      print ( words [ i ] )

在使用for循环时，有时会遇到这样一种场景：我们需要对遍历的每个元素进行某种判断，如果符合这种判断的情况没有发生，则执行一个操作。举个例子某神秘部门要审核一个字符串列表，如果没有发现不和谐的字眼，则将内容放心通过，一种解决办法是下面这样：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
        wusuowei   =   [ "I" ,   "don't" ,   "give" ,   "a" ,   "shit" ]    # 无所谓 
         
 hexie   =   True                                      # 默认和谐社会 
         
 for   x   in   wusuowei : 
         
      if   x   ==   "f**k" : 
         
          print ( "What the f**k!" )                   # 发现了不该出现的东西，WTF！ 
         
          hexie   =   False                             # 不和谐了 
         
          break                                     # 赶紧停下！不能再唱了 
         
 if   hexie :                                         # 未发现不和谐元素！ 
         
      print ( "Harmonious society!" )                  # 和谐社会！

这样需要设置一个标记是否发现不和谐因素的状态变量hexie，循环结束后再根据这个变量判断内容是否可以放心通过。一种更简洁不过有些小众的做法是直接和else一起，如果for循环中的if块内的语句没有被触发，则通过else执行指定操作：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
        wusuowei   =   [ "I" ,   "don't" ,   "give" ,   "a" ,   "shit" ] 
         
 for   x   in   wusuowei : 
         
      if   x   ==   "f**k" : 
         
          print ( "What the f**k!" ) 
         
          hexie   =   False 
         
          break 
         
 else :                              # for循环中if内语句未被触发 
         
      print ( "Harmonious society!" )   # 和谐社会！

这样不需要一个标记是否和谐的状态变量，语句简洁了很多。

if和分支结构

上一个例子中已经出现if语句了，所以这部分讲讲if。Python的条件控制主要是三个关键字：if-elif-else，其中elif就是else if的意思。还是看例子：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
        pets   = [ 'dog' ,   'cat' ,   'droid' ,   'fly' ] 
         
 for   pet  in   pets : 
         
      if   pet   ==   'dog' :          # 狗粮 
         
          food   =   'steak'        # 牛排 
         
      elif   pet   ==   'cat' :        # 猫粮 
         
          food   =   'milk'         # 牛奶 
         
      elif   pet   ==   'droid' :      # 机器人 
         
          food   =   'oil'          # 机油 
         
      elif   pet   ==   'fly' :        # 苍蝇 
         
          food   =   'sh*t'         #  
         
      else : 
         
          pass 
         
      print ( food )

需要提一下的是pass，这就是个空语句，什么也不做，占位用。Python并没有switch-case的语法，等效的用法要么是像上面一样用if-elif-else的组合，要么可以考虑字典：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
        pets   =   [ 'dog' ,   'cat' ,   'droid' ,   'fly' ] 
         
 food_for_pet   =   { 
         
      'dog' :   'steak' ,   
         
      'cat' :   'milk' ,   
         
      'droid' :   'oil' ,   
         
      'fly' :   'sh*t' 
         
 } 
         
 for   pet  in   pets : 
         
      food   =   food_for_pet [ pet ]   if   pet  in   food_for_pet  else   None 
         
      print ( food )

这里还用到了一个if-else常见的行内应用，就是代替三元操作符，如果键在字典中，则food取字典的对应值，否则为None。

if表达式中的小技巧

通过链式比较让语句简洁：

Python
 
           1 
         
           2 
         
        if   - 1   <   x   <   1 :    # 相较于 if x > -1 and x < 1: 
         
      print ( 'The absolute value of x is < 1' )

判断一个值是不是等于多个可能性中的一个：

Python
 
           1 
         
           2 
         
        if   x   in   [ 'piano' ,   'violin' ,   'drum' ] :      # 相较于 if x == 'piano' or x == 'violin' or x =='drum': 
         
      print ( "It's an instrument!" )

Python中的对象都会关联一个真值，所以在if表达式中判断是否为False或者是否为空的时候，是无需写出明确的表达式的：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
        a   =   True 
         
 if   a :   # 判断是否为真，相较于 a is True 
         
      print ( 'a is True' ) 
         
 if   'sky' :   # 判断是否空字符串，相较于 len('sky') > 0 
         
      print ( 'birds' ) 
         
 if   '' :   # 判断是否空字符串，同上 
         
      print ( 'Nothing!' ) 
         
 if   { } :   # 判断是否空的容器(字典)，相较于len({}) > 0 
         
      print ( 'Nothing!' )

隐式表达式为False的是如下状况：

– None

– False

– 数值0

– 空的容器或序列（字符串也是一种序列）

– 用户自定义类中，如果定义了__len__()或者__nonzero__()，并且被调用后返回0或者False

while循环

while的就是循环和if的综合体，是一种单纯的基于条件的循环，本身没有遍历的意思，这是和for_each的本质差别，这种区别比起C/C++中要明确得多，用法如下：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
        i   =   0 
         
 while   i   <   100 :    # 笑100遍 
         
      print ( "ha" ) 
         
 while   True :       # 一直笑 
         
      print ( "ha" )

5.2.4 函数、生成器和类

还是从几个例子看起：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
           20 
         
           21 
         
           22 
         
           23 
         
           24 
         
           25 
         
           26 
         
           27 
         
           28 
         
           29 
         
           30 
         
           31 
         
           32 
         
           33 
         
           34 
         
           35 
         
           36 
         
           37 
         
           38 
         
           39 
         
           40 
         
           41 
         
        def   say_hello ( ) : 
         
      print ( 'Hello!' ) 
         
 def   greetings ( x = 'Good morning!' ) : 
         
      print ( x ) 
         
 say_hello ( )                   # Hello! 
         
 greetings ( )                   # Good morning! 
         
 greetings ( "What's up!" )       # What's up! 
         
 a   =   greetings ( )               # 返回值是None 
         
 def   create_a_list ( x ,   y = 2 ,   z = 3 ) :   # 默认参数项必须放后面 
         
      return   [ x ,   y ,   z ] 
         
 b   =   create_a_list ( 1 )           # [1, 2, 3] 
         
 c   =   create_a_list ( 3 ,   3 )       # [3, 3, 3] 
         
 d   =   create_a_list ( 6 ,   7 ,   8 )             # [6, 7, 8] 
         
 def   traverse_args ( * args ) : 
         
      for   arg  in   args : 
         
          print ( arg ) 
         
 traverse_args ( 1 ,   2 ,   3 )                # 依次打印1, 2, 3 
         
 traverse_args ( 'A' ,   'B' ,   'C' ,   'D' )     # 依次打印A, B, C, D 
         
 def   traverse_kargs ( * * kwargs ) : 
         
      for   k ,   v   in   kwargs . items ( ) : 
         
          print ( k ,   v ) 
         
 traverse_kargs ( x = 3 ,   y = 4 ,   z = 5 )         # 依次打印('x', 3), ('y', 4), ('z', 5) 
         
 traverse_kargs ( fighter1 = 'Fedor' ,   fighter2 = 'Randleman' ) 
         
 def   foo ( x ,   y ,   * args ,   * * kwargs ) : 
         
      print ( x ,   y ) 
         
      print ( args ) 
         
      print ( kwargs ) 
         
 # 第一个pring输出(1, 2) 
         
 # 第二个print输出(3, 4, 5) 
         
 # 第三个print输出{'a': 3, 'b': 'bar'} 
         
 foo ( 1 ,   2 ,   3 ,   4 ,   5 ,   a = 6 ,   b = 'bar' )

其实和很多语言差不多，括号里面定义参数，参数可以有默认值，且默认值不能在无默认值参数之前。Python中的返回值用return定义，如果没有定义返回值，默认返回值是None。参数的定义可以非常灵活，可以有定义好的固定参数，也可以有可变长的参数(args: arguments)和关键字参数(kargs: keyword arguments)。如果要把这些参数都混用，则固定参数在最前，关键字参数在最后。

Python中万物皆对象，所以一些情况下函数也可以当成一个变量似的使用。比如前面小节中提到的用字典代替switch-case的用法，有的时候我们要执行的不是通过条件判断得到对应的变量，而是执行某个动作，比如有个小机器人在坐标(0, 0)处，我们用不同的动作控制小机器人移动：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
        moves   =   [ 'up' ,   'left' ,   'down' ,   'right' ] 
         
 coord   =   [ 0 ,   0 ] 
         
 for   move  in   moves : 
         
      if   move   ==   'up' :          # 向上，纵坐标+1 
         
          coord [ 1 ]   +=   1 
         
      elif   move   ==   'down' :      # 向下，纵坐标-1 
         
          coord [ 1 ]   -=   1 
         
      elif   move   ==   'left' :      # 向左，横坐标-1 
         
          coord [ 0 ]   -=   1 
         
      elif   move   ==   'right' :     # 向右，横坐标+1 
         
          coord [ 0 ]   +=   1 
         
      else : 
         
          pass 
         
      print ( coord )

不同条件下对应的是对坐标这个列表中的值的操作，单纯的从字典取值就办不到了，所以就把函数作为字典的值，然后用这个得到的值执行相应动作：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
           20 
         
           21 
         
           22 
         
           23 
         
           24 
         
           25 
         
           26 
         
           27 
         
        moves   =   [ 'up' ,   'left' ,   'down' ,   'right' ] 
         
 def   move_up ( x ) :           # 定义向上的操作 
         
      x [ 1 ]   +=   1 
         
 def   move_down ( x ) :         # 定义向下的操作 
         
      x [ 1 ]   -=   1 
         
 def   move_left ( x ) :         # 定义向左的操作 
         
      x [ 0 ]   -=   1 
         
 def   move_right ( x ) :        # 定义向右的操作 
         
      x [ 0 ]   +=   1 
         
 # 动作和执行的函数关联起来，函数作为键对应的值 
         
 actions   =   { 
         
      'up' :   move_up , 
         
      'down' :   move_down , 
         
      'left' :   move_left , 
         
      'right' :   move _right 
         
 } 
         
 coord   =   [ 0 ,   0 ] 
         
 for   move  in   moves : 
         
      actions [ move ] ( coord ) 
         
      print ( coord )

把函数作为值取到后，直接加一括号就能使了，这样做之后起码在循环部分看上去很简洁。有点C里边函数指针的意思，只不过更简单。其实这种用法在之前讲排序的时候我们已经见过了，就是operator中的itemgetter。itemgetter(1)得到的是一个可调用对象(callable object)，和返回下标为1的元素的函数用起来是一样的：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
        def   get_val_at_pos_1 ( x ) : 
         
      return   x [ 1 ] 
         
 heros   =   [ 
         
      ( 'Superman' ,   99 ) , 
         
      ( 'Batman' ,   100 ) , 
         
      ( 'Joker' ,   85 ) 
         
 ] 
         
 sorted_pairs0   =   sorted ( heros ,   key = get_val_at_pos_1 ) 
         
 sorted_pairs1   =   sorted ( heros ,   key = lambda   x :   x [ 1 ] ) 
         
 print ( sorted_pairs0 ) 
         
 print ( sorted_pairs1 )

在这个例子中我们用到了一种特殊的函数：lambda表达式。Lambda表达式在Python中是一种匿名函数，lambda关键字后面跟输入参数，然后冒号后面是返回值（的表达式），比如上边例子中就是一个取下标1元素的函数。当然，还是那句话，万物皆对象，给lambda表达式取名字也是一点问题没有的：

Python
 
           1 
         
           2 
         
        some_ops   =   lambda   x ,   y :   x   +   y   +   x * y   +   x * * y 
         
 some_ops ( 2 ,   3 )    # 2 + 3 + 2*3 + 2^3 = 19

生成器（Generator）

生成器是迭代器的一种，形式上看和函数很像，只是把return换成了yield，在每次调用的时候，都会执行到yield并返回值，同时将当前状态保存，等待下次执行到yield再继续：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
        # 从10倒数到0 
         
 def   countdown ( x ) : 
         
      while   x   >=   0 : 
         
          yield   x 
         
          x   -=   1 
         
 for   i   in   countdown ( 10 ) : 
         
      print ( i ) 
         
 # 打印小于100的斐波那契数 
         
 def   fibonacci ( n ) : 
         
      a   =   0 
         
      b   =   1 
         
      while   b   <   n : 
         
          yield   b 
         
          a ,   b   =   b ,   a   +   b 
         
 for   x   in   fibonacci ( 100 ) : 
         
      print ( x )

生成器和所有可迭代结构一样，可以通过next()函数返回下一个值，如果迭代结束了则抛出StopIteration异常：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
        a   =   fibonacci ( 3 ) 
         
 print ( next ( a ) )    # 1 
         
 print ( next ( a ) )    # 1 
         
 print ( next ( a ) )    # 2 
         
 print ( next ( a ) )    # 抛出StopIteration异常

Python3.3以上可以允许yield和return同时使用，return的是异常的说明信息：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
        # Python3.3以上可以return返回异常的说明 
         
 def   another_fibonacci ( n ) : 
         
      a   =   0 
         
      b   =   1 
         
      while   b   <   n : 
         
          yield   b 
         
          a ,   b   =   b ,   a   +   b 
         
      return   "No more ..." 
         
 a   =   another_fibonacci ( 3 ) 
         
 print ( next ( a ) )    # 1 
         
 print ( next ( a ) )    # 1 
         
 print ( next ( a ) )    # 2 
         
 print ( next ( a ) )    # 抛出StopIteration异常并打印No more消息

类（Class）

Python中的类的概念和其他语言相比没什么不同，比较特殊的是protected和private在Python中是没有明确限制的，一个惯例是用单下划线开头的表示protected，用双下划线开头的表示private：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
           20 
         
           21 
         
           22 
         
           23 
         
           24 
         
           25 
         
           26 
         
           27 
         
        class   A : 
         
      """Class A""" 
         
      def   __init__ ( self ,   x ,   y ,   name ) : 
         
          self . x   =   x 
         
          self . y   =   y 
         
          self . _name   =   name 
         
      def   introduce ( self ) : 
         
          print ( self . _name ) 
         
      def   greeting ( self ) : 
         
          print ( "What's up!" ) 
         
      def   __l2norm ( self ) : 
         
          return   self . x * * 2   +   self . y * * 2 
         
      def   cal_l2norm ( self ) : 
         
          return   self . __l2norm ( ) 
         
 a   =   A ( 11 ,   11 ,   'Leonardo' ) 
         
 print ( A . __doc__ )           # "Class A" 
         
 a . introduce ( )             # "Leonardo" 
         
 a . greeting ( )               # "What's up!" 
         
 print ( a . _name )             # 可以正常访问 
         
 print ( a . cal_l2norm ( ) )     # 输出11*11+11*11=242 
         
 print ( a . _A__l2norm ( ) )     # 仍然可以访问，只是名字不一样 
         
 print ( a . __l2norm ( ) )       # 报错: 'A' object has no attribute '__l2norm'

类的初始化使用的是__init__(self,)，所有成员变量都是self的，所以以self.开头。可以看到，单下划线开头的变量是可以直接访问的，而双下划线开头的变量则触发了Python中一种叫做name mangling的机制，其实就是名字变了下，仍然可以通过前边加上“_类名”的方式访问。也就是说Python中变量的访问权限都是靠自觉的。类定义中紧跟着类名字下一行的字符串叫做docstring，可以写一些用于描述类的介绍，如果有定义则通过“类名.__doc__”访问。这种前后都加双下划线访问的是特殊的变量/方法，除了__doc__和__init__还有很多，这里就不展开讲了。

Python中的继承也非常简单，最基本的继承方式就是定义类的时候把父类往括号里一放就行了：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
        class   B ( A ) : 
         
      """Class B inheritenced from A""" 
         
      def   greeting ( self ) : 
         
          print ( "How's going!" ) 
         
 b   =   B ( 12 ,   12 ,   'Flaubert' ) 
         
 b . introduce ( )     # Flaubert 
         
 b . greeting ( )      # How's going! 
         
 print ( b . _name ( ) )          # Flaubert 
         
 print ( b . _A__l2norm ( ) )     # “私有”方法，必须通过_A__l2norm访问

5.2.5 map, reduce和filter

map可以用于对可遍历结构的每个元素执行同样的操作，批量操作：

Python
 
           1 
         
           2 
         
           3 
         
        map ( lambda   x :   x * * 2 ,   [ 1 ,   2 ,   3 ,   4 ] )                   # [1, 4, 9, 16] 
         
 map ( lambda   x ,   y :   x   +   y ,   [ 1 ,   2 ,   3 ] ,   [ 5 ,   6 ,   7 ] )     # [6, 8, 10]

reduce则是对可遍历结构的元素按顺序进行两个输入参数的操作，并且每次的结果保存作为下次操作的第一个输入参数，还没有遍历的元素作为第二个输入参数。这样的结果就是把一串可遍历的值，减少（reduce）成一个对象：

Python
 
           1 
         
        reduce ( lambda   x ,   y :   x   +   y ,   [ 1 ,   2 ,   3 ,   4 ] )      # ((1+2)+3)+4=10

filter顾名思义，根据条件对可遍历结构进行筛选：

Python
 
           1 
         
        filter ( lambda   x :   x   %   2 ,   [ 1 ,   2 ,   3 ,   4 ,   5 ] )      # 筛选奇数，[1, 3, 5]

需要注意的是，对于filter和map，在Python2中返回结果是列表，Python3中是生成器。

5.2.6 列表生成（list comprehension）

列表生成是Python2.0中加入的一种语法，可以非常方便地用来生成列表和迭代器，比如上节中map的两个例子和filter的一个例子可以用列表生成重写为：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
        [ x * * 2   for   x   in   [ 1 ,   2 ,   3 ,   4 ] ]                        # [1, 4, 9 16] 
         
 [ sum ( x )   for   x   in   zip ( [ 1 ,   2 ,   3 ] ,   [ 5 ,   6 ,   7 ] ) ]   # [6, 8, 10] 
         
 [ x   for   x   in   [ 1 ,   2 ,   3 ,   4 ,   5 ]   if   x   %   2 ]         # [1, 3, 5]

zip()函数可以把多个列表关联起来，这个例子中，通过zip()可以按顺序同时输出两个列表对应位置的元素对。有一点需要注意的是，zip()不会自动帮助判断两个列表是否长度一样，所以最终的结果会以短的列表为准，想要以长的列表为准的话可以考虑itertools模块中的izip_longest()。如果要生成迭代器只需要把方括号换成括号，生成字典也非常容易：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
        iter_odd   =   ( x   for   x   in   [ 1 ,   2 ,   3 ,   4 ,   5 ]   if   x   %   2 ) 
         
 print ( type ( iter_odd ) )                         #  
         
 square_dict   =   { x :   x * * 2   for   x   in   range ( 5 ) }     # {0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

至于列表生成和map/filter应该优先用哪种，这个问题很难回答，不过Python创始人Guido似乎不喜欢map/filter/reduce，他曾在表示过一些从函数式编程里拿来的特性是个错误。

5.2.7 字符串

Python中字符串相关的处理都非常方便，来看例子：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
        a   =   'Life is short, you need Python' 
         
 a . lower ( )                 # 'life is short, you need Python' 
         
 a . upper ( )                 # 'LIFE IS SHORT, YOU NEED PYTHON' 
         
 a . count ( 'i' )               # 2 
         
 a . find ( 'e' )               # 从左向右查找'e'，3 
         
 a . rfind ( 'need' )           # 从右向左查找'need'，19 
         
 a . replace ( 'you' ,   'I' )     # 'Life is short, I need Python' 
         
 tokens   =   a . split ( )       # ['Life', 'is', 'short,', 'you', 'need', 'Python'] 
         
 b   =   ' ' . join ( tokens )   # 用指定分隔符按顺序把字符串列表组合成新字符串 
         
 c   =   a   +   '\n'               # 加了换行符，注意+用法是字符串作为序列的用法 
         
 c . rstrip ( )                 # 右侧去除换行符 
         
 [ x   for   x   in   a ]             # 遍历每个字符并生成由所有字符按顺序构成的列表 
         
 'Python'   in   a     # True

Python2.6中引入了format进行字符串格式化，相比在字符串中用%的类似C的方式，更加强大方便：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
           20 
         
           21 
         
           22 
         
           23 
         
           24 
         
           25 
         
           26 
         
           27 
         
           28 
         
           29 
         
           30 
         
           31 
         
        a   =   'I’m like a {} chasing {}.' 
         
 # 按顺序格式化字符串，'I’m like a dog chasing cars.' 
         
 a . format ( 'dog' ,   'cars' ) 
         
 # 在大括号中指定参数所在位置 
         
 b   =   'I prefer {1} {0} to {2} {0}' 
         
 b . format ( 'food' ,   'Chinese' ,   'American' ) 
         
 # >代表右对齐，>前是要填充的字符，依次输出： 
         
 # 000001 
         
 # 000019 
         
 # 000256 
         
 for   i   in   [ 1 ,   19 ,   256 ] : 
         
      print ( 'The index is {:0>6d}' . format ( i ) ) 
         
 # <代表左对齐，依次输出： 
         
 # *--------- 
         
 # ****------ 
         
 # *******--- 
         
 for   x   in   [ '*' ,   '****' ,   '*******' ] : 
         
      progress_bar   =   '{:-<10}' . format ( x ) 
         
      print ( progress_bar ) 
         
 for   x   in   [ 0.0001 ,   1e17 ,   3e - 18 ] : 
         
      print ( '{:.6f}' . format ( x ) )     # 按照小数点后6位的浮点数格式 
         
      print ( '{:.1e}' . format ( x ) )     # 按照小数点后1位的科学记数法格式 
         
      print   ( '{:g}' . format ( x ) )      # 系统自动选择最合适的格式 
         
 template   =   '{name} is {age} years old.' 
         
 c   =   template . format ( name = 'Tom' ,   age = 8 ) )   # Tom is 8 years old. 
         
 d   =   template . format ( age = 7 ,   name = 'Jerry' ) # Jerry is 7 years old.

format在生成字符串和文档的时候非常有用，更多更详细的用法可以参考Python官网：

7.1. string – Common string operations – Python 2.7.13 documentation

5.2.8 文件操作和pickle

在Python中，推荐用上下文管理器（with-as）来打开文件，IO资源的管理更加安全，而且不用老惦记着给文件执行close()函数。还是举例子来说明，考虑有个文件name_age.txt，里面存储着名字和年龄的关系，格式如下：

读取文件内容并全部显示：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
        with   open ( 'name_age.txt' ,   'r' )   as   f :   # 打开文件，读取模式 
         
      lines   =   f . readlines ( )                 # 一次读取所有行 
         
      for   line  in   lines :                     # 按行格式化并显示信息 
         
          name ,   age   =   line . rstrip ( ) . split ( ',' ) 
         
          print ( '{} is {} years old.' . format ( name ,   age ) )

open()的第一个参数是文件名，第二个参数是模式。文件的模式一般有四种，读取(r)，写入(w)，追加(a)和读写(r+)。如果希望按照二进制数据读取，则将文件模式和b一起使用（wb, r+b…）。

再考虑一个场景，要读取文件内容，并把年龄和名字的顺序交换存成新文件age_name.txt，这时可以同时打开两个文件：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
        with   open ( 'name_age.txt' ,   'r' )   as   fread ,   open ( 'age_name.txt' ,   'w' )   as   fwrite : 
         
      line   =   fread . readline ( ) 
         
      while   line : 
         
          name ,   age   =   line . rstrip ( ) . split ( ',' ) 
         
          fwrite . write ( '{},{}\n' . format ( age ,   name ) ) 
         
          line   =   fread . readline ( )

有的时候我们进行文件操作是希望把对象进行序列化，那么可以考虑用pickle模块：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
        import   pickle 
         
 lines   =   [ 
         
      "I'm like a dog chasing cars." , 
         
      "I wouldn't know what to do if I caught one..." , 
         
      "I'd just do things." 
         
 ] 
         
 with   open ( 'lines.pkl' ,   'wb' )   as   f :   # 序列化并保存成文件 
         
      pickle . dump ( lines ,   f ) 
         
 with   open ( 'lines.pkl' ,   'rb' )   as   f :   # 从文件读取并反序列化 
         
      lines_back   =   pickle . load ( f ) 
         
 print ( lines_back )                     # 和lines一样

注意到，序列化的时候就得使用b模式了。Python2中有个效率更高的pickle叫cPickle，用法和pickle一样，在Python3中就只有一个pickle。

5.2.9 异常

相比起其他一些语言，在Python中我们可以更大胆地使用异常，因为异常在Python中是非常常见的存在，比如下面这种简单的遍历：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
        a   =   [ 'Why' ,   'so' ,   'serious' ,   '?' ] 
         
 for   x   in   a : 
         
      print ( x )

当用for进行遍历时，会对要遍历的对象调用iter()。这需要给对象创建一个迭代器用来依次返回对象中的内容。为了能成功调用iter()，该对象要么得支持迭代协议(定义__iter__())，要么得支持序列协议(定义__getitem__())。当遍历结束时，__iter__()或者__getitem__()都需要抛出一个异常。__iter__()会抛出StopIteration，而__getitem__()会抛出IndexError，于是遍历就会停止。

在深度学习中，尤其是数据准备阶段，常常遇到IO操作。这时候遇到异常的可能性很高，采用异常处理可以保证数据处理的过程不被中断，并对有异常的情况进行记录或其他动作：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
        for   filepath  in   filelist :     # filelist中是文件路径的列表 
         
      try : 
         
          with   open ( filepath ,   'r' )   as   f : 
         
              # 执行数据处理的相关工作 
         
              . . . 
         
          print ( '{} is processed!' . format ( filepath ) ) 
         
      except   IOError : 
         
          print ( '{} with IOError!' . format ( filepath ) ) 
         
          # 异常的相应处理 
         
          . . .

5.2.10 多进程（multiprocessing）

深度学习中对数据高效处理常常会需要并行，这时多进程就派上了用场。考虑这样一个场景，在数据准备阶段，有很多文件需要运行一定的预处理，正好有台多核服务器，我们希望把这些文件分成32份，并行处理：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
           20 
         
           21 
         
           22 
         
           23 
         
           24 
         
           25 
         
           26 
         
           27 
         
           28 
         
           29 
         
           30 
         
           31 
         
           32 
         
           33 
         
           34 
         
           35 
         
           36 
         
        from   multiprocessing   import   Process #, freeze_support 
         
 def   process_data ( filelist ) : 
         
      for   filepath  in   filelist : 
         
          print ( 'Processing {} ...' . format ( filepath ) ) 
         
          # 处理数据 
         
          . . . 
         
 if   __name__   ==   '__main__' : 
         
      # 如果是在Windows下，还需要加上freeze_support() 
         
      #freeze_support() 
         
      # full_list包含了要处理的全部文件列表 
         
      . . . 
         
      n_total   =   len ( full_list )   # 一个远大于32的数 
         
      n_processes   =   32 
         
      # 每段子列表的平均长度 
         
      length   =   float ( n_total )   /   float ( n_processes ) 
         
      # 计算下标，尽可能均匀地划分输入文件列表 
         
      indices   =   [ int ( round ( i * length ) )   for   i   in   range ( n_processes + 1 ) ] 
         
      # 生成每个进程要处理的子文件列表 
         
      sublists   =   [ full_list [ indices [ i ] : indices [ i + 1 ] ]   for   i   in   range ( n_processes ) ] 
         
      # 生成进程 
         
      processes   =   [ Process ( target = process_data ,   args = ( x , ) )   for   x   in   sublists ] 
         
      # 并行处理 
         
      for   p   in   processes : 
         
          p . start ( ) 
         
      for   p   in   processes : 
         
          p . join ( )

其中if __name__ == ‘__main__’用来标明在import时不包含，但是作为文件执行时运行的语句块。为什么不用多线程呢？简单说就是Python中线程的并发无法有效利用多核，如果有兴趣的读者可以从下面这个链接看起：

GlobalInterpreterLock – Python Wiki

5.2.11 os模块

深度学习中的数据多是文件，所以数据处理阶段和文件相关的操作就非常重要。除了文件IO，Python中一些操作系统的相关功能也能够非常方便地帮助数据处理。想象一下我们有一个文件夹叫做data，下边有3个子文件夹叫做cat，dog和bat，里面分别是猫，狗和蝙蝠的照片。为了训练一个三分类模型，我们先要生成一个文件，里面每一行是文件的路径和对应的标签。定义cat是0，dog是1，bat是2，则可以通过如下脚本：

Python
 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
           14 
         
           15 
         
           16 
         
           17 
         
           18 
         
           19 
         
        import   os 
         
 # 定义文件夹名称和标签的对应关系 
         
 label_map   =   { 
         
      'cat' :   0 , 
         
      'dog' :   1 , 
         
      'bat' :   2 
         
 } 
         
 with   open

你可能感兴趣的:(python,深度学习,python)

Python, Java, C ++开发全球热能动态监测APP Geeker-2025 python java c++
开发一个“全球热能动态监测APP”是一个非常有意义的想法，尤其是在能源管理和环境保护领域。以下是开发该APP的详细思路和技术实现方案，分别针对Python、Java和C++。---###**功能需求分析**1.**全球热能数据展示**：-各国或地区的热能生产、消费和进出口数据。-实时监测热能动态（如发电厂的热能输出、温度变化等）。2.**地图可视化**：-在地图上标注热能发电厂的位置。-使用颜色或
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
动物识别系统代码python_动物识别系统__代码 weixin_39812065 动物识别系统代码python
1动物识别专家系统动物识别专家系统是流行的专家系统实验模型，它用产生式规则来表示知识，共15条规则、可以识别七种动物，这些规则既少又简单，可以改造他们，也可以加进新的规则，还可以用来识别其他东西的新规则来取代这些规则。动物识别15条规则的中文表示是：规则1：如果：动物有毛发则：该动物是哺乳动物规则2：如果：动物有奶则：该单位是哺乳动物规则3:如果：该动物有羽毛则：该动物是鸟规则4：如果：动物会飞，
动物识别系统代码python_动物识别系统代码 weixin_39862794 动物识别系统代码python
简易动物识别专家系统源代码（调试无错！）#includevoidbirds(){inta;printf("**************************************\n");printf("1.长腿，长脖子，黑色，不会飞。\n");printf("2.不会飞，会游泳，黑色.\n");printf("3.善飞\n");printf("4.无上述特征\n");printf("****
Python深浅拷贝 Karl_zhujt Python python
文章目录1概述2数据类型2.1可变类型2.2不可变类型3深浅拷贝3.1浅拷贝3.2深拷贝4深浅拷贝对数据类型的影响4.1对于不可变类型的影响4.2对于可变类型的影响4.3总结5实现机制5.1copy5.2id6示例6.1普通赋值6.2浅拷贝可变类型6.3浅拷贝不可变类型6.4深拷贝可变类型6.5深拷贝不可变类型7注意事项1概述在Python中，可变类型和不可变类型的拷贝行为有所不同。理解它们的区别
基于 EMA12 指标结合 iTick 外汇报价 API 、股票报价API、指数报价API的量化策略编写与回测
iTick提供了强大的外汇报价API、股票报价API和指数报价API服务，为量化策略的开发提供了丰富的数据支持。本文将详细介绍如何使用Python结合EMA12指标和iTick的报价API来构建一个简单的量化交易策略，并对该策略进行回测。1.引言在量化交易领域，技术指标是构建交易策略的重要基础。iTick提供了强大的外汇报价API、股票报价API和指数报价API服务，为量化策略的开发提供了丰富的数
腾讯云大模型知识引擎与DeepSeek：打造懒人专属的谷歌浏览器翻译插件大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 腾讯云云计算
摘要：随着人工智能技术的飞速发展，越来越多的前沿技术和工具已走入日常生活。翻译工具作为跨语言沟通的桥梁，一直处于技术创新的风口浪尖。本文探讨了腾讯云大模型知识引擎与DeepSeek结合谷歌浏览器插件的可能性，旨在为用户提供一种便捷、高效的翻译体验。通过应用深度学习、自然语言处理和知识图谱技术，该插件不仅能实时翻译网页内容，还能根据上下文进行智能推荐，实现精准的语境转换。本文将详细阐述其设计思路、技
python动物识别系统(仅有识别功能) OnlySecondS
''@Time:2022/03/298:39@Author:11863@File:AIS_main.py@software:PyCharm'''rules={}#以字典形式存储#读取文件defreadRules():rulesFile=open("rules.txt","r",encoding='utf-8')forlineinrulesFile:#按行读取line=line.replace('I
深度优先搜索和广度优先搜索详细解析和区别潇杨爱吃粉深度优先宽度优先算法数据结构
一、深度优先搜索（DFS）1.核心思想像探险家走迷宫，遇到岔路就选一条路走到头，无路可走时返回上一个岔路口换另一条路。2.实现方式数据结构：栈（Stack，先进后出）或递归（隐式栈）遍历顺序：纵向深入，优先访问最深层的节点3.图解示例假设有以下树结构：A/\BC/\/DEFDFS遍历顺序（从根节点A出发）：A→B→D→E→C→F4.代码实现（Python）defdfs(graph,start):s
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Python-modbustcp通信-plc读写张凯的工作室 python python
Python-modbustcp通信-plc读写1，功能码说明读取：%m对应READ_COILS线圈寄存器数值0和1%mw存单字节%mf浮点数%md双字节对应READ_HOLDING_REGISTERS保持寄存器写入单个写入线圈寄存器WRITE_SINGLE_COIL%m单个写入保持寄存器WRITE_SINGLE_REGISTER写入多个保持寄存器WRITE_MULTIPLE_REGISTERS写
PyCharm v2024.3.5 强大的Python IDE工具支持M、Intel芯片 2401_89264762 python ide pycharm
PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具，比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外，该IDE提供了一些高级功能，以用于支持Django框架下的专业Web开发。应用介绍PyCharm是由JetBrains打造的一款PythonIDE，VS2010的重构插件Resharper就是出自
免费界面库 python_一个非常简单好用的Python图形界面库(PysimpleGUI) 不妧免费界面库 python
前一阵，我在为朋友编写一个源代码监控程序的时候，发现了一个Python领域非常简单好用的图形界面库。说起图形界面库，你可能会想到TkInter、PyQt、PyGUI等流行的图形界面库，我也曾经尝试使用，一个很直观的感受就是，这太难用了。就去网上搜搜，看看有没有一些demo，拿来改改，结果很少有，当时我就放弃了这些图形库的学习，转而使用了vue+flask的形式以浏览器网页作为程序界面，因为我会这个
Python 网络爬虫：从入门到实践一ge科研小菜菜编程语言 Python python
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注网络爬虫是一种自动化的程序，用于从互联网上抓取数据。Python以其强大的库和简单的语法，是开发网络爬虫的绝佳选择。本文将详细介绍Python网络爬虫的基本原理、开发工具、常用框架以及实践案例。一、网络爬虫的基本原理网络爬虫的工作流程通常包括以下步骤：发送请求：向目标网站发送HTTP请求，获取网页内容。解析内容：提取需要的数据，可以是HTML标签
PySimpleGUI 4.60.5 孔帆贝
PySimpleGUI4.60.5【下载地址】PySimpleGUI4.60.5**PySimpleGUI**是一款专为简化PythonGUI（图形用户界面）编程而生的库。该库设计宗旨在于通过提供简洁、易懂的API接口，使开发者能够以更快的速度和更少的代码量创建出美观实用的应用程序。对于无论是GUI编程新手还是寻求快速开发工具的老手来说，PySimpleGUI都是一个极具吸引力的选择。其通过封装了
《今日AI-人工智能-编程日报》-源自2025年3月19日小亦编辑部每日AI-人工智能-编程日报人工智能
1.豆包AI编程功能迎来三项重磅升级豆包平台今日宣布其AI编程功能迎来三项重要升级，包括：HTML实时预览：支持用户在编写HTML代码时实时查看网页效果，显著提升前端开发效率，尤其适用于小游戏和网页制作。Python代码直接运行与一键修复：用户可直接运行Python代码，并在出错时一键修复，极大降低了编程门槛，提升了开发效率。生成完整项目：新增生成完整项目的功能，帮助用户快速创建应用程序，缩短开发
python PySimpleGUI 使用 Seeklike python
#PySimpleGUI库快速简单构建一个gui窗口#PySimpleGUI是一个用于简化GUI编程的Python包，它封装了多种底层GUI框架（如tkinter、Qt、WxPython等），提供了简单易用的API。#PySimpleGUI包含了大量的控件（也称为小部件或组件），这些控件可以帮助你快速构建用户界面#导包importPySimpleGUIassgimportcv2importkeyb
2024年最全Python二级考试试题汇总（史上最全） 2401_84584831 程序员 python 开发语言算法
C‘1,2,3,4,5,’D1,2,3,4,5,正确答案：D以下程序的输出结果是：a=30b=1ifa>=10:a=20elifa>=20:a=30elifa>=30:b=aelse:b=0print(‘a={},b={}’.format(a,b))Aa=30,b=1Ba=30,b=30Ca=20,b=20Da=20,b=1正确答案：D以下程序的输出结果是：s=‘’try:foriinrange(
如何通过Python实现自动化任务：从入门到实践小弟有话说1.0 python 自动化开发语言
在当今快节奏的数字化时代，自动化技术正逐渐成为提高工作效率的利器。无论是处理重复性任务，还是管理复杂的工作流程，自动化都能为我们节省大量时间和精力。本文将以Python为例，带你从零开始学习如何实现自动化任务，并通过一个实际案例展示其强大功能。一、为什么选择Python实现自动化？Python作为一种简单易学、功能强大的编程语言，已经成为自动化领域的首选工具。以下是Python在自动化中的几大优势
2024年Python最新Python二级考试试题汇总（史上最全）_计算机二级python真题 2301_82243979 程序员 python 开发语言前端
表达式1001==0x3e7的结果是：AfalseBFalseCtrueDTrue正确答案：B以下选项，不是Python保留字的选项是：AdelBpassCnotDstring正确答案：D表达式eval(‘500/10’)的结果是：A‘500/10’B500/10C50D50.0正确答案：D表达式type(eval(‘45’))的结果是：ABCNoneD正确答案：D表达式divmod(20,3)的
Python点名器代码及打包教程羽落惊鸿TQ python 开发语言
接下来再写一个功能性齐全稍微复杂一点的Python点名器程序，在原简易版的基础上增加历史记录功能、支持多种名单格式（CSV/Excel）、增加点名统计功能，并详细说明了将该程序打包成exe可执行文件的方法，以下是源代码，仅供学习参考：importtkinterastkfromtkinterimportttk, messagebox, filedialogimportrandomimportcsvi
基于python+django的旅游信息网站-旅游景点门票管理系统源码+运行步骤冷琴1996 Python系统设计 python django 旅游
该系统是基于python+django开发的旅游景点门票管理系统。是给师弟做的课程作业。大家学习过程中，遇到问题可以在github咨询作者。学习过程问题可以留言哦演示地址前台地址：http://travel.gitapp.cn后台地址：http://travel.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https://github.com/
50个常见的python毕业设计/课程设计（源码+文档）冷琴1996 Python系统设计 python 课程设计开发语言
计算机课程设计/毕业设计指南，为计算机相关专业毕业生提供源码、数据库安装、远程调试等相关服务，提供功能讲解视频。下面是50个基于python/django/vue的毕业设计/课程设计。1.网上商城系统这是一个基于python+vue开发的商城网站，平台采用B/S结构，后端采用主流的Python语言进行开发，前端采用主流的Vue.js进行开发。整个平台包括前台和后台两个部分。前台功能包括：首页、商品
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（二）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（二）5.跨模态检索系统应用场景5.1图文匹配系统的实际应用应用领域具体场景优势电子商务商品图像搜索、视觉购物用户可以上传图片查找相似商品或使用文本描述查找商品智能媒体内容推荐、图片库搜索通过内容的语义理解提供更精准的推荐和搜索社交网络基于内容的帖子推荐理解用户兴趣，提供更相关的内容推荐教育技术多模态教学资源检索教师和学生可以更
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（一）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（一）引言：跨越感知的边界欢迎来到我们的PyTorch学习旅程第28天！今天我们将步入AI世界中最激动人心的领域之一：多模态学习。想象一下，如果你的模型既能"看"又能"读"，并且能够理解图像与文字之间的联系，这将为我们打开怎样的可能性？今天我们将专注于构建图文匹配系统，学习如何使用CLIP（ContrastiveLanguage
分享Python7个爬虫小案例（附源码）人工智能-猫猫爬虫 python 开发语言
在这篇文章中，我们将分享7个Python爬虫的小案例，帮助大家更好地学习和了解Python爬虫的基础知识。以下是每个案例的简介和源代码：1.爬取豆瓣电影Top250这个案例使用BeautifulSoup库爬取豆瓣电影Top250的电影名称、评分和评价人数等信息，并将这些信息保存到CSV文件中。importrequestsfrombs4importBeautifulSoupimportcsv#请求U
后端框架模块化 GIS程序媛—椰子后端
后端框架的模块化设计旨在简化开发流程、提高可维护性，并通过分层解耦降低复杂性。以下是常见的后端模块及其在不同语言（Node.js、Java、Python）中的实现方式：目录1.路由（Routing）2.中间件（Middleware）3.数据库与ORM（models）4.迁移（Migration）5.服务层（ServiceLayer）6.配置管理（Configuration）7.依赖注入（DI）8.
Pyhton 基础 368. python python 开发语言
初识PythonPython是一种解释型语言Python使用缩进对齐组织代码执行，所以没有缩进的代码，都会在载入时自动执行数据类型：整形int无限大浮点型float小数复数complex由实数和虚数组成Python中有6个标准的数据类型：Number(数字)String(字符串)List(列表)Tuple(元组)Sets(集合)Dictionart(字典)其中不可变得数据：Number(数字)St
基于python+django+mysql的小区物业管理系统源码+运行步骤冷琴1996 Python系统设计 python 开发语言
该系统是基于python+django开发的小区物业管理系统。适用场景：大学生、课程作业、毕业设计。学习过程中，如遇问题可以在github给作者留言。主要功能有：业主管理、报修管理、停车管理、资产管理、小区管理、用户管理、日志管理、系统信息。源码学习技术。演示地址http://wuye.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https:/
用Python修改Word文档字体
在数字化办公场景中，Word文档作为主流文件格式承载着大量商务文书与学术资料。传统手动调整字体格式的操作模式存在显著局限性：当面对批量文档处理、动态内容生成或企业级模板维护时，逐一手工修改不仅效率低下，更难以保障格式规范的统一性。通过Python实现文档字体的程序化控制，能够有效构建自动化处理流程，在确保排版精准度的同时，显著提升文档批量化操作能力。本文将介绍如何使用Python修改Word文档段
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情