Python是一个简单、易读、易记的编程语言,而且是开源的,可以免费地自由使用。
使用Python不仅可以写出可读性高的代码,还可以写出性能高(处理速度快)的代码。
再者,在科学领域,特别是在机器学习、数据科学领域,Python也被大量使用。Python除了高性能之外,凭借着NumPy、SciPy等优秀的数值计算、统计分析库,在数据科学领域占有不可动摇的地位。深度学习的框架中也有很多使用Python的场景,比如Caffe、TensorFlow、Chainer、Theano等著名的深度学习框架都提供了Python接口。
Python有Python 2.x和Python 3.x两个版本。如果我们调查一下目前Python的使用情况,会发现除了最新的版本3.x以外,旧的版本2.x仍在被大量使用。因此,在安装Python时,需要慎重选择安装Python的哪个版本。这是因为两个版本之间没有兼容性(严格地讲,是没有“向后兼容性”),也就是说,会发生用Python 3.x写的代码不能被Python 2.x执行的情况。本次使用Python 3.x ,只安装了Python 2.x的读者建议另外安装一下Python 3.x。
本书的目标是从零开始实现深度学习。因此,除了NumPy库和Matplotlib库之外,我们极力避免使用外部库。之所以使用这两个库,是因为它们可以有效地促进深度学习的实现。
NumPy是用于数值计算的库,提供了很多高级的数学算法和便利的数组(矩阵)操作方法。本书中将使用这些便利的方法来有效地促进深度学习的实现。
Matplotlib是用来画图的库。使用Matplotlib能将实验结果可视化,并在视觉上确认深度学习运行期间的数据。
Python的安装方法有很多种,本书推荐使用Anaconda这个发行版。发行版集成了必要的库,使用户可以一次性完成安装。
Anaconda是一个侧重于数据分析的发行版,前面说的NumPy、Matplotlib等有助于数据分析的库都包含在其中。如前所述,本书将使用Python 3.x版本,因此Anaconda发行版也要安装3.x的版本。请读者从官方网站下载与自己的操作系统相应的发行版,然后安装。
完成Python的安装后,要先确认一下Python的版本。打开终端(Windows中的命令行窗口),输入python --version命令,该命令会输出已经安装的Python的版本信息。
如上所示,显示了Python 3.4.1(根据实际安装的版本,版本号可能不同),说明已正确安装了Python 3.x。接着输入python,启动Python解释器。
Python解释器也被称为“对话模式”,用户能够以和Python对话的方式进行编程。
加法或乘法等算术计算,可按如下方式进行。
*表示乘法,/表示除法,**表示乘方(3**2是3的2次方)。
另外,在Python 2.x中,整数除以整数的结果是整数,比如,7 ÷ 5的结果是1。
但在Python 3.x中,整数除以整数的结果是小数(浮点数)。
编程中有数据类型(data type)这一概念。数据类型表示数据的性质,有整数、小数、字符串等类型。Python中的type()函数可以用来查看数据类型。
根据上面的结果可知,10是int类型(整型),2.718是float类型(浮点型),"hello"是str(字符串)类型。另外,“类型”和“类”这两个词有时用作相同的意思。这里,对于输出结果
可以使用x或y等字母定义变量(variable)。此外,可以使用变量进行计算,也可以对变量赋值。
Python是属于“动态类型语言”的编程语言,所谓动态,是指变量的类型是根据情况自动决定的。在上面的例子中,用户并没有明确指出“x的类型是int(整型)”,是Python根据x被初始化为10,从而判断出x的类型为int的。此外,我们也可以看到,整数和小数相乘的结果是小数(数据类型的自动转换)。另外,“#”是注释的意思,它后面的文字会被Python忽略。
除了单一的数值,还可以用列表(数组)汇总数据。
元素的访问是通过a[0]这样的方式进行的。[]中的数字称为索引(下标),索引从0开始(索引0对应第一个元素)。此外,Python的列表提供了切片(slicing)这一便捷的标记法。使用切片不仅可以访问某个值,还可以访问列表的子列表(部分列表)。
进行列表的切片时,需要写成a[0:2]这样的形式。a[0:2]用于取出从索引为0的元素到索引为2的元素的前一个元素之间的元素。另外,索引-1对应最后一个元素,-2对应最后一个元素的前一个元素。
列表根据索引,按照0, 1, 2, ...的顺序存储值,而字典则以键值对的形式存储数据。字典就像《新华字典》那样,将单词和它的含义对应着存储起来。
Python中有bool型。bool型取True或False中的一个值。针对bool型的运算符包括and、or和not(针对数值的运算符有+、-、*、/等,根据不同的数据类型使用不同的运算符)。
根据不同的条件选择不同的处理分支时可以使用if/else语句。
Python中的空白字符具有重要的意义。上面的if语句中,if hungry:下面的语句开头有4个空白字符。它是缩进的意思,表示当前面的条件(if hungry)成立时,此处的代码会被执行。这个缩进也可以用tab表示,Python中推荐使用空白字符。
python使用空白字符表示缩进。一般而言,每缩进一次,使用4个空白字符。
进行循环处理时可以使用for语句。
这是输出列表[1, 2, 3]中的元素的例子。
使用for … in … :语句结构,可以按顺序访问列表等数据集合中的各个元素。
可以将一连串的处理定义成函数(function)。
此外,函数可以取参数。
另外,字符串的拼接可以使用+。
将Python程序保存为文件,然后(集中地)运行这个文件。
打开文本编辑器,新建一个hungry.py的文件。hungry.py只包含下面一行语句。
接着,打开终端(Windows中的命令行窗口),移至hungry.py所在的位置。然后,将hungry.py文件名作为参数,运行python命令。这里假设hungry.py在~/deep-learning-from-scratch/ch01目录下(在本书提供的源代码中,hungry.py文件位于ch01目录下)。
使用python hungry.py命令就可以执行这个Python程序了。
int、str等数据类型是“内置”的数据类型,是Python中一开始就有的数据类型。现在,我们来定义新的类。如果用户自己定义类的话,就可以自己创建数据类型。此外,也可以定义原创的方法(类的函数)和属性。Python中使用class关键字来定义类,类要遵循下述格式(模板)。
这里有一个特殊的init方法,这是进行初始化的方法,也称为构造函数(constructor),只在生成类的实例时被调用一次。此外,在方法的第一个参数中明确地写入表示自身(自身的实例)的self是Python的一个特点。
从终端运行man.py。
这里我们定义了一个新类Man。
上面的例子中,类Man生成了实例(对象)m。类Man的构造函数(初始化方法)会接收参数name,然后用这个参数初始化实例变量self.name。
实例变量是存储在各个实例中的变量。Python中可以像self.name这样,通过在self后面添加属性名来生成或访问实例变量。
NumPy是外部库。这里所说的“外部”是指不包含在标准版Python中。因此,我们首先要导入NumPy库。
>>> import numpy as np
Python中使用import语句来导入库。通过写成这样的形式,之后NumPy相关的方法均可通过np来调用。
要生成NumPy数组,需要使用np.array()方法。np.array()接收Python列表作为参数,生成NumPy数组(numpy.ndarray)。
下面是NumPy数组的算术运算的例子。
这里需要注意的是,数组x和数组y的元素个数是相同的(两者均是元素个数为3的一维数组)。当x和y的元素个数相同时,可以对各个元素进行算术运算。如果元素个数不同,程序就会报错,所以元素个数保持一致非常重要。另外,“对应元素的”的英文是element-wise,比如“对应元素的乘法”就是element-wise product。
NumPy数组不仅可以进行element-wise运算,也可以和单一的数值(标量)组合起来进行运算。此时,需要在NumPy数组的各个元素和标量之间进行运算。
NumPy不仅可以生成一维数组(排成一列的数组),也可以生成多维数组。比如,可以生成如下的二维数组(矩阵)。
这里生成了一个2 × 2的矩阵A。另外,矩阵A的形状可以通过shape查看,矩阵元素的数据类型可以通过dtype查看。
插入小知识:Python中int32和int64的区别
引言
在Python中,整数类型可以表示不同大小的整数值。其中,int64和int32分别表示64位和32位的整数类型。它们之间的区别在于能够表示的整数范围以及所占用的内存空间大小。
步骤 | 描述 |
---|---|
步骤1 | 确认Python版本 |
步骤2 | 导入相应的库 |
步骤3 | 创建int64和int32整数 |
步骤4 | 比较int64和int32整数范围 |
步骤1:确认Python版本
首先确认使用的python版本。
import sys
print(sys.version)
步骤2:导入相应的库
在python中,需要导入numpy库来创建int64和int32整数。使用以下代码导入该库:
import numpy as np
步骤3:创建int64和int32整数
接下里使用numpy库来创建int64和int32整数,以下代码展示了如何创建这两种类型的整数:
int64_num = np.int64(100)
int32_num = np.int32(100)
在上述代码中,使用了np.int64()和np.int32()函数来创建int64和int32整数,并将它们赋值给相应的变量。
步骤4:比较int64和int32整数范围
最后,可以使用以下代码比较int64和int32整数的范围:
int64_range = np.iinfo(np.int64)
int32_range = np.iinfo(np.int32)
print("int64范围:",int64_range.min,"到",int64_range.max)
print("int32范围:",int32_range.min,"到",int32_range.max)
使用np.iinfo()函数来获取int64和int32整数的范围,并将其分别赋值给相应的变量。然后,我们使用print()函数来打印出这两种类型整数的范围。
矩阵的算术运算
B = np.array([[3,0],[0,6]])
print(A + B)
print(A * B)
和数组的算术运算一样,矩阵的算术运算也可以在相同形状的矩阵间以对应元素的方式进行。并且,也可以通过标量(单一数值)对矩阵进行算术运算。这也是基于广播的功能。
NumPy数组(np.array)可以生成N维数组,即可以生成一维数组、二维数组、三维数组等任意维数的数组。数学上将一维数组称为向量,将二维数组称为矩阵。另外,可以将一般化之后的向量或矩阵等统称为张量(tensor)。本书基本上将二维数组称为“矩阵”,将三维数组及三维以上的数组称为“张量”或“多维数组”。
NumPy中,形状不同的数组之间也可以进行运算。之前的例子中,在2×2的矩阵A和标量10之间进行了乘法运算。在这个过程中,如图1-1所示,标量10被扩展成了2 × 2的形状,然后再与矩阵A进行乘法运算。这个巧妙的功能称为广播(broadcast)。
通过下面这个运算再来看一个广播的例子。
在这个运算中,如图1-2所示,一维数组B被“巧妙地”变成了和二位数组A相同的形状,然后再以对应元素的方式进行运算。
综上,因为NumPy有广播功能,所以不同形状的数组之间也可以顺利地进行运算。
1.5.6 访问元素
元素的索引从0开始。对各个元素的访问可按如下方式进行。
import numpy as np
X = np.array([[51,55],[14,19],[0,4]])
print(X)
print(X[0])
print(X[0][1])#(0,1)的元素
#也可以使用for语句访问各个元素。
for row in X:
print(row)
#Numpy还可以使用数组访问各个元素
X = X.flatten()#将X转换为一维数组
print(X)
print(X[np.array([0,2,4])])#获取索引为0、2 、4的元素
#运用标记法,可以获取满足一定条件的元素。例如,要从x中抽出大于15的元素,可以写成如下形式。
print(X > 15)
print(X[X > 15])
#对NumPy数组使用不等号运算符等(上例中是X > 15),结果会得到一个布尔型的数组。
#上例中就是使用这个布尔型数组取出了数组的各个元素(取出True对应的元素)。
运行结果:
Python等动态类型语言一般比C和C++等静态类型语言(编译型语言)运算速度慢。实际上,如果是运算量大的处理对象,用C/C++写程序更好。为此,当Python中追求性能时,人们会用C/C++来实现处理的内容。Python则承担“中间人”的角色,负责调用那些用C/ C++写的程序。NumPy中,主要的处理也都是通过C或C++实现的。因此,我们可以在不损失性能的情况下,使用Python便利的语法。
Matplotlib是用于绘制图形的库,使用Matplotlib可以轻松地绘制图形和实现数据的可视化。
可以使用matplotlib的pyplot模块绘制图形。如下,绘制sin函数曲线的例子。
import numpy as np
import matplotlib.pyplot as plt
#生成数据
x = np.arange(0,6,0.1) # 以0.1为单位,生成0到6的数据
y = np.sin(x)
#绘制图形
plt.plot(x,y)
plt.show()
这里使用NumPy的arange方法生成了[0,0.1,0.2,...,5.8,5.9]的数据,将其设为x。对x的各个元素,应用NumPy的sin函数np.sin(),将x、y的数据传给plt.plot方法,然后绘制图形。最后,通过plt.show()显示图形。
import numpy as np
import matplotlib.pyplot as plt
#生成数据
x = np.arange(0,6,0.1) # 以0.1为单位,生成0到6的数据
y1 = np.sin(x)
y2 = np.cos(x)
#绘制图形
plt.plot(x,y1, label="sin")
plt.plot(x,y2, linestyle = "--", label="cos")#用虚线绘制
plt.xlabel("x")#x轴标签
plt.ylabel("y")#y轴标签
plt.title('sin & cos')#标题
plt.legend()
plt.show()
pyplot中还提供了用于显示图像的方法imshow()。另外,可以使用matplotlob.image模块的imread()方法读入图像。
import matplotlib.pyplot as plt
from matplotlib.image import imread
img = imread('https://img2.baidu.com/it/u=244615067,2117237985&fm=253&fmt=auto&app=138&f=JPEG?w=800&h=500')#读入图像(设定合适的路径!
plt.imshow(img)
plt.show()
运行之后出现错误:
ValueError Traceback (most recent call last)
Cell In[11], line 4
1 import matplotlib.pyplot as plt
2 from matplotlib.image import imread
----> 4 img = imread('https://img2.baidu.com/it/u=244615067,2117237985&fm=253&fmt=auto&app=138&f=JPEG?w=800&h=500')#读入图像(设定合适的路径!
5 plt.imshow(img)
7 plt.show()
File C:\ProgramData\anaconda3\Lib\site-packages\matplotlib\image.py:1558, in imread(fname, format)
1554 img_open = (
1555 PIL.PngImagePlugin.PngImageFile if ext == 'png' else PIL.Image.open)
1556 if isinstance(fname, str) and len(parse.urlparse(fname).scheme) > 1:
1557 # Pillow doesn't handle URLs directly.
-> 1558 raise ValueError(
1559 "Please open the URL for reading and pass the "
1560 "result to Pillow, e.g. with "
1561 "``np.array(PIL.Image.open(urllib.request.urlopen(url)))``."
1562 )
1563 with img_open(fname) as image:
1564 return (_pil_png_to_float_array(image)
1565 if isinstance(image, PIL.PngImagePlugin.PngImageFile) else
1566 pil_to_array(image))
ValueError: Please open the URL for reading and pass the result to Pillow, e.g. with ``np.array(PIL.Image.open(urllib.request.urlopen(url)))``.
这段代码出现错误的原因是‘imread’函数无法直接从URL中读取图像。根据错误提示,需要先使用'PIL.Image.open(urllib.request.urlopen(url))'来读取URl中的图像,然后将其转换为NumPy数组。
修正后的代码实例:
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image
import urllib.request
url = 'https://img2.baidu.com/it/u=244615067,2117237985&fm=253&fmt=auto&app=138&f=JPEG?w=800&h=500'
response = urllib.request.urlopen(url)
img = Image.open(response)
img_array = np.array(img)
plt.imshow(img_array)
plt.show()
在这里,我导入了‘PIL’库中的‘Image’模块,并使用‘urllib.request.urlopen()’来打开URL,并将其传递给‘Image.open()’来获取图像。然后,将图像转换为NumPy数组,以便能够在Matplotlib中显示,最后,使用‘plt.imshow()’和‘plt.show()’来显示图像。
本章所学的内容
- python是一种简单易记的编程语言。
- python是开源的,开源自由使用。
- python有“解释器”和“脚本文件”两种运行模式。
- python能够将一系列处理集成为函数或类等模块。
- NumPy中有很多用于操作多维数组的便捷方法。