与函数类似,模块也分为标准库模块和用户自定义模块。 Python标准库提供了操作系统功能、网络通信、文本处理、文件处理、数学运算等基 本的功能。比如: random(随机数)、math(数学运算)、 time(时间处理)、 file(文件处理)、 os(和操作系统交互)、sys(和解释器交互)等。
另外,Python还提供了海量的第三方模块,使用方式和标准库类似。功能覆盖了能想象到的所有领域,比如:科学计算、WEB开发、大数据、人工智能、图形系统等。
模块(module)对应于Python源代码文件(.py文件)。模块中可以定义变量、函数、 类、普通语句。 这样,我们可以将一个 Python程序分解成多个模块,便于后期的重 复应用。
模块化编程(Modular Programming)将一个任务分解成多个模块。每个模块就像一个积木一样,便于后期的反复使用、反复搭建。
模块化编程有如下几个重要优势:
模块化编程的一般流程:
API(Application Programming Interface 应用程序编程接口)是用于描述模 块中提供的函数和类的功能描述和使用方式描述。
模块化编程中,首先设计的就是模块的API(即要实现的功能描述),然后开始编 码实现API中描述的功能。最后,在其他模块中导入本模块进行调用。
通过help(模块名)查看模块的API。 一般使用时先导入模块 然后通过help函数查看。
import math
help(math)
也可以在python的api文档中查询。首先进入python的安装目录下的docs子目录:
双击打开chm文档,即可通过索引输入“math”查询到对应的API内容:
每个模块都有一个名称,通过特殊变量__name__可以获取模块的名称。在正常情况下,模块名字对应源文件名。 仅有一个例外,就是当一个模块被作为程序入口时(主 程序、交互式提示符下),它的__name__的值为“main”。可以根据这个特 点,将模块源代码文件中的测试代码进行独立的处理。例如:
import math
math.name #输出’math’
通过__name==“main”独立处理模块的测试代码
在模块的第一行增加一个文档字符串,用于描述模块的相关功能。然后,通过 __doc__可以获得文档字符串的内容。
模块化设计的好处之一就是“代码复用性高”。写好的模块可以被反复调用,重复使用。 模块的导入就是“在本模块中使用其他模块”。
import 语句的基本语法格式如下:
import 模块名 #导入一个模块
import 模块1,模块2… #导入多个模块
import 模块名 as 模块别名 #导入模块并使用新名字
import 加载的模块分为四个通用类别:
a.使用 python编写的代码(.py 文件);
b.已被编译为共享库或DLL 的C或 C++扩展;
c.包好一组模块的包
d.使用 C编写并链接到 python解释器的内置模块;
一般通过 import 语句实现模块的导入和使用,import 本质上是使用了内置函数__import__()。
通过 import 导入一个模块时,python解释器进行执行,最终会生成一个对象, 这个对象就代表了被加载的模块。
math 模块被加载后,实际会生成一个 module 类的对象,该对象被 math变量引用。我们可以通过 math 变量引用模块中所有的内容。
通过import导入多个模块,本质上也是生成多个module类的对象而已。
有时候,也需要给模块起个别名,本质上,这个别名仅仅是新创建一个变量引用加 载的模块对象而已。
Python中可以使用from…import 导入模块中的成员。基本语法格式如下:
from 模块名 import 成员1,成员2,…
如果希望导入一个模块中的所有成员,则可以采用如下方式:
from 模块名 import *
【注】尽量避免“from 模块名 import ”这种写法。 它表示导入模块中所有的不 是以下划线(_)开头的名字都导入到当前位置。 但你不知道你导入什么名字,很有可能 会覆盖掉你之前已经定义的名字。而且可读性极其的差。一般生产环境中尽量避免使用, 学习时没有关系。
import 导入的是模块。from…import 导入的是模块中的一个函数/一个类。
如果进行类比的话,import 导入的是“文件”,要使用该“文件”下的内容,必 须前面加“文件名称”。from…import 导入的是文件下的“内容”,直接使用这 些“内容”即可,前面再也不需要加“文件名称”了。
import 语句本质上就是调用内置函数__import__(),可以通过它实现动态导入。给__import__()动态传递不同的的参数值,就能导入不同的模块。
当导入一个模块时, 模块中的代码都会被执行。不过,如果再次导入这个模块, 则不会再次执行。
Python的设计者为什么这么设计?因为,导入模块更多的时候需要的是定义模块 中的变量、函数、对象等。这些并不需要反复定义和执行。“只导入一次 import-only-once”就成了一种优化。
一个模块无论导入多少次,这个模块在整个解释器进程内有且仅有一个实例对象。
重新加载
有时候确实需要重新加载一个模块,这时候可以使用: importlib.reload()
import test02
import test02
print("####")
import importlib
importlib.reload(test02)
当一个项目中有很多个模块时,需要再进行组织。将功能类似的模块放到一起, 形成了“包”。本质上,“包”就是一个必须有__init__.py的文件夹。典型结构如下:
包下面可以包含“模块(module)”,也可以再包含“子包(subpackage)”。就像文件 夹下面可以有文件,也可以有子文件夹一样。
上图中,a是上层的包,下面有一个子包:aa。可以看到每个包里面都有__init__.py 文件。
在pycharm 开发环境中创建包,非常简单。在要创建包的地方单击右键:New–>Python package 即可。pycharm会自动生成带有__init__.py文件的包。
导入包的本质其实是“导入了包的__init__.py”文件。也就是说,”import pack1”意味着执行了包pack1 下面的__init__.py 文件。 这样,可以在__init__.py 中批量导入我们需要的模块,而不再需要一个个导入。
对于__init__.py的三个核心作用:
【注】 python的设计者非常巧妙的通过__init__.py 文件将包转成了模块的操作。因此,可以说“包的本质还是模块”。
import * 这样的语句理论上是希望文件系统找出包中所有的子模块,然后导入它们。 这可能会花长时间等。Python 解决方案是提供一个明确的包索引。
这个索引由 init.py 定义 all 变量,该变量为一列表,如上例 a 包下的 init.py 中,可定义 all = [“module_A”,“module_A2”]
这意味着, from sound.effects import * 会从对应的包中导入以上两个子模块;
【注】尽管提供 import * 的方法,仍不建议在生产代码中使用这种写法。
如果是子包内的引用,可以按相对位置引入子模块 以 aa包下的module_AA中导入a 包下内容为例:
from … import module_A #…表示上级目录 .表示同级目录
from . import module_A2 #.表示同级目录
当导入某个模块文件时, Python 解释器去哪里找这个文件呢?只有找到这个文 件才能读取、装载运行该模块文件。它一般按照如下路径寻找模块文件(按照顺序寻找,找 到即停不继续往下寻找):
当任何一个python程序启动时,就将上面这些搜索路径(除内置模块以外的路径)进行收集, 放到 sys 模块的path 属性中(sys.path)。
使用sys.path查看和临时修改搜索路径
pythonpath环境变量的设置
windows 系统中通过如下操作添加和设置 pythonpath 环境变量。
和java添加环境变量一样,
.pth文件的写法
在site-packages 目录下添加.pth文件。并在文件中增加内容:
#一行一个目录
g:\a
g:\b
g:\c
【注】
当完成了某个模块开发后,可以将他对外发布,其他开发者也可以以“第三方扩展 库”的方式使用我们的模块。按照如下步骤即可实现模块的发布:
from distutils.core import setup
setup(
name='baizhanMath2', # 对 外 我 们 模 块 的 名 字
version='1.0', # 版 本 号
description='这是第一个对外发布的模块,测试哦', # 描 述
author='wps', # 作 者
author_email='[email protected]',
py_modules=['baizhanMath2.demo1','baizhanMath2.demo2'] #要发布的模块
)
python setup.py sdist
将发布安装到你的本地计算机上。仍在 cmd命令行模式下操作,进 setup.py所在目 录,键入命令:
python setup.py install
安装成功后,进入 python目录/Lib/site-packages 目录(第三方模块都安装的这 里,python解释器执行时也会搜索这个路径):
安装成功后,直接使用 import 导入即可。
import baizhanMath2.demo1
将自己开发好的模块上传到 PyPI网站上,将成为公开的资源,可以让全球用户自由使 用。按照如下步骤做,很容易就实现上传模块操作。
注册PyPI网站
注册 PyPI网站:http://pypi.python.org
【注意】会发送一封邮件到你的邮箱。请点击验证后继续下面的步骤。
创建用户信息文件.pypirc
·方式 1: 使用命令(适用 Linux)
输入并执行后 python setup.py register ,然后输入用户名和密码,即可。
·方式 2:使用文件(适用 windows,Linux) 在用户的家目录里创建一个文件名为.pypirc, 内容为:
[distutils] index-servers=pypi
[pypi] repository = https://upload.pypi.org/legacy/
username = 账户名
password = 你自己的密码
【注】
Linux的家目录: ~/.pypirc
Windows 的家目录是: c:/user/用户名
在windows 下直接创建不包含文件名的文件会失败,因此创建时文件名为“.pypirc.”, 前后都有两个点即可。
上传并远程发布
进入 setup.py文件所在目录,使用命令“python setup.py sdist upload”,即可以 将模块代码上传并发布。
管理你的模块
登录 pypi官网,可以看到: 如果你的模块已经上传成功,那么当你登录PyPI 网站后应该能在右侧导航栏看到管理 入口。
点击包名进去后你可以对你的模块进行管理,当然你也可以从这里删除这个模块。
模块发布完成后,其他人只需要使用pip就可以安装你的模块文件。比如:
pip install package-name
如果你更新了模块,别人可以可以通过–update 参数来更新:
pip install package-name update
Python中库是借用其他编程语言的概念,没有特别具体的定义。模块和包侧重于代码 组织,有明确的定义。
一般情况,库强调的是功能性,而不是代码组织。通常将某个功能的“模块的集合”, 称为库。
Python拥有一个强大的标准库。Python 语言的核心只包含数字、字符串、列表、字典、 文件等常见类型和函数,而由 Python 标准库提供了系统管理、网络通信、文本处理、数据 库接口、图形系统、XML 处理等额外的功能。
Python标准库的主要功能有:
目前学过的有:random、math、time、file、os、sys 等模块。可以通过 random模 块实现随机数处理、math 模块实现数学相关的运算、time 模块实现时间的处理、file 模块 实现对文件的操作、OS 模块实现和操作系统的交互、sys 模块实现和解释器的交互。
强大的标准库奠定了python发展的基石,丰富和不断扩展的第三方库是python 壮大 的保证。PyPI官网:https://pypi.org
发布的第三方库达到了十多万种,众多的开发者为 Python 贡献了自己的力 量。
表 常用第三方库大汇总
PyPI(Python Package Index)是python官方的第三方库的仓库,所有人都可以下载第三 方库或上传自己开发的库到 PyPI。PyPI 推荐使用 pip包管理器来下载第三方库。
pip 是一个现代的,通用的 Python 包管理工具。提供了对 Python 包的查找、下载、安 装、卸载的功能。pip可正常工作在 Windows、Mac OS、Unix/Linux 等操作系统上,但 是需要至少2.6+和3.2+的CPython或 PyPy的支持。python 2.7.9 和3.4 以后的版本已 经内置累 pip程序,所以不需要安装。
第三方库有数十万种之多,以 pillow 库为例讲解第三方扩展库的安装。pillow 是 Python平台事实上的图像处理标准库。
第一种方式:命令行下远程安装
以安装第三方 pillow图像库为例,在命令行提示符下输入:pip install pillow 安装完成后,我们就可以开始使用。
安装完,输入 pip show pillow, 进行确认。
第二种方式:Pycharm中直接安装到项目中
在Pycharm 中,依次点击:file–>setting–>Project 本项目名–>Project Interpreter,点击“+”,然后输入要安装的第三方库“pillow”,再点击按钮“Install Package”,等待 安装即可,几秒种后,即提示安装成功。
这样,就可以在项目中直接使用第三方库 pillow了。