参考:

https://www.cnblogs.com/bobo0609/p/6938012.html

https://docs.python.org/2/tutorial/modules.html


1.简介

在Python中,一个.py或者.pyc文件就称之为一个模块(Module)。即一个文件被看作一个独立的模块,一个模块也可以被看做是一个文件

.py:存放的是python源码

.pyc:存放的是python解释器对源码编译后的字节码


python把文件名去掉.py/.pyc后缀作为模块名,比如 os.py ,那么它的模块名就是 os


那么假设我们当前路径有个os.py,python怎么知道它的位置,并导入使用呢?

这里就涉及到python的模块搜索路径,它的搜索次序如下:

<1>当前路径

<2>PYTHONPATH变量自定义的路径(PYTHONPATH是系统自定义的环境变量,类似centos中的PATH)

<3>安装python时所定义的路径


有人会疑惑,python怎么知道我当前的路径在哪?


这是因为,python的程序包括一个顶层程序文件和其它的模块文件,这个顶层文件相当于程序执行的入口,类似shell脚本,我们执行脚本时必须写明绝对路劲或者切到对应路径去执行(这个时候路径就传递了),python也是同理


例子:


        [root@cqhdtest python_learn]# pwd
	/root/python_learn
	[root@cqhdtest python_learn]# cat getvalue.py
	#!/usr/local/anaconda2/bin/python
	x='Gx'
	y='Gy'
	z='Gz'
	def f1(x,y,z):
	    x='Ex'
	    z='Ez'
	    print x,y,z
	    def f2(x,y,z):
		x='Lx'
		print x,y,z
	    f2(x,y,z)
	f1(x,y,z)
	[root@cqhdtest python_learn]# cat index.py 
	import getvalue
	print x
	[root@cqhdtest python_learn]# python  index.py 
	Ex Gy Ez
	Lx Gy Ez
	Traceback (most recent call last):
	  File "index.py", line 2, in 
	    print x
	NameError: name 'x' is not defined



这里index.py作为程序入口导入了getvalue这个模块,显然,这里python找到了getvalue模块,因为程序执行到了print x,但是为什么会有"Ex Gy Ez"这些输出呢?


这是因为:python在首次导入模块(import 或者reload)的时候,会立即执行模块文件的顶层程序代码(不在函数内的代码,比如变量x'=Gx',函数定义def f1等,只要顶格写都会被执行),而位于函数主体内的代码直到函数被调用后才会执行,所以f1(x,y,z)函数被调用了,打印出了"Ex Gy Ez",而f1又自己调用了f2,所以f2函数打印了"Lx Gy Ez"


那么,既然模块有导入成功,x变量应该有定义,为何又提示“name 'x' is not defined”呢?


这是因为:为了避免大家的相同编程习惯导致各种变量覆盖(比如张三和李四被分派写两个不同的模块,张三习惯在他的变量中使用x,李四也习惯这样,那么当两个模块都被导入时,因为变量名相同,必然有一个的值会被覆盖掉),于是python在导入模块时,以模块名新建一个新的名称空间,在新的名称空间中创建变量。 简单地说,当导入getvalue模块的x变量的时候,此时x不再被当成x,而是被当成getvalue.x


例子:(接上例)

    [root@cqhdtest python_learn]# cat index.py 
	import getvalue
	print getvalue.x
	[root@cqhdtest python_learn]# python index.py 
	Ex Gy Ez
	Lx Gy Ez
	Gx


可以看见,此时的print 语句已经可以正常输出。


那么,如果我想随时随地可以导入getvalue模块,而又不想切到指定路径去,那么该怎么办呢?

这个时候,就要用到sys.path这个变量了


例子:


        In [2]: import sys

	In [3]: sys.path
	Out[3]: 
	['',
	 '/usr/local/anaconda2/bin',
	 '/usr/local/anaconda2/lib/python27.zip',
	 '/usr/local/anaconda2/lib/python2.7',
	 '/usr/local/anaconda2/lib/python2.7/plat-linux2',
	 '/usr/local/anaconda2/lib/python2.7/lib-tk',
	 '/usr/local/anaconda2/lib/python2.7/lib-old',
	 '/usr/local/anaconda2/lib/python2.7/lib-dynload',
	 '/usr/local/anaconda2/lib/python2.7/site-packages',
	 '/usr/local/anaconda2/lib/python2.7/site-packages/IPython/extensions',
	 '/root/.ipython']

	In [4]: sys.path.insert('/root/python_learn/')
	---------------------------------------------------------------------------
	TypeError                                 Traceback (most recent call last)
	 in ()
	----> 1 sys.path.insert('/root/python_learn/')

	TypeError: insert() takes exactly 2 arguments (1 given)

	In [5]: help (list.insert)


	In [6]: sys.path.insert(,'/root/python_learn/')
	  File "", line 1
	    sys.path.insert(,'/root/python_learn/')
	                    ^
	SyntaxError: invalid syntax


	In [7]: sys.path.insert(0,'/root/python_learn/')

	In [8]: sys.path
	Out[8]: 
	['/root/python_learn/',
	 '',
	 '/usr/local/anaconda2/bin',
	 '/usr/local/anaconda2/lib/python27.zip',
	 '/usr/local/anaconda2/lib/python2.7',
	 '/usr/local/anaconda2/lib/python2.7/plat-linux2',
	 '/usr/local/anaconda2/lib/python2.7/lib-tk',
	 '/usr/local/anaconda2/lib/python2.7/lib-old',
	 '/usr/local/anaconda2/lib/python2.7/lib-dynload',
	 '/usr/local/anaconda2/lib/python2.7/site-packages',
	 '/usr/local/anaconda2/lib/python2.7/site-packages/IPython/extensions',
	 '/root/.ipython']

	In [9]: import  getvalue
	Ex Gy Ez
	Lx Gy Ez

	In [10]: getvalue.x
	Out[10]: 'Gx'


python按照sys.path的顺序来查找模块,需要注意的是,insert方法需要两个参数,第一个是索引,这里使用0,放在第一位,优先查找我们自己的目录


如果我们再次import,python并不会再次执行顶层程序代码,而是简单地重载下内存中的对象


例子:

        In [29]: import getvalue

	In [30]: getvalue reload
	  File "", line 1
	    getvalue reload
	                  ^
	SyntaxError: invalid syntax


	In [31]: help(reload)


	In [32]: reload(getvalue)
	Ex Gy Ez
	Lx Gy Ez
	Out[32]: 



现在,模块加载没什么问题了,但是我觉得每次都要敲完整模块名getvalue,太烦人了,有没有什么办法呢?

这个时候就要用到import-as语句了


例子:


        In [33]: import getvalue as g

	In [34]: g.x
	Out[34]: 'Gx'



import xx  as x:把本来先创建名称空间名为getvlaue改成了g,所以调用就简单了,因为是修改所以此时getvalue这个名称空间是不存在的,所以不能用getvalue+'.'获取值


那么如果我比较任性,就想覆盖当前环境中的变量x呢?

这个时候就得用到from-import 语句了


例子:

        In [35]: from getvalue import x

	In [36]: x
	Out[36]: 'Gx'



from-import语句只会加载对应的属性或者方法到当前的名称空间,所以其他语句不会执行


所以python导入模块,大概分成以下几类:

import:直接导入

import Module as Module_alias:给变量取别名

from Module import Attribute/Method: 导入部分属性/方法

reload(Module):重新导入


既然作为模块,就该有作为模块的觉悟,一导入就瞎执行是会被clear的-_-!!

所以我们不该让模块中包含不该执行的语句,比如函数不该被调用。但是我又想这个模块文件有时作为程序顶层文件执行,有时作为模块被导入,那么有办法吗?


这个时候就可以用到内置属性__name__了


例子:


        [root@cqhdtest python_learn]# cp getvalue.py  New.py
	[root@cqhdtest python_learn]# vi New.py 
	[root@cqhdtest python_learn]# cat New.py 
	#!/usr/local/anaconda2/bin/python
	x='Gx'
	y='Gy'
	z='Gz'
	def f1(x,y,z):
	    x='Ex'
	    z='Ez'
	    print x,y,z
	    def f2(x,y,z):
		x='Lx'
		print x,y,z
	    f2(x,y,z)
	if __name__ == "__main__" :
	    f1(x,y,z)
	[root@cqhdtest python_learn]# python New.py 
	Ex Gy Ez
	Lx Gy Ez
	============================================
	In [6]: import New

	In [7]: New.x
	Out[7]: 'Gx'

	In [8]: reload(New)
	Out[8]: 

	In [9]: New.__name__
	Out[9]: 'New'


这里的内置变量__name__,如果程序是顶层文件则为"__main__",否则为模块名


2.import的工作机制(摘抄自:https://www.cnblogs.com/bobo0609/p/6938012.html)


import语句导入指定的模块时会执行3个步骤

1. 找到模块文件:在模块搜索路径下搜索模块文件

  程序的主目录

  PYTHONPATH目录

  标准链接库目录


2.编译成字节码:文件导入时会编译,因此,顶层文件的.pyc字节码文件在内部使用后会被丢弃,只有被导入的文件才会留下.pyc文件

3.执行模块的代码来创建其所定义的对象:模块文件中的所有语句从头至尾依次执行,而此步骤中任何对变量名的赋值运算,都会产生所得到的模块文件的属性

注意:模块只在第一次导入时才会执行如上步骤,后续的导入操作只不过是提取内存中已加载的模块对象,reload()可用于重新加载模块


 


包: 用于将一组模块归并到一个目录中,此目录即为包,目录名即为包名


包是一个有层次的文件目录结构,它定义了一个由模块和子包组成的Python应用执行环境


基于包,Python在执行模块导入时可以指定模块的导入路径 import pack1.pack2.mod1


每个包内都必须有__init__.py文件, __init__.py 可包含python代码,但通常为空,仅用于扮演包初始化、替目录产生模块命名空间以及使用目录导入时实现from*行为的角色