python re import_完全搞懂Python 中的 import 与 from import

如下文章来源&做者:青南(谢乾坤)html

摄影:产品经理;kingname 的第一套乐高正则表达式

你好,我是谢乾坤,前网易高级数据挖掘工程师。现任微软最有价值专家(Python 方向),有6年 Python 开发经验,善于解决各类业务场景下的棘手问题,进一步提高代码质量。函数

对很多 Python 初学者来讲,Python 导入其余模块的方式让他们很难理解。何时用import xxx?何时用from xxx import yyy?何时用from xxx.yyy import zzz?何时用from xxx import *?学习

这篇文章,咱们来完全搞懂这个问题。编码

系统自带的模块

以正则表达式模块为例,咱们常常这样写代码:spa

import re

target = 'abc1234xyz'

re.search('(d+)', target)

但有时候,你可能会看到某些人这样写代码:code

from re import search

target = 'abc1234xyz'

search('(d+)', target)

那么这两种导入方式有什么区别呢?视频

咱们分别使用type函数来看看他们的类型:xml

>>> import re

>>> type(re)

>>> from re import search

>>> type(search)

以下图所示:htm

能够看到,直接使用import re导入的re它是一个module类,也就是模块。咱们把它成为正则表达式模块。而当咱们from re import search时,这个search是一个function类,咱们称呼它为search 函数。

一个模块里面能够包含多个函数。

若是在你的代码里面,你已经肯定只使用search函数,不会再使用正则表达式里面的其余函数了,那么你使用两种方法均可以,没什么区别。

可是,若是你要使用正则表达式下面的多个函数,或者是一些常量,那么用第一种方案会更加简洁清晰。

例如:

import re

re.search('c(.*?)x', flags=re.S)

re.sub('[a-zA-Z0-9]', '***', target, flags=re.I)

在这个例子中,你分别使用了re.search,re.sub,re.S和re.I。后二者是常量,用于忽略换行符和大小写。

可是,若是你使用from re import search, sub, S, I来写代码,那么代码就会变成这样:

import re

search('c(.*?)x', flags=S)

sub('[a-zA-Z0-9]', '***', target, flags=I)

看起来虽然简洁了,可是,一旦你的代码行数多了之后,你很容易忘记S和I这两个变量是什么东西。并且咱们本身定义的函数,也颇有可能取名为sub或者search,从而覆盖正则表达式模块下面的这两个同名函数。这就会致使不少难以觉察的潜在 bug。

再举一个例子。Python 的 datetime模块,咱们能够直接import datetime,此时咱们导入的是一个datetime模块,以下图所示:

可是若是你写为from datetime import datetime,那么你导入的datetime是一个type类:

由于这种方式导入的datetime,它就是Python 中的一种类型,用于表示包含日期和时间的数据。

这两种导入方式导入的datetime,虽然名字同样,可是他们的意义彻底不同,请你们观察下面两种写法:

import datetime

now = datetime.datetime.now()

one_hour_ago = now - datetime.timedelta(hours=1)

from datetime import datetime, timedelta

now = datetime.now()

one_hour_ago = now - timedelta(hours=1)

第二种写法看似简单,但实则改动起来却更为麻烦。例如我还须要增长一个变量today用于记录今日的日期。

对于第一段代码,咱们只须要增长一行便可:

today = datetime.date.today()

但对于第二行来讲,咱们须要首先修改导入部分的代码:

from datetime import datetime, timedelta, date

而后才能改代码:today = date.today()

这样一来你就要修改两个地方,反倒增长了负担。

第三方库

在使用某些第三方库的代码里面,咱们会看到相似这样的写法:

from lxml.html import fromstring

selector = fromstring(HTML)

可是咱们还能够写为:

from lxml import html

selector = html.fromstring(HTML)

可是,下面这种写法会致使报错:

import lxml

selector = lxml.html.fromstring(HTML)

那么这里的lxml.html又是什么东西呢?

这种状况多常见于一些特别大型的第三方库中,这种库能处理多种类型的数据。例如lxml它既能处理xml的数据,又能处理html的数据,因而这种库会划分子模块,lxml.html模块专门负责html相关的数据。

本身来实现多种导入方法

咱们如今本身来写代码,实现这多种导入方法。

咱们建立一个文件夹DocParser,在里面分别建立两个文件main.py和util.py,他们的内容以下:

util.py文件:

def write():

print('write 函数被调用!')

main.py文件:

import util

util.write()

运行效果以下图所示:

如今咱们把main.py的导入方式修改一下:

from util import write

write()

依然正常运行,以下图所示

 当两个文件在同一个文件夹下面,而且该文件夹里面没有__init__.py 文件时,两种导入方式等价。

如今,咱们来建立一个文件夹microsoft,里面再添加一个文件parse.py:

def read():

print('我是 microsoft 文件夹下面的 parse.py 中的 read函数')

以下图所示:

此时咱们在 main.py中对它进行调用:

parse.read()

运行效果以下图所示:

咱们也能够用另外一种方法:

from microsoft.parse import read

read()

运行效果以下图所示:

可是,你不能直接导入microsoft,以下图所示:

你只能导入一个模块或者导入一个函数或者类,你不能导入一个文件夹

不管你使用的是import xxx仍是from xxx.yyy.zzz.www import qqq,你导入进来的东西,要不就是一个模块(对应到.py 文件的文件名),或者是某个.py 文件中的函数名、类名、变量名。

不管是import xxx仍是from xxx import yyy,你导入进来的都不能是一个文件夹的名字。

可能有这样一种状况,就是某个函数名与文件的名字相同,例如:

在 microsoft文件夹里面有一个microsoft.py文件,这个文件里面有一个函数叫作microsoft,那么你的代码能够写为:

from microsoft import microsoft`

microsoft.microsoft()

但请注意分辨,这里你导入的仍是模块,只不过microsoft.py文件名与它所在的文件夹名刚好相同而已。

总结

不管是使用import仍是from import,第一个要求是代码可以正常运行,其次,根据代码维护性,团队编码风格来肯定选择哪种方案。

若是咱们只会使用到某个模块下面的一个函数(或者常量、类)而且名字不会产生混淆,可识别性高,那么from 模块名 import 函数名这没有什么问题。

若是咱们会用到一个模块下面的多个函数,或者是咱们将要使用的函数名、常量名、类名可能会让人产生混淆(例如 re.S、re.I),那么这种状况下,import 模块名而后再 模块名.xxx来调用会让代码更加清晰,更好维护。

但不管什么状况下,都禁止使用from xxx import *这种写法,它会给你带来无穷无尽的噩梦。

更多内容

Python 开发中的坑不在少数。不只会严重破坏代码的稳定性,还会影响项目代码开发效率,自身的职业发展甚至是工做状态。

其实,咱们并非不想解决问题、并非甘于编写所谓“漏洞百出”的代码。只是不知道问题出在哪里、为何会出现、应该怎样修改。

多年的业务开发,我详尽记录了多个真实发生的错误、坑点,并提炼出 42 章节的《Python 业务开发常见错误案例集》视频课程。

错误坑点主要分为代码编写、开发思想两类。

你可能感兴趣的:(python,re,import)