run.py里面有很多这样的代码。各个组件拿到run.py
Scheduler = load_cls(None, None, scheduler_cls)
load_cls方法
def load_cls(ctx, param, value):
if isinstance(value, six.string_types):
return utils.load_object(value)
return value
utils.load_boject()方法代码
def load_object(name):
"""Load object from module"""
if "." not in name:
raise Exception('load object need module.object')
module_name, object_name = name.rsplit('.', 1)
if six.PY2:
module = __import__(module_name, globals(), locals(), [utf8(object_name)], -1)
else:
module = __import__(module_name, globals(), locals(), [object_name])
return getattr(module, object_name)
import
其实就是导入包。感觉可以直接导入,没什么问题
>>>req = __import__('requests')
>>>req.get('http://www.baidu.com')
这里就相当于from module_name import object_name
module = __import__(module_name, globals(), locals(), [utf8(object_name)], -1)
getattr
getattr(object,name)和object.name是一样的功能.只不过这里可以把name作为一个变量去处理
path = getattr(sys, "path")
from . import xxx
这里其实就是一个相对引用。
pyspider作者为了使用这个相对引用,举个例子来说。
webui文件夹中init.py文件
from . import app, index, debug, task, result, login
这里相对引用导入app, index, debug, task, result, login等模块。
但是在run.py文件,应该怎么用呢。
if six.PY2:
module = __import__(module_name, globals(), locals(), [utf8(object_name)], -1)
else:
module = __import__(module_name, globals(), locals(), [object_name])
先用这样的代码导入init中的模块
例如
>>> app = 'pyspider.webui.app'
>>> module = __import__(module_name, globals(), locals(), [object_name]) #module 相当于 from pyspider.webui import __init__
之后,通过getattr拿到想要的对象或者方法
getattr(module,'app') #拿到webui/app这个模块
具体代码在github