scrapy(二) Item

    Items是将要装载抓取的数据的容器,它工作方式像python里面的字典,但它提供更多的保护,比如对未定义的字段填充以防止拼写错误。

    它通过创建一个scrapy.item.Item类来声明,定义它的属性为scrpy.item.Field对象,就像是一个对象关系映射(ORM).

    我们通过将需要的item模型化,来控制从dmoz.org获得的站点数据,比如我们要获得站点的名字,url和网站描述,我们定义这三种属性的域。要做到这点,我们编辑在目录下的items.py文件,我们的Item类将会是这样


from scrapy.item import Item, Field

class DmozItem(Item): 

    title =Field() 

    link = Field()

    desc = Field()


你可能感兴趣的:(scrapy(二) Item)