阶段性理解scrapy

0)安装 scrapy

pip install scrapy


1)创建一个项目

scrapy startproject dmoz


2)采集

scrapy shell    #交换学习模式


scrapy crawl dmoz #自动采集模式


3)解析

response.xpath("/html/head/title")
response.css("title")


4)提取

response.css("title").extract() #全部提取
response.css("title").re('(\w+)') #根据正则提取


你可能感兴趣的:(scrapy)