Scrapy 安装

1.安装 lxml (使用xpath)

2.安装 zope.interface

3.安装 twisted

   出错先安装 sudo apt-get install build-essential python-dev

4.安装 pyOpenSSL

5.安装 pywin32

6.安装Scrapy 

 windows需要安装vs linux需要安装g++

一  生成tutorial项目执行

      scrapy startproject tutorial

二  用pycharm打开项目在spiders文件夹下创建一个dmoz_spider.py

  

__author__ = 'weilunhui'



# import scrapy

from scrapy.contrib.spiders import CrawlSpider





class DmozSpider(CrawlSpider):

    name = "douban"

    start_urls = [

        "http://movie.douban.com/top250"

    ]



    def parse(self, response):

        print(response.body)

三 在tutorial 下(含有scrapy.cfg文件的地方)执行

      scrapy crawl douban     ("douban"是和上面的dmoz_spider.py里的name保持一致)

  运行结果会显示抓取下来的网页的内容

你可能感兴趣的:(scrapy)