scrapy爬虫之凤凰网热点新闻

初始化一个scrapy项目

scrapy startproject ifengHotNews 用scrapy初始化一个爬虫项目

scrapy爬虫之凤凰网热点新闻_第1张图片

import scrapy

class getIfengNews(scrapy.Spider):
    name = "hotNews"
    start_urls = ["http://www.ifeng.com/"]

    def parse(self, response):

        for con in response.xpath('//div[@id="headLineDefault"]/ul/ul[2]/li'):

            txt = con.xpath('a/text()').extract_first()

            yield {'title': txt}
  • 执行 scrapy runspider hotNews.py -o ./ifengHotNews.json
    scrapy爬虫之凤凰网热点新闻_第2张图片

  • 生成的文件
    scrapy爬虫之凤凰网热点新闻_第3张图片

你可能感兴趣的:(scrapy爬虫之凤凰网热点新闻)