Python web —— webbrowser + feedparser 网络爬虫刷博器

强大的 Python,强大的 Python web。

我们以 csdn 上的博客文章为例,

  • (1)使用 feedparser 根据 rss 地址,解析前 20 篇博客 url,添加到一个 list

  • (2)用 webbrowser 迭代打开 list 中的 blog url,

  • (3)因为网页资源十分地消耗内存,我们设置每打开 5 个 url,则调用 cmd 命令强制终止浏览器进程。

import webbrowser as web
import time
import os
import feedparser

d = feedparser.parse('http://blog.csdn.net/lanchunhui/rss/list')
blog_urls = [entry.id for entry in d.entries]

cnt = 0
for url in blog_urls:
    web.open_new_tab(url)
    cnt += 1
    time.sleep(3)
    if not (cnt % 5):
        os.system('taskkill -F -IM SogouExplorer.exe')

References

[1] 网络刷博器

你可能感兴趣的:(Python web —— webbrowser + feedparser 网络爬虫刷博器)