Python-BeautifulSoup 实战(二):获取文章详细信息

上一篇的笔记中我们学习了如何通过 BeautifulSoup 获取作者的基本信息,这篇将按照同样的思路,用BeautifulSoup获取作者文章的信息(阅读次数、评论数、喜欢数和打赏次数)。

和之前一样,做好准备工作:

from bs4 import BeautifulSoup
import requests
url = 'http://www.jianshu.com/users/65ed1c462691/top_articles'
header = {'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:36.0) Gecko/20100101 Firefox/36.0'}
response = requests.get(url, headers=header)
html = response.text

上面的过程把作者的主页内容存储在了html中,接下来就是 BeautifulSoup 登场的时候了:

soup = BeautifulSoup(html, 'lxml')

我还是挑选重要的东西贴上来:

...

Python 代码就该是这种味道

  • 300

    Cescfangs ·

    PyQt5学习笔记(一): 来创建第一个PyQt应用吧!

    ...

    发现了什么?所有文章的题目都是在

    标签里,而文章的数据信息都是在

  • 你可能感兴趣的:(Python-BeautifulSoup 实战(二):获取文章详细信息)