Python爬虫如何获取动态内容-下

上节我们是说了如何获取到动态的数据,那么现在就来说说如何获取到你想要的数据。

目前我所遇到的有两种情况。

第一种:

Python爬虫如何获取动态内容-下_第1张图片

这种的json形式我任务是比较正常的格式,一个{}里面有一个[],[]里面则是数据信息

对于这种,可采用以下方式来获取数据,比如aid,author等信息

d_hot = d_json['recommend']['list']
这样一行代码就找到了json里两个标签名里面的内容,获取的是许多信息所组成的数组,根据迭代即可获得每一条数据

v.append(d['title'])
v.append(d['pic'])
v.append(temp_link + d['aid'])
每条数据就通过[XXX]类似的方式来获取即可。

第二种:

Python爬虫如何获取动态内容-下_第2张图片

首先这里乍一看和第一种没有什么区别。我当时也是没仔细看直接用第一种方法来得数据,结果一直获取的是0~7无序的数字。

再仔细看这种情况后,可以发现这里list下一层是{},不同于[]。因此,还得再进一步深入。

ID = ['0', '1', '2', '3', '4', '5', '6', '7']
data = []
for i in ID:
    data.append(p_json['recommend']['list'][i])
定义一个数组,ID循环,获取一个一个的数据放入数组即可。

之后和第一种情况就一样咯。


你可能感兴趣的:(python)