beautifulsoup获取script标签内的指定键的值

比如要获取pubDate的值,可以通过如下方式实现:

pubDate=json.loads(bs.find('script', {'type': 'application/ld+json'}).get_text())["pubDate"]

也就是要用到json库,通过find()以及get_text()获取标签整体内容,为字符串格式。将此字符串传递给json.loads()即可得到一个字典对象,再通过["键"]的方式即可得到对应的值

 

上面对应的输出结果如下

你可能感兴趣的:(python,爬虫)