python解析乱码ÍøÕ¾½éÉÜ,动态js查看隐藏url

解决思路:对请求到的网页内容进行编码操作后再进行解码操作

r = requests.get(url, headers=headers)
r = r.text
# print(r)
# 对解析到的r内容r编码后再解码
r = r.encode('ISO-8859-1')
# utf-8或gbk或其他
r = r.decode('utf-8')
print(r)
html = etree.HTML(r)
title = html.xpath('//*[@class="title-prefix"]/text()')

点击网页内容改变url不变:

将network中动态js的请求地址做为真实url,进行网页解析

python解析乱码ÍøÕ¾½éÉÜ,动态js查看隐藏url_第1张图片

需要的html的url就都在网页了,json字符串转换,提取url
python解析乱码ÍøÕ¾½éÉÜ,动态js查看隐藏url_第2张图片

你可能感兴趣的:(学习备忘)