xpath获取标签属性乱码解决(成长日记)

selector_new = etree.HTML(html.text)
是将HTML转化为文本/html 格式
selector_new = etree.HTML(html.content)
是将HTML转化为二进制/html 格式

我在获取xpath的标签属性时,怎么编码和解码都错了,网页的编码和用requests.get()的网页编码不一致,运用时用html.encoding打印出来
在这里插入图片描述
在这里插入图片描述
之后就可以解码啦
在这里插入图片描述
或者直接用selector_new = etree.HTML(html.content)
是将HTML转化为二进制/html 格式
xpath直接获取属性值就好了!

你可能感兴趣的:(xpath,xpath)