编码问题


遇到被 \x 转义了的页面: 因为有中文的原因,传输前会被转码。


图片.png
>>> b"//search.jd.com/Search?keyword=\xe9\xa6\x86\xe6\xb0\xb4\xe6\x9e\x9c&enc=utf-8&wq=\xe9\xa6\x86&pvid=b4wpi5ji.v6q1bw".decode("utf-8")
'//search.jd.com/Search?keyword=馆水果&enc=utf-8&wq=馆&pvid=b4wpi5ji.v6q1bw'

>>> t=b"//search.jd.com/Search?keyword=\xe9\xa6\x86\xe6\xb0\xb4\xe6\x9e\x9c&enc=utf-8&wq=\xe9\xa6\x86&pvid=b4wpi5ji.v6q1bw"
>>> t
b'//search.jd.com/Search?keyword=\xe9\xa6\x86\xe6\xb0\xb4\xe6\x9e\x9c&enc=utf-8&wq=\xe9\xa6\x86&pvid=b4wpi5ji.v6q1bw'
>>> t=bytes(t).decode("utf-8")
>>> t
'//search.jd.com/Search?keyword=馆水果&enc=utf-8&wq=馆&pvid=b4wpi5ji.v6q1bw'

你可能感兴趣的:(编码问题)