爬虫进阶之路---处理字体反爬(以解决58同城官网字体反爬为例)

网站截图:

爬虫进阶之路---处理字体反爬(以解决58同城官网字体反爬为例)_第1张图片

最终处理结果:(获取网站中的出租标题及其价钱!)

爬虫进阶之路---处理字体反爬(以解决58同城官网字体反爬为例)_第2张图片





下面两张图是保存的自定义字体文件的xml格式文件!
此图是文章中:unicode编码(图中的code,16进制格式),和glyph编号,和 id(对应的就是下面第三个图中每个字符,第一个id为0,以此类推!)之间存在对应关系

你可能感兴趣的:(爬虫高级,python,乱码,unicode,字体反爬,58同城)