基于数据加密进行反爬

1. 通过自定义字体来反爬

反爬思路:使用自定义字体文件

解决思路:切换到手机版/解析字体文件进行翻译

2. 通过css来反爬

反爬原理:源码数据不为真实数据,需要通过css位移才能产生真实数据

解决方法:计算css的偏移

3. 通过js动态生成数据进行反爬

反爬原理:通过js动态生成

解决思路:解析关键js,获得数据生成流程,模拟生成数据

4. 通过编码格式进行反爬

反爬原理:不使用默认编码格式,在获取响应之后,通常爬虫使用utf-8格式进行解码,此时解码结果将会是乱码或者报错

解决思路:根据源码进行多格式解码,获取真正的解码格式

你可能感兴趣的:(爬虫)