某数加密的流程与原理简析

啃了这么长时间,基本上已经把某数的套路摸了个八九不离十,不愧是中国反爬界的集大成者,感觉收获满满,这里就简单记录一下分析成果。
注意:某数在不同的网站上有不同的版本,其流程也略有不同,这里的流程不一定适用于其它网站。

工具和资料

  • 之前的文章1 - 记录了之前尝试的其它方法
  • 之前的文章2 - 对加密混淆后的js的一些初步分析
  • awesome-java-crawler - 我收集的爬虫相关工具和资料
  • java-curl - 我编写的java HTTP库
  • 另一个用了某数加密的网站的破解SDK

前端流程

  1. 请求页面,返回应答;如果有之前生成的有效FSSBBIl1UgzbN7N80T cookie值,请求时须带上。
  2. 应答的html中,包含以下关键数据:

    • 元素的content,这是加密后的数据,里面包含字符串映射表、全局方法映射表、加解密算法密钥等;注意有些网站的meta.id不同

你可能感兴趣的:(某数加密的流程与原理简析)