某网站高度加密混淆的javascript的分析

前言

对某网站加密混淆后的javascript代码也算分析了一段时间了,虽然还没搞出来,但多少有些心得,这里记录一下。

工具和资料

  • QQ群 - Javascript高级爬虫 - 作者自建群,欢迎加入!
  • awesome-java-crawler - 我收集的爬虫相关工具和资料
  • 中国商标网加密接口 - 仅作演示
  • 前一篇文章 - 记录了之前尝试的一些初步研究成果
  • java-curl - java HTTP库,可用来替换chrome网络后端,更方便控制底层行为,如缓存、代理、监控、修改请求和应答等
  • cdp4j - java版的Chrome Devtools Protocol实现,用于控制Chrome浏览器。最大的特点就是没有“特点”,你懂的……
  • beautifier.io - js代码在线格式化
  • estree - ECMAScript抽象语法树(AST)业界标准
  • ECMAScript262语言规范 - 帮助理解estree
  • acornjs - ECMAScript编译器前端,将js源码解析成estree格式的AST
  • astring - ECMAScript代码生成器,将AST重新还原成js源码
  • nashorn - java8以上自带的javascript解释器,性能接近原生node
  • java中调用npm模块 - 我的工作语言是java和kotlin,使用此方案调用js原生库
  • 商标局网站分析 - 类似的加密,神箭手云的大佬写的
  • 裁判文书网分析 - 另一篇类似网站分析
  • 很早的一篇分析文 - 看特征是这种加密的早期版本

分析过程

获取javascript代码

  • 加密的核心代码只有一小部分是直接写在网页的

你可能感兴趣的:(python,chrome-devtools,网站安全,网页爬虫,javascript)