python爬取微信小程序中的内容

1. 打开微信小程序,读取完成。手机端备份微信(建议先清理微信,只留需要的微信小程序)。将文件发送至电脑端。

2.解压文件,获取.wxapkg文件(目录:E:\文件\2018-1121-150948\App\com.tencent.mm\MicroMsg\7f8cfdcb69afe1de135abf896d6612b3\appbrand\pkg)下方:_-620779444_58.wxapkg

3.将获取到的文件使用node.js进行反编译。可参考地址:(https://github.com/qwerty472123/wxappUnpacker),


python爬取微信小程序中的内容_第1张图片

需要安装node.js 。

将这八个文件放入同一目录下,并将.wxapkg文件放入在当前目录下启用命令行。

npm install esprima

npm install css-tree

npm install cssbeautify

npm install vm2       

npm install uglify-es

然后开始反编译:

node wuWxapkg.js D:\xxxxxxxxx.wxapkg 需要注意目录不要写错。

如果报错:Error: Cannot find module "xxxxxxxx" 就是需要安装xxxxxx


python爬取微信小程序中的内容_第2张图片

npm install xxxxxx 就行了。

地址写错会报:


python爬取微信小程序中的内容_第3张图片

4.使用微信小程序打开反编译好的文件。下载地址:(下载 · 小程序)。即可获取当前小程序中的HTML文件。



总结: 大神真的很牛逼,反编译反正我是看不懂。。。。。获取到的内容直接通过lxml bs4 re 进行提取即可。我也是个爬虫菜鸟。

你可能感兴趣的:(python爬取微信小程序中的内容)