大家好,我是淘小白!
今天来说下微信公众号历史记录文章采集的教程和思路,希望能够帮助的到大家~
1、历史消息入口
现在新版本的微信已经找不到历史记录的入口了,需要对这个入口进行拼接,方法如下:
随便找一篇作者的文章,浏览器中打开,查看源代码:
提取这个字段,拼接成下面的网址;
https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=Mzg4MDk0NzA3Mg==&scene=124#wechat_redirect
biz=后面的就是我们需要替换的字段;
现在我们提取到这个历史记录的链接了,然后再继续往下操作。
2、把拼接好的链接发给任意好友,或者发给文件传输助手
3、打开链接查看是否是历史文章页面
4、进入到这个页面往下拉,我们可以看到是历史文章页面,那么下面我们就需要对这个页面进行抓包了
5、使用的工具是fiddler,fiddler需要进行简单的设置,安装一下证书
fiddler可以正常抓包之后,然后我们下拉微信公众号的历史记录页面,会得到下面的抓包数据。
6、抓包
如下图所示:
文章页网址数据:
提取到文章页的网址之后,就是内容的采集了在,这里就不做详细的介绍了。
7、注意事项:
7.1微信历史文章的列表页是有时效性的,失效了就得抓包
7.2在采集的时候,注意使用微信客户端的请求头和cookie
7.3fiddler要好好设置一下,不懂设置的,可能会报443,设置好之后,就可以正常抓包了,不懂的可以百度一下
7.4这里只是给大家写一个思路,按照这个思路来写就可以了。
8、演示视频
Python微信公众号历史文章采集演示视频