微信公众号历史文章采集教程思路

大家好,我是淘小白!

今天来说下微信公众号历史记录文章采集的教程和思路,希望能够帮助的到大家~

1、历史消息入口 

现在新版本的微信已经找不到历史记录的入口了,需要对这个入口进行拼接,方法如下:

随便找一篇作者的文章,浏览器中打开,查看源代码:

微信公众号历史文章采集教程思路_第1张图片

提取这个字段,拼接成下面的网址;

https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=Mzg4MDk0NzA3Mg==&scene=124#wechat_redirect

biz=后面的就是我们需要替换的字段;

现在我们提取到这个历史记录的链接了,然后再继续往下操作。

2、把拼接好的链接发给任意好友,或者发给文件传输助手

微信公众号历史文章采集教程思路_第2张图片

3、打开链接查看是否是历史文章页面

微信公众号历史文章采集教程思路_第3张图片

4、进入到这个页面往下拉,我们可以看到是历史文章页面,那么下面我们就需要对这个页面进行抓包了

5、使用的工具是fiddler,fiddler需要进行简单的设置,安装一下证书

微信公众号历史文章采集教程思路_第4张图片

fiddler可以正常抓包之后,然后我们下拉微信公众号的历史记录页面,会得到下面的抓包数据。

6、抓包

微信公众号历史文章采集教程思路_第5张图片 这样我们就可以看到列表页,和列表页数据下面的内容页网址了

如下图所示:

微信公众号历史文章采集教程思路_第6张图片

文章页网址数据:

微信公众号历史文章采集教程思路_第7张图片提取到文章页的网址之后,就是内容的采集了在,这里就不做详细的介绍了。

7、注意事项:

7.1微信历史文章的列表页是有时效性的,失效了就得抓包

7.2在采集的时候,注意使用微信客户端的请求头和cookie

7.3fiddler要好好设置一下,不懂设置的,可能会报443,设置好之后,就可以正常抓包了,不懂的可以百度一下

7.4这里只是给大家写一个思路,按照这个思路来写就可以了。

8、演示视频

Python微信公众号历史文章采集演示视频

你可能感兴趣的:(python)