Python导出微信公众号文章

    平时我们可能需要把感兴趣的公众号的文章保存为pdf,方便离线查看,也可以避免某些文章被删除后看不到。所以我们需要把该公众号的文章批量导出为pdf。这里我们使用python来实现该功能。

1、导出该公众号的所有文章链接等信息为CSV文件。

     首先我们安装chrome的webscrapyer插件,用来爬取自己感兴趣的公众号的文章导出为CSV文件。文件保存文章的标题,时间和链接。具体插件的使用细节自己百度。

2、根据第一步生成的CSV文件批量导出为pdf

     首先我们安装wkhtmltopdf工具程序。然后编写程序来读取上一步得到的csv文件批量导出为pdf。这里由于微信的图片防盗链措施,直接根据url导出pdf会发现图片缺失。所以我们需要对请求得到的html文件进行处理后,再导出为pdf。具体核心代码如下:

     其中使用了线程池来加速处理生成pdf,本地测试一分钟可以导出90+篇文章。

     代码:GitHub

你可能感兴趣的:(Python导出微信公众号文章)