百度文库内容收集方法

前两天,前领导又给我出了个难题,从微信上发了个链接给我问我能不能下载下来。

我打开,是这样的。

百度文库内容收集方法_第1张图片

以前有冰点文库下载,很久之前就不更新不能用了之后用油猴好像搞过,但是现在的油猴好像上面的代码也搞不定了,只能把前面的一两页下载下来,后面就算手动把页面展开了,也下载不了上面的文字内容,其实图片版的pdf也只能下载前面这两页,但是这个文件至少十页左右啊。于是百度了一下,在知乎上发现有人推荐了个软件,稻壳阅读器,果然还中用。

理论上讲,将百度文库的文档链接复制粘贴到稻壳阅读器上是可以直接打开的,但是事实上,我们这位前领导发给我的链接在电脑上打开都是手机格式显示的,肯定是有啥毛病,所以在稻壳上打开的时候它是这样的

百度文库内容收集方法_第2张图片

一个字也看不到。

后来发现其实不是这一篇文章看不到,是这个软件只要输入百度文库的地址就啥也看不到。

 

但是这个软件自带的搜索功能是可以用的。直接搜索就可以看到同样的文章。

百度文库内容收集方法_第3张图片

但是当你点击下载按钮的时候你会发现,它喵的,这也是要钱的

百度文库内容收集方法_第4张图片

但是文字在这个阅读器里其实是可以直接选中复制的,可以把它全选再复制到word里,然后进行编辑,但是图片是要一个一个单独复制的。这也太麻烦了吧?!那我们如果直接保存呢?它是xdf格式,喵个咪的,这叫啥格式?!

好吧,我直接打印成pdf吧。省事,省心,但是估计领导是没办法二次编辑了,它应该就是个图片格式的pdf了。

 

你可能感兴趣的:(其他,其他)