在日常的学习过程中,时常需要将网页中的内容存档。直接复制有时候费时费力。
往往我们就会选择将网页的所有内容保存为pdf。
通常我们会使用Ctrl+P快捷键,直接打印网页,这样做虽然比较简单,但网页的文字无法复制,排版还会出现问题。
倘若我们会正确使用 SingleFile 这一浏览器插件和 wkhtmltopdf 命令行工具,上述问题将迎刃而解。
操作步骤:
直接在浏览器的扩展中心下载并安装即可(以Edge浏览器为例)
点击右上角三个点进入设置与其他下拉选项菜单,点击扩展
接下来点击管理扩展
点击获取Microsoft Edge扩展
搜素SingleFile
点击获取即可完成安装。
以上几步就完成了SingleFile这个插件的安装。
接下来,下载wkhtmltopdf
网站的下载地址为:wkhtmltopdf
在笔者的下载过程中,小红框的所框住的7z格式的压缩文件,下载速度比较快。上面的installer下载速度特别特别特别慢(不知道是不是我网络的问题),还总是失败,因此我建议下载7z压缩包。
下载后直接解压即可,无需安装,放在所想放在的位置即可。
打开命令行win+R,输入cmd
键入wkhtmltopdf -v
对于不同的操作系统可能会有需要设置环境变量的情况。如果你安装后在命令行执行 wkhtmltopdf -v 提示以下信息:
'wkhtmltopdf' 不是内部或外部命令,也不是可运行的程序 或批处理文件。
则需要配置环境变量。
我用的是Windows系统,我的安装到了F盘wkhtmltopdf目录下,所以我需要把 F:\wkhtmltopdf\bin 目录加入到系统变量 PATH条目 中即可。
添加完成后,再次键入wkhtmltopdf -v 命令
出现版本名字即代表安装成功(笔者系统里装的 wkhtmltopdf 的版本是 0.12.6)
比如说进入某一网页(本文以CSDN首页为例)
点击右上角的SIngleFile扩展,即可将网页保存为html格式(根据网页内容的多少,速度会有波动,稍等三到五秒,大部分网站都会下载成功)。
我们需要知道刚才保存HTML文件的路径地址,需要将cmd的地址调整到文件所在的文件夹下。例如,打开cmd,是在默认文件夹下
因为我把刚才的HTML文件保存在桌面,因此我们就需要进入桌面文件夹。
在cmd中键入该格式命令,然后按下回车键即可。
xxx代表文件名,xxx.html表示名为xxx的html文件,xxx.pdf表示名为xxx的pdf文件
wkhtmltopdf xxx.html xxx.pdf
显示Done即完成转换。
在xxx.html文件所在的文件夹下,则会出现xxx.pdf文件,即转换完成。
效果如下:
网页内的文字和对应位置的链接均可跳转,基本还原了网页的所有内容和功能。
熟练转换的操作步骤之后,十分方便,很大程度上提升效率和阅读体验。
同样,wkhtmltopdf还可直接输入网址进行转换,将xxx.html转化为网址即可。
希望本文能对大家有所帮助,如有帮助,欢迎大家点赞收藏!希望与大家共同进步!