下载网页上的文章并将其保存成PDF格式以及去除掉不想打印的部分的方法

比如我要下载如下图所示的这篇文章,仅下载文章标题和正文部分(一般情况):
注:以谷歌浏览器为例
下载网页上的文章并将其保存成PDF格式以及去除掉不想打印的部分的方法_第1张图片
首先,选中要下载的部分,然后右键,选择打印,就得到如下所示结果:
下载网页上的文章并将其保存成PDF格式以及去除掉不想打印的部分的方法_第2张图片
然后根据你的要求在左侧给的选项中选择你的设置形式:
下载网页上的文章并将其保存成PDF格式以及去除掉不想打印的部分的方法_第3张图片
设置完之后,保存即可。
如果我想将新华网的标志也打印上的话(特殊情况),就需要也将这部分选中,再右键打印(注意:将光标悬在文字部分右键打印)。但是,我们会发现总会将右边的搜索框也选中:

下载网页上的文章并将其保存成PDF格式以及去除掉不想打印的部分的方法_第4张图片
要是遇到这种情况,我们可以,鼠标右键——》查看网页源代码,Ctrl+A选中所有内容,复制,将其粘贴到新建的一个.html文档中(简单粗暴操作,新建一个文本文档,将其后缀名改成html),以文本编辑器将其打开进行编辑。
先不急着编辑html文档。再次返回到网页,光标悬于搜索标志之上,右键——》检查:

在这里插入图片描述
可以看到这部分就是搜索框对应的html部分:
下载网页上的文章并将其保存成PDF格式以及去除掉不想打印的部分的方法_第5张图片
打开粘贴有刚才复制的html文档,Ctrl+f,根据关键词“screach”找到这部分,将其删掉,保存。以浏览器方式打开该html文档,如下:
下载网页上的文章并将其保存成PDF格式以及去除掉不想打印的部分的方法_第6张图片
现在,没有了搜索框那部分了。好像还有个Edition在右边:
在这里插入图片描述
以相同的操作,将光标指向上图所示地方,右键-》检查,
下载网页上的文章并将其保存成PDF格式以及去除掉不想打印的部分的方法_第7张图片
根据关键词“sreach_box f1”迅速定位到html文档中的这部分,并将其删除,再以浏览器方式打开,得到如下所示图:
下载网页上的文章并将其保存成PDF格式以及去除掉不想打印的部分的方法_第8张图片
没有了多余的部分了。然后选中新华网图标以及正文部分,右键打印保存为PDF文件即可。
下载网页上的文章并将其保存成PDF格式以及去除掉不想打印的部分的方法_第9张图片
遇到其他类似这种情况,可以参考上面的步骤来。
这样做还有一个问题,就是你打印的左下角的页脚中的地址会是你保存html文档的路径,而原网页打印的话,会是该网页的网址,你可以用原网页打印的地址替换这部分地址即可。

你可能感兴趣的:(Skill)