巧取网页中无法直接复制的文字

有些网站为了防止文章被直接粘贴走,当你进行复制时将弹出登录页面,这时你就必须进行登录,否则必须一字字敲出来,由于网页上显示的静态内容是由服务器一次性发送到浏览器上的(这样说不完全对,不与细纠),所以可以通过查看源码看到内容,比如360doc。

打开要看的内容后,右键中有选项查看源码或者类似什么什么源码的,选中后将会弹出源码页面,找到要粘贴的内容(耐心看源码,有时比较多,可能会在中间部分或者下面部分,如果你会html将会明白如何快速找),然后找到粘贴的文本复制,这时细心的会发现里面有很多其他格式符号。怎么去除呢,如果你选择一个个手动删除也是可以的,但是还有更快速的方法,即把带那些符号的文字粘贴到.txt的文本中,然后再把文件的后缀名改成.html,比如text.txt改成text.html,这样就成了一个简单的静态页面,然后直接拖到浏览器中,你就会看到取出那些符号的目的文本了。

这种方法大部分情况是可以取出文本的,如果遇到无法看源码的,可以换个浏览器,虽然有的网站不让看源码,但是是绝少数的绝少数,你不会这么幸运的碰到的。

你可能感兴趣的:(巧取网页中无法直接复制的文字)