学会这一招,我可以免费看小说了。

上周,老美有个小伙,看小说治好了毒瘾,真的是23333。国产小说犹如辣条一般,风靡一股世界风!作为一名大学生,看付费小说真的有点伤不起!随手百度一下子自己想看的小说,发现好多小说网站,而且他们这些网站是没经过作者的同意就把小说放上去,这种行为太无耻了!所以我觉得给他们的服务器增加点压力,写个爬虫爬下小说下来,来惩罚了这些无良小说网站,来我也可以看看小说。


步骤一
随便找到一个小说网站

学会这一招,我可以免费看小说了。_第1张图片
小说网站.png

步骤二
分析域名

学会这一招,我可以免费看小说了。_第2张图片
分析域名.png

我把域名后面的619223改为619224就变成第二章了,所以后面数字+1,章数就会+1啦。


步骤三
撸码


        //利用Jsoup获取这个网页的Html
        Document doc = Jsoup.connect(url).get();
        //通过浏览器F12,知道小说内容在Content里面
        Element contentOrigin = doc.getElementById("content");
        //拿出Content的内容
        String contentText = contentOrigin.html();
        //把
, 无用的字符换成空 String contentFinally= contentText.replaceAll("
| ",""); return contentFinally;

这时候我们其实就可以拿到一章小说,可是我们要很多章的,这时候就利用步骤二我们分析的url,用个循环自己获取下一章小说。
然后将每次获取到的小说加到我们的本地盘上。

PrintStream ps = new PrintStream(new FileOutputStream(new File("本地路径", "小说名.txt")));
ps.println("");//一开始用个空字符到小说里面,后面才追加新的小说内容
ps.append("下一章内容")//追加下一章内容

运行结果:

学会这一招,我可以免费看小说了。_第3张图片
运行结果.gif

最后结果:

学会这一招,我可以免费看小说了。_第4张图片
最后结果.gif

最后项目发布在Github: https://github.com/Elricyo/SpiderNovel

你可能感兴趣的:(学会这一招,我可以免费看小说了。)