基于JS爬虫的二九小说网小说抓取系统

更新:

先前版本为顺序抓取,更新后版本为并行抓取,抓取速度更快
使用方法与之前基本相同,取消了抓取暂停功能

1.简介

    这是一款基于Electron-Vue的桌面应用程序。
    应用链接地址为:https://github.com/ckxin/Novel-Capture-System.git
    该应用利用JS爬虫可以对二九小说网里的小说进行抓取并保存到本地。抓取速度取决于你当前的网速和该网站服务器当前状态。软件界面如下图所示:

应用界面

2.使用方法

下面我们以《微微一笑很倾城》这本小说为例,介绍一下具体使用方法:

1)输入小说目录网址
    点击网站首页地址打开该小说网站,搜索要抓取的小说打开目录页,将目录网址复制粘贴到对应小说目录网址输入框。如下图所示:

单击打开首页
输入书名搜索
小说目录页
粘贴小说目录网址

2)输入小说名称
    比如我们要下载的是《微微一笑很倾城》,就在对应小说名称输入框输入微微一笑很倾城,如下图所示:

输入或粘贴小说名称

3)选择存储路径
    点击选择存储目录按钮,选择你要存储的目录。

选择小说存储路径

    选择完成后,该按钮会显示你选择的路径

显示路径

4)开始抓取小说
    确认以上信息全部填写正确后,点击开始抓取按钮,即可开始抓取小说。

开始抓取

注意:请确保小说目录网址填写正确,否则可能出现网络错误

    抓取开始后开始抓取按钮会被禁用(即禁止再次点击),并切换为抓取中...,直到该小说成功抓取完毕或人为停止任务才会恢复。

按钮禁用

5)抓取过程

    开始抓取后下方抓取详细信息出会出现抓取过程当前状态

抓取状态1

抓取状态2

    抓取详细信息区域有两个按钮,一个是暂停按钮,一个是关闭(停止)按钮。

暂停和结束按钮

    点击暂停按钮会暂停抓取过程,并将暂停按钮转变为继续按钮。

暂停状态与继续按钮

    点击继续按钮将会继续先前的抓取过程:

继续抓取

    点击关闭(停止)按钮会结束当前抓取任务并清空已抓取内容,并将系统初始化。

停止任务
初始化系统

6)任务完成
    任务完成后会显示小说抓取完毕!状态,并恢复开始抓取按钮。

抓取完成

3.错误及应对方式

    暂时还未遇到错误,但有可能会由于网速或小说网站服务器的原因出现以下错误:
    错误1:抓取状态长时间不发生改变,好像系统卡住了。
    解决方法:检查本机网络是否出现问题,打开相应小说目录页或章节页查看小说网站是否出现问题。若均没有问题,可选择继续等待,等系统重新请求小说网站成功后即会继续抓取。或:首先点击暂停按钮,然后点击关闭按钮取消任务,并重新开始。
注:此时可能无法暂停成功,不用管,依次点击暂停和关闭按钮就好,具体原因参照:错误2

    错误2:抓取过程中无法暂停或停止成功。即点击暂停按钮状态栏总显示正在暂停...却无法切换到暂停中...从而暂停成功,或点击关闭按钮总显示正在停止...却无法停止成功。
    原因:系统在抓取过程中总是在完成当前章节抓取后才会响应暂停或关闭事件。当系统正在请求某一章节却无法请求成功从而不断重新请求时,就会导致当前无法响应暂停或关闭事件。
    解决办法:可能还是网络问题,参考错误1解决办法检查网络是否出现问题。若网络无问题,则继续以下步骤:此时若只是想暂停,则点击完暂停按钮后等待状态转换即可,当系统重新请求成功时就会暂停成功。若是想停止任务,则参考错误1解决办法,依次点击暂停,关闭按钮即可。
注:我设置了暂停状态下强行停止任务的方法,因此依次点击暂停和停止按钮即可停止任务,但注意,此操作同样会清空已完成内容,并不可逆,慎点。

你可能感兴趣的:(基于JS爬虫的二九小说网小说抓取系统)