一次下载的小说txt章节优化记录

缘由:

在线阅读小说有时候因为网络等因素,造成章节不能及时刷新出来,因此经过一番百度,把小说章节下载了下来,但是 章节是错乱的,且参杂很多网站水印,阅读起来挺难受的,因此 优化一下吧。

首先放图:

调整前:

一次下载的小说txt章节优化记录_第1张图片

调整后:

一次下载的小说txt章节优化记录_第2张图片

嗯~ 看起来顺眼多了 

首先打开原始小说,查找要调整的地方,依据小说文本的规则进行调整 即可

首先看原始txt

一次下载的小说txt章节优化记录_第3张图片

1. 每个章节 都是阿拉伯数字 + 顿号 + 章节标题 组成
2. 每个章节 结尾都包含两行网站水印

3. 经过全局搜索 部分内容 参杂 xxx.com 内容

经过判断解决以上问题 即可

操作步骤:

1. 读取 按行读取原始内容
2. 替换
       2.1 替换章节

       2.1.1 判断以阿拉伯数字开头 且 包含 顿号 且 包含 (xxx.com) 的行内容

       2.1.2 替换 (xxx.com) 为空

       2.1.3 写一个阿拉伯数字 转 一二三的函数

       2.1.4 组合 第 + 一二三 + 章 + 章节标题 + 换行符

      2.2 替换章节结尾水印

        2.2.1  判断行内容 大致包含结尾水印内容 替换为空 

      2.3 替换部分html 内容

        2.3.1 判断行内容 大致包含xxx.html  替换为空

3. 写入

        3.1 创建新的txt, 按行写入即可,数据量大的可以使用 缓存或者分批操作

        

你可能感兴趣的:(个人随笔,go,小说,生活)