文 / zChen85
0x00 写在最前
在一些大型的阅读平台和创作社区中,我们总能看到很多优质原创的读后感、书评、甚至是文学评论,有些书评的精彩程度甚至不亚于原著本身。当我们以一个读者的身份读完一本书想要写点什么的时候,是否也曾迷茫过不知如何下笔?
所谓工欲善其事必先利其器,我们要读好书,同时也要读好书评。这里的“好”可以从两个层面解读:一是质量上的好,一本好的书足以让你在读完后有想写一篇好的书评的冲动;另一层指的则是效率上的好,只有把一本好书真的读透读究竟了,方能写出真正高质量的书评。一篇好的书评也绝不是我们遵照什么框架模式甚至是所谓的范文能写出来的。它不仅要求我们积累足够大的书籍阅读量,同时在书评本身的阅读量上对我们也有一定的要求,后者则是那些畅销的《如何阅读一本……书》和教科书式的写作指南或方法论所无法带给我们的。那么问题来了,那么多那么优秀的书评,我们应该——
1)去哪里读?
即如何进行优质书评的大规模阅读。最直观的就是去看主流媒体上发表的书评期刊,比较有代表性的有新京报的书评周刊和晶报的深港书评。这些网站会定期刊登一些资深评论人的书评,含金量很高。可是,你是否也曾疲于每次都要花上一番功夫后才能找到某一期的书评?在这个快节奏的时代,这种最为原始的方法似乎并不可取。
于是,便有了聚合类导航网站,这些网站通常会搜集一些优质的书评期刊,然后对这些期刊的书评信息进行聚合和分类,其中读写人就是一个比较典型的代表。这类网站虽然提供的信息相对集中,但是由于其本质还是一个中转,读者还是需要点开每一个链接,而这些链接又会重新指回刚才所说的书评期刊。除此以外,第三种可能也是目前大众普及度更高的一种,那就是去一些主流的读书和创作社区读好的书评,但是信息量上的过剩和内容上的良莠不齐要求读者对信息有很强的甄别和过滤能力,另一方面,其丰富的社交性也会在一定程度上影响读者的专注度。
现在设想一下,如果你已经不需要再去一篇一篇找书评了,也不需要手动点开每篇书评的链接,更不需要再为那些无聊而令人反感的广告感到头疼,我们已经直接把这些优质的书评全部归档整理在一起直接放在你的面前,你是不是会有更冲动想要去阅读呢?
2)怎么读?
随之而来的第二个问题就是怎么读?我们或多或少都会纠结于以一种怎样的方式去进行阅读。从工具媒介上来分,无非就是电脑手机平板之类的电子终端,或者是打印出来的纸质版。即便是在这个所谓的智能时代,同一网页,同一个文档在电脑上、手机平板上、以及专用的阅读设备上所得到的阅读体验也是完全不同的,有的甚至可以用“不堪入目”来形容。而如果你想要追求更好一点的阅读体验效果,往往需要你按装这个那个的应用,接踵而来的又是付费买这个充那个的,等真的折腾完这些以后,你还记得你当是的初衷是什么吗?
再者,从方法论来讲,有的人选择“阅后即焚”,看过算过;高效人士会用一些网络笔记工具,将一些有用的信息保存下来,当然也有读(tǔ)者(háo)会选择直接打印出来看。不管是哪种方式,我们的目的都是要进行有意义的阅读,能把所接收到的内容在将来为我们所用,但这些方式都存在一些共通的问题:我们已经在信息的收集和整理上耗费了很多时间和精力,而这还只是个开始,等真的开始阅读的时候,又将面临大量冗余和碎片化的信息,进一步降低了阅读的专注度和效率。所以,最终极的问题就是:如何高效地阅读这些优质的书评?
3)怎么高效地读?
身处这个信息爆炸的时代,我们毕竟很难彻底避免和剔除所有无用的信息而仅仅专注于我们想要和需要关注的东西。虽然很难,但并不是完全没有好的解决方案。我们现在正在努力做的,正是帮你简化和解决前面提出的两个问题,然后把所有的重点都放在这第三个问题上。
我们编写了一个自动化工具,将这些优质的书评文章(目前主要是针对一些主流期刊)全部整合成排版精良的适合阅读的 PDF 文档。首先,这大大减少了读者自己去查找、整理书评的时间(节约了时间成本),我们能保证你看到的每一篇文章都是(广义上)优质的书评(毕竟一千个读者眼中就有一千个哈姆雷特)。其次,PDF 文档作为一种平台无关的文件格式,读者不管用什么媒介在什么终端上打开阅读,都能获得良好一致的阅读体验,当然如果有条件能打印出来看那效果更是极佳了(改进了阅读体验)。再者,我们在内容上也进行了加工,剔除了无用和冗余的信息,保证了读者在整个阅读过程中不会被这些信息所干扰(确保了专注程度)。最后,整合归档的意义当然在于信息的去碎片化,最大程度上的集中化,从此妈妈再也不用担心我们“书到用时方恨少”了,而整合后的内容不仅便于检索,也便于后期读者自己的二次处理(提升了管理效率)。当然,还有最为重要的一点是——
我们郑重承诺:所有整合后的资源文档都将永久性地无偿公开分享。
唠叨了那么多,下面进入正题。我们会列出目前已经整合了的资源,介绍我们整个的开发和整合流程,并展示整合后的最终效果图。
0x01 资源统计
资料来源 | 新京报 书评周刊 |
澎湃新闻 上海书评1 |
晶报 深港书评 |
南方都市报 阅读周刊 |
---|---|---|---|---|
更新频率 | 每周 | 每天 | 每周 | 每周 |
更新状态 | 更新中 | 更新中 | 已停更 | 已停更 |
原始文档 | 网页 | 网页 | ||
起始日期2 | 13 年 9 月 | 17 年 1月 | 16 年 1 月 | 15 年 10 月 |
更新日期 | 18 年 1 月 | 18年 1 月 | 17 年 6 月 | 17 年 8 月 |
整合进度3 | 17 年 12 月 | 17 年 12 月 | 17 年 6 月 | 17 年 8 月 |
文档个数4 | 211 | 36 | 64 | 81 |
总计页数 | 2656 | 4638 | 503 | 1999 |
推荐指数 | ★★★★★ | ★★★★ | ★★★ | ★★★ |
- 自17年起上海书评均发布于澎湃网,此前发布在东方早报网上的内容均已失效;
- 从有效起始日期开始计算,即发布日期早于该日期的书评内容可能已经失效;
- 统计表格每月 1 号更新,因此暂不整合当前月份发布的内容;
- 周更新的书评按周整合为一个文档;日更新的按月分为上中下旬三个文档;
2017年1月17日备注:计划整合经济观察网·书评、凤凰网读书·书评上的书评
0x02 整合流程
书评网站(包括 PC 端和 手机客户端)通常会以如下一种或几种形式来显示书评:1)基于网页的文字版(含文字和图片等);2)图片文档(通常分辨率较低,不适合阅读);3)PDF 文档(排版质量最佳)。通常我们主要关注第 1 和第 3 种情况。
针对第 3 种情况,即存在可供下载的 PDF 文档,那么我们设计的自动化工具直接批量获取和下载文档即可,然后按周或者按月对它们进行合并,具体的合并策略由其更新的数量和频次决定。如果只有网页文字版的(即第 1 种情况),那么自动化工具就需先要从网页中抓取必要的书评信息和内容,然后遵循 Markdown 语法的形式写入文件,最后再将其导出为 PDF 格式进行合并。
说明:为什么不直接将网页保存为 PDF?原始网页必然包含有太多我们不需要的信息,而我们们只需关心和获取其中一些必要的信息即可,如:书评标题、作者、日期、书评内容等。为什么选择 Markdown 而不是其他诸如 DOC 之类的文档格式?前者轻量级、语法简单、平台通用性好(既指操作系统层的平台,也指网络写作平台),开发成本远低于后者。
下面两张图分别是我们对新京报的书评周刊(图 1)和晶报的深港书评(图 2)按周整合后的文档资源图。有需求的朋友完全可以再自行对它们按月或按年进行整合。
此外,针对上述罗列的每一种资料来源,自动化工具还会按年生成一个基于 Markdown 语法的日志文件,其中的信息会再按月进行划分,这些信息主要包括:发布日期、文章标题(含链接)、文章状态等,最后将其导出为一个 PDF 文档。图 3 是对新京报·书评周刊 2015 年书评信息归档后的效果图。
2017年1月10日备注:将 Markdown 文件导出为 PDF 时,如果表格行数过多会导致排版上的不美观,遂判断每个表格的行数,每超过 20 行后即强制分页,且重新带上表头。
0x03 开发环境
温馨提示:不关心的技术的读者朋友们,可以直接跳过本节内容。
简单罗列一下自动化整合工具的开发环境:1)操作系统:macOS High Sierra;2)代码编辑器:Atom;3)编程语言:Python;4)Markdown 编辑器:MacDown;5)辅助工具:按键精灵
其中工具 4 和 5 并不是必需的。事实上,按照上面的整合流程,其实根本不需要用到 Markdown 编辑器。我们之所以用到了它们,是因为在 macOS 平台上暂时没有更好的解决方案将 Markdown 文件优雅地导出成 PDF 文件。由于 MacDown 不支持命令行导出,因此现阶段的整合流程方案为:先批量打开多个文件(不宜太多,视电脑性能而定),然后配合按键精灵(有能力的也可以自己写 Automator),设置好组合键和循环次数,最后将它们一一导出保存。
个人认为用 MacDown 导出的 PDF 文档在整体的排版样式上已经十分适合阅读了。有自定义样式需求的话,也可以简单地通过修改样式表文件来进行额外的样式控制,比如我们会仿照风格,将图片居中、统一控制图片的尺寸以适应 PDF 文件排版、表格宽度自适应窗口而不是内容,等等。但是,MacDown 没有命令行支持,始终是一大缺憾,而且利用按键精灵毕竟会阻塞其他正常的键鼠操作。
除此之外,macOS 上已知的几个可行方案还有:1)pandoc,支持命令行(见下方),但需额外安装超重量级的 MacTex(当然,也可以用迷你版的 BasicTeX),对中文支持不是很友好,且样式配置成本较高(适合喜欢倒腾的读者朋友们);2)Mou 编辑器:因为不支持 High Sierra,所以没有亲测导出效果。Windows 平台可能有更好的解决方案,有兴趣的读者可以自行研究。
pandoc -N -s --toc --smart --latex-engine=xelatex -V CJKmainfont='PingFang SC' -V mainfont='Monaco' -V geometry:margin=1in test.md -o out.pdf
2017年1月12日备注:按键精灵配合 MacDown 时,设置组合键似乎有点小问题,遂将应用程序的菜单“导出为 PDF”的默认快捷键 ⌥+⌘+P 修改为了 ⌘+1。
2017年1月11日备注:最理想的方案是能通过命令行进行转换,但能否正常加载 Markdown 文件中的网络图片?如果不能或者较为麻烦,则可以考虑在写入 Markdown 文件时利用自动化工具将网络图片下载到本地,然后将图片的网络地址替换本地图片路径。
0x04 整合实例
针对上文罗列的所有资料来源,本章节会对它们的整合过程一一进行说明,并展示最终的整合效果。
1. 新京报·书评周刊
文档整合过程中,首先我们发现新京报的书评周刊其实有提供 PDF 文档的,在手机客户端也支持完整版下载,而且是高质量精编的原始文档。但一个主要的问题是:虽然针对每一版都有提供一个文档,但文档的编号有时并不是连续的,比如:B9 和 B9 可能在同一版面,这样的话只有 B9 和 B10 两个文档是有效,因此需要剔除无效的版面。随之而来的问题是,如何批量高效地确定哪些文档是有效的,而哪些又是无效的。事实上,这两个问题并不像直观上所见那样容易解决,最后还是花了一些时间和精力才找到了一个较为完美的解决方案(由于此解决方案涉及逆向工程,这里便不赘述)。
下面两张图是新京报·书评周刊 2015 年 10 月 24 日一期的整合效果。对于有打印需求的读者来说,需要注意的是,在第一张图里(图 4)因为开启了双页阅读模式,所以看上去是一页,其实是两页独立的竖版;但是第二张图里(图 5),两个版面本身就在一页上,因此就是一页横版的。
如果按照上面这种模式打印的话(见图 6 的打印预览),通常横版的那一页也会被横向打印,读的时候自然也需要把纸横过来。虽然影响也不算太大,但更极致一点的做法是,把竖版的两页也合并成一页横版,这样打印出来的就全是横版了。
2. 澎湃新闻·上海书评
除了最原始和直接的基于网页的文字版,暂时还没有发现澎湃新闻的上海书评有提供其他可供阅读的文档类型。由于网页本身的排版也还不错(字体样式上区分正文、引语、书名等等),利用 Markdown 支持 HTML 语法的特性,大大降低了自动化工具在样式排版上的开发成本,总体的整合复杂度也相对低了很多。
图 7 左侧是澎湃新闻·上海书评 2017 年 12 月 6 日一期的原始网页,右侧则是整合导出为 PDF 后的效果。
另外,除了一些基本的书评信息之外,澎湃新闻的上海书评还会在每篇书评的末尾加入“关键词”信息和“相关推荐”列表。以澎湃新闻·上海书评 2017 年 12 月 13 日一期为例,如图 8 所示,我们在整合过程中也将这些有用的信息加入了文档之中。
3. 晶报·深港书评
晶报直接在网站上提供有深港书评的 PDF 下载链接,而且排版质量也很高,因此大大简化了整合工作。另外,同新京报·书评周刊类似的是,深港书评每一期的 PDF 文档中往往也包含有横版的页面,有打印需求的朋友们请额外注意。晶报·深港书评在 2017 年 8 月以后已经停刊,甚是可惜。
图 9 和图 10 分别来自晶报·深港书评 2016 年 12 月 10 日一期和 2017 年 5 月 21 日一期的整合效果图。
4. 南方都市报·阅读周刊
在亚马逊网站上,南方都市报发布过几期适配 Kindle 的电子版阅读周刊,但只有极少几期,因此还是需要访问网页端才能浏览每一期的内容。除了普通的文字版,目前发现针对每一个版面是有原始图片提供的,但分辨率过低(500x750),无法正常阅读,而且原始版面的文字排版又相对比较简陋,因此需要利用自动化工具,对网页的书评内容进行了抓取和整合。
在排版上,这里主要针对段落处理、图片位置、图片说明等,我们尽可能地仿照的风格来处理。图 11 给出了原始网页(左侧)和自动化处理后 PDF 文件双页阅读的效果(右侧)。哪一种阅读的体验效果更好不言而喻。
0x05 写在最后
对于已经列出的相关资源,我们会于每月 1 号进行统计、更新和发布。如果你有更多更好的优秀书评资源,都可以给我们留言,我们会及时地加入进来。我们不会说自己做的东西有多牛,也不会吹嘘我们要打造一个多厉害的平台之类的,因为我们只有一个小小心愿——让阅读回归本真。
合集打包
资源名称 | 网盘地址 | 提取码 |
---|---|---|
新京报·书评周刊 | 1c4cvtNa | i4qa |
澎湃新闻·上海书评 | 1o9BC8rS | w87p |
晶报·深港书评 | 1gherfiF | 42rs |
南方都市报·阅读周刊 | 1htbWWhI | 7mag |
版本历史
- 2012年1月19日(v0.1.4):整合并发布了新京报·书评周刊、澎湃新闻·上海书评、晶报·深港书评、南方都市报·阅读周刊