1 引子
美国历史上有一个疑案,曾经让历史学家们争论了一个半世纪,而仍然迷雾重重。
1787年,美国颁布了宪法。为了号召民众支持宪法,三位美国政治家亚历山大·汉密尔顿、约翰·杰伊和詹姆斯·麦迪逊,共用一个笔名,先后发表了85篇文章,后来这些文章合集出版,就是美国历史上赫赫有名的《联邦党人文集》。由于政治原因,当年三位作者并未公开各自所写的文章清单。所以,具体哪篇是汉密尔顿写的,哪篇是麦迪逊写的,而哪篇是杰伊写的就成了一个迷。
后来当事人出来说话了,奇怪的是,汉密尔顿和麦迪逊都宣称自己是其中12篇文章的作者。因为《联邦党人文集》太重要,太出名,所以明确每篇文章的作者,让历史学家饶有兴趣,他们都想找到这道历史题的答案,然而这一找就找了150年,却仍然没有找到。
一直到1963年,两位统计学家(哈佛大学的莫斯特勒教授和芝加哥大学的华莱士教授)给出了让人信服的答案。他们用统计学的方法分析作者们的用语习惯,比如:麦迪逊用“also”这个词的频率是汉密尔顿的两倍,而汉密尔顿使用“according”的频率则比麦迪逊高很多;麦迪逊在文章中,习惯用“whilst”,从来没有用过“while”,而汉密尔顿在文章中,只用“while”,从未用过“whilst”。
最终他们确认,备受争议的12篇文章作者是麦迪逊。
你看,用统计学的方法解开历史题,是不是很有趣?如果我们将这种方法用来研究文学创作,是不是很期待有趣的答案呢?今天,我们来一起阅读美国作家本·布拉特的《纳博科夫最喜欢的词》。
2 作者
本·布拉特(Ben Blatt)曾任《石板》《哈佛讽刺家》等杂志撰稿作家,文章散见于《华尔街日报》《波士顿环球报》等媒体。
作者写过一本叫《再也回不来,我也不在乎》(I Don’t Care if We Never Get Back)的书,用大数据“计算”了他与合著者埃里克·布鲁斯特的一段疯狂棒球之旅——他们不搭乘飞机,在30天内造访30座棒球场,观赏30场比赛,全程2万英里。
他还曾将有趣的大数据分析、论证方法应用于广泛的艺术题材,包括音乐、影视剧、综艺节目,以及文学创作,形成了用“大数据”的思维方法做文学评论的独特风格。
3 导读
本·布拉特用统计学的方法,先统计纳博科夫小说中最常用的词语,然后把这些词和以往200年内的其他小说做对比,找到了一个词,是纳博科夫常用,但其他作家却并不常用的,这个词是“mauve”,意为:“淡紫色”。
于是“Nabokov's Favorite Word Is Mauve”就成了这本书的名字,译者巧妙地省略了“淡紫色”一词的翻译,就成了《纳博科夫最喜欢的词》,平添了几分悬念。
作者不光盯着纳博科夫,他用统计学的方法分析了当代英语写作大师们的大量作品,拆解出优秀作品的用词规律,其中我摘录了其中几条马上能拿来试手的方法。
3.1 让文字简洁如海明威
海明威以他简洁的文风而举世闻名,传说中有一篇故事只用了6个单词就写完了:For sale:baby shoes,never worn.(售:婴儿鞋,全新。)人们都把这段文字归于海明威,因为,这太海明威了。
海明威认为“写作的法则和飞行,数学,物理一样,是有章可循的”,这里他指的是文字应尽可能地简洁,就像林肯总统地《葛底斯堡演说》一样。
英语作家们普遍认为,副词,尤其是以ly结尾的副词,是破坏简洁的罪魁祸首,所以著名小说家斯蒂芬·金甚至说:“这些副词不是你的朋友”。当然这里所指地副词不是上面那6字故事中的“never”之类,而是-ly结尾,可有可无的副词。
作者为我们选择了西方公认的15位伟大作家,分析了他们的167部代表作中的副词数量。
在每10000个单词中,E.L.詹姆斯的《五十度灰》用了155个-ly结尾的副词,斯蒂芬妮·梅尔的《暮光之城》用了134个,菲兹杰拉德的小说《了不起的盖兹比》只有128个,在狄更斯的作品里,这个数字是108个,而海明威,只有80个。
为了对照,作者在9000多部网络小说,《纽约时报》畅销书和获奖文学作品当中统计-ly副词的数量,它们关系是:文学奖获奖作品<畅销书<网络同人小说。由此可见,使用副词的数量,确实能体现英文作家的水平。
3.2 用名词和动词写作
虽然并非所有的作家都是如此,但作者用统计数据表明,大多数作家的经典作品里使用修饰词的数量在逐渐减低,从20世纪早期的经典作品《黑暗的心》到20世纪末期《宠儿》,修饰词的使用上减少了一半,这些词包括“rather(相当)”,“very(非常)”,“little(略微)”等。
通往地狱的路上铺满了副词。——斯蒂芬·金
除了修饰词,现代作家还尽量避免使用“感叹号!”和“突然”这种词。最典型的是作家埃尔默·伦纳德,他是全美极具影响力的畅销书作家之一,获得“美国国家图书奖”及“终生成就奖”,曾被美国推理作家协会(MWA)授予 “大师奖”,并被誉为“底特律的狄更斯”。
他写过一本书《埃尔默·伦纳德的写作十规》中给自己定了很多规矩,其中两条是:每10万字,感叹号不得超过3个;绝对不使用“突然”这个词。
难能可贵的是,他自己严格遵守自己提出的规则,成为使用感叹号最少的作家之一,比海明威还少,数量是J.K.罗琳的1/13;而且他提出这些建议之后,作品里就再也没有出现过“突然”一词。作者统计了畅销书,当代作品和网络同人小说,可以看得出,感叹号的数量由少到多,可以作为作品水平的一个指标。
当然,很多优秀的作家比如《霍比特人》的作者托尔金就喜欢用“突然”,所以,作者调侃说“不要那么突然地停止使用‘突然’,适度使用就好”。
3.3 写作就是让读者看懂
文章正在变得通俗易懂,这是文学作品,甚至政府报告的共同趋势。
有人用弗莱施-金凯德公式计算了历年美国总统国情咨文的难度分值,发现19世纪是18分,20世纪是12分,而到了21世纪,已经低于10分(相当于高二水平)。也就是说,难度几乎降低了1倍。
由于传媒变得发达,总统的国情咨文,不仅仅会被国会议员看到,听到,人民大众也要看,也要听,所以只有文学变得平易近人,才能获得更多影响力。
同样使用弗莱施-金凯德公式计算上个世纪60年代到本世纪前20年的畅销作品,它们的阅读难度中位数也从8分降低到了6分。可以看到一个趋势:想让小说好卖,那么作者最好把小说写得易懂些。
虽然一些经典文学作品或者普利策获奖作品仍然保持着较高的阅读难度,比如《纯真年代》是10.4分,《雾都孤儿》是10.1分;但是也有另外一些经典如《太阳照常升起》4.2分,《杀死一只知更鸟》5.9分。
作者不认为文学会回到满是长难句的华盛顿国情咨文的样子,他认同凯鲁亚克的观点:“有一天,我将找到恰当的话语,而且这些话语是简单的。”
3.4 “陈词滥调”的开头
很多著名的作家,偏爱一些词语的重复,狄更斯的《双城记》开头连用10个“It was”,他的《艰难时世》开头连用6个“A man”。要知道,这些作家刚开始用这些表达时,是新颖的,如同马尔克斯《百年孤独》的开头一样。但是,太多人套用和模仿,就变成了陈词滥调。
英国小说家马丁·艾米斯痛恨陈词滥调,克里斯汀·阿默尔更是编了一本《陈词滥调辞典》,本·布拉特用这部辞典来衡量畅销书作者的“陈词滥调”水平,詹姆斯·帕特森贡献了21世纪最多的陈词滥调小说。
但是,这并不意味着陈词滥调没有市场。谈论天气可谓货真价实的“陈词滥调”。但有的作家偏爱在小说开头谈天气,最著名的是丹尼尔·斯蒂尔,她的92部小说中,有42部用天气开头。乔治·奥威尔《1948》的开头,是用天气的典范:“四月间,天气寒冷晴朗,钟敲了十三下。”另外,还有马克·吐温、D·H·劳伦斯、狄更斯、斯蒂芬·金,他们都有十分之一的小说以天气开头。
所以,重复也好,词语偏好也好,谈论天气也罢,只要用到恰到好处,都是可取的写作技巧。
3.5 吊足胃口的结尾
作者发现富兰克林·迪克森的小说《哈迪男孩》系列中非常喜欢用兴奋的“!”或者神秘的“?”结尾,这成了小说悬念的符号,也成了作品成功的密钥。
布拉特统计了将近200部英美畅销小说,包括J.K. 罗琳的《哈利·波特》,科林斯的《饥饿游戏》三部曲、维罗妮卡·罗斯的《分歧者》三部曲,他发现在这些小说中,有将近一半的章节,要么以悬念结尾,要么只用一句话结尾。其中《饥饿游戏》三部曲,有60%的章节,结尾都是只用一句话。
为什么畅销小说更愿意用一句话作为一章的结尾呢?因为这样更能造成一种戛然而止的效果,更有悬念,更吊人胃口,这样就能吸引读者继续读下去。布拉特的大数据告诉我们,这种方式确实很有用。
这种悬念或者短促的结尾,能够让读者产生足够的好奇心和意犹未尽的感觉,进而吸引更多的阅读。事实证明:制造悬念很有用处。
4 全书回顾
本·布拉特用统计学的方法,梳理了从19世纪末到本世纪最初10年间的大量文学作品,发现了文学创作中的统计学规律。他指出,如果想成为优秀的作家,追求简洁的文风是有效的途径,首先去掉-ly结尾的副词;用名词和动词写作,少用修饰作用的副词;大数据告诉我们简单易懂的文字,会为作家赢得更多读者,充满悬念的故事结尾,也会增加销量。
用大数据的工具,我们可以清晰地找出一位作者的写作习惯,这是作者留在作品里的指纹,他们独一无二,无可替代,就像书名里提到的纳博科夫,他就是偏爱“淡紫色”。当然这种分析思路不仅能运用在英文作品里,我们是不是可以用它揭开“兰陵笑笑生”的真实身份,佐证《水浒传》里施耐庵与罗贯中各自的贡献,解开脂砚斋与曹雪芹的诸多秘密。