用统计学分析文学,用大数据检验写作技巧

在听从任何人的建议前,应该先考虑一下,思考两个简单的问题:

1、提建议的人有没有遵从自己的建议?

2、有谁靠听从这些建议获得成功了吗?

古今中外,许多伟大的作家都分享过自己的写作技巧,这些写作技巧究竟是适合大众的技巧,还是作者的写作偏好呢?分享写作技巧的作家本人有没有按照自己提出的写作技巧来进行写作呢?在这本《纳博科夫最喜欢的词》中,作者本·布拉特采用大数据分析的方法对数条经典的写作技巧进行验证。

这本书并不是本·布拉特第一次进行跨界的大数据分析,在此之前,他曾将大数据分析运用在音乐、影视剧等领域。在本书中,作者对数百位作家,共计1500部作品的单词进行统计分析,用于验证经典的写作技巧。


一、不要使用以ly结尾的副词

斯蒂芬·金说:“副词不是你的朋友。”

这里的副词指的是以ly结尾的词。作者通过数据分析发现,在15位伟大作家的全部作品中,使用最少副词的作品更有可能是经典之作;对比这些作品的网络评分发现,使用副词较少的简洁作品更有可能受欢迎。

将这15位作家,按照以ly结尾副词的使用频率从低到高进行排列,被称为是简洁写作风格典范的海明威排在第一位。本·布拉特将作品范围扩大,除了伟大作家的经典作品以外,还选取了《纽约时报》畅销书榜单上的作品,以及网络同人小说进行比较,同人小说中副词使用量远远超过经典作品。再次验证了斯蒂芬·金关于副词的写作技巧。

这一点,对于中文写作同样适用。《搏击俱乐部》的作者恰克·帕拉尼克曾说:“请不要用愚蠢的副词,比如‘困倦地’(sleepily),‘暴躁得’(irritably),‘悲伤地’(sadly)。”替换成中文写作,可以理解为:不要直接用概括性的词语告诉读者角色的状态,而是通过上下文的描写,让读者体会到角色的具体状态。

曾获诺贝尔奖、普利策奖的托妮·莫里森证实了这一点,她说:“我从来不写‘她柔声地(softly)说’这种句子,如果在此前的文字中没有体现出温柔,我绝对会花费时间和篇幅围绕温柔进行描写,直至让读者感觉出温柔。”莫里森使用副词的频率甚至低于海明威。

针对这种总体趋势,作者提出了一种解释:副词的使用法师呈现了作者的专注度。一个不借助副词,却能让故事场景和人物动作栩栩如生的“精准的”作家,往往需要花费很多时间删除那些不必要的词。

二、写作风格藏在你的单词使用中

1787年的《联邦党人文集》中,有12篇文章同时被汉密尔顿和麦迪逊分别认领,这一谜题直到1963年,被莫斯特勒和华莱士成功解开。两位统计学教授对单词的使用频率进行分析,确定了麦迪逊是这12篇文章的作者。

在本书中,作者用莫斯特勒和华莱士的方法,将奥威尔的《动物农场》当作未知作者的作品,对50位作家,共计600部作品进行对照分析,每一次的结果都显示《动物农场》的作者是奥威尔。随后作者扩大了检验范围,将600部样本作品中的每一部,一一假定作者未知,进行检验。28861次检验中,成功率超过99.4%。

通过这种方法,本·布拉特还确定了恐怖小说作家理查德·巴克曼是悬疑小说作家斯蒂芬·金的笔名,侦探小说作家罗伯特·加尔布雷恩是《哈利波特》作者J.K.罗琳的笔名。尽管J.K.罗琳在侦探小说中刻意改变了写作风格,本·布拉特的147次测试仍然全部正确。这一点也证明了作家可以改变作品的类型,但难以隐藏自己的写作风格。

原因在于,作者或许会在作品中刻意改变对某个词或某些词的使用,以隐藏写作风格。但是把作品当中的几百个常用词,全部考虑进去,展现出来作者独特的风格是难以否认的。就像指纹一样,独一无二。

《纳博科夫最喜欢的词》中,作者提到:无论读者能否感觉出来,每个作者的文字中总有深层次的风格指纹,将他与其他作者区分开来。

三、“感叹号”和“突然”

电影《决战犹马镇》和《危险关系》的作者埃尔默·伦纳德是一位高产作家,职业生涯中写了40多部小说。到目前为止,已经有19部作品被改编成了电影。伦纳德曾在《埃尔默·伦纳德的写作十规》一书中提出:“作品中,每10万字中的感叹号不能超过三个。”还提出:“绝对不要用‘突然’这个词。”

本书作者本·布拉特对他以上两条规则进行了验证。

关于感叹号的使用频率,一方面,作者将伦纳德的45部小说一共340万字进行统计,发现他使用的感叹号是他自己建议的16倍。考虑到伦纳德是在2001年的《纽约时报》上首次公布的这项写作规则,对他2001年之后的作品进行统计,感叹号的使用减少到每10万字10个。他感叹号使用率最低的8部作品,都是在2001年之后创作的。

另一方面,作者统计了50位作家,共计580多部作品中使用感叹号的情况。在感叹号的使用上,差别极大,业余作家使用了更多的感叹号,同人小说的感叹号使用甚至达到了其他作品的4倍。可以发现,成功的作品大多较少使用感叹号,数据验证了这一点。在50位作家中,伦纳德的感叹号使用率是最低的,他严格按照自己提出的规则进行写作。

对于“突然”一词,伦纳德仍旧遵守了自己提出的规则,但是本书作者在数据统计中发现,无论是职业作家还是业余作家,对于“突然”一词的使用频率差距不大。也就是说,绝对不要用“突然”这个词不能当做一条大众适用的规则,更倾向于这一条是伦纳德因本人的写作偏好提出的规则。

有些写作技巧是适用于普罗大众,有些写作技巧是作者的个人偏好。无论哪种,在写作技巧背后的写作态度,才是更值得我们学习的。正如《纳博科夫最喜欢的词》中提到:之所以成为大作家,更多的时候是这些作家仔细推敲看似简单的词语的写作态度。


无论是哪种写作技巧,总有打破规则的作品或作者。

斯蒂芬金提出“不要使用以ly结尾的无用的副词。”海明威的《老人与海》打破了这条规则。尽管莫斯特勒和华莱士的方法,成功率高达百分99.4%,仍旧有例外,斯坦贝克19部作品中有3部,被认为马克·吐温更有可能是作者。伦纳德提出感叹号的使用规则时,同时提到汤姆·沃尔夫是例外,沃尔夫平均每10万字使用929个感叹号。此外,本书中提到“不要使用重复的开头”,然而狄更斯是使用“重复”技巧的大师。

《纳博科夫最喜欢的词》中,作者进行数据统计的作品有1500部,涉及到的作者又数百位,数据统计分析的对象是单词。如此庞大的数据量更多的是验证了已经被提出的写作技巧,对于作品的文学价值、思想价值无法进行回答,这也证明了写作技巧的局限性。写作技巧只是完成作品的手段而已,将思想融入作品中,通过文字表达出来,才是文学作品的真正意义。

你可能感兴趣的:(用统计学分析文学,用大数据检验写作技巧)