当文学作品遇上统计学,很多写作密码就被破译了

记得上高中的时候,同学之间互传着一本名字很响亮的武侠小说——《九阴九阳》。那时候都在电视上看过金庸作品的影视剧,九阴真经和九阳神功单独拿出来都是一门绝世的武功,能把两者结合起来,绝对是天下无敌的。


再看封面,上面赫然写着——金庸新著,我跟很多人一样,都以为是金庸封笔之后又出了新作。当我看完时,我有点怀疑了,这好像不是金庸的手笔,里面的主人公段子羽简直太厉害了,九阴真经、九阳神功、蛤蟆功、六脉神剑等绝世武功都学会了,还打败了张无忌,关键是他还有些阴险狠辣,明显不符合金庸老先生给主人公的一贯人设。

后来才明白,原来我们是被误导了。金庸老先生的作品一般是金庸著,而这个是金庸新著,作者名字叫作金庸新,很明显他是在名字上蹭了一下金庸的热度。

但是如果之前没有看过金庸作品的人,能不能直接看出来这本书的作者是谁呢?

最近看的一本书,让我认识了一种新的方法,那就是对文学作品进行数据分析,在这样的分析之下,如同对作品进行了实验检测,通过和以往作品的比对,就能得出答案。


这本书就是《纳博科夫最喜欢的词》。作者本·布拉在这本书里利用了统计学的原理,把很多畅销书的内容进行了数据分析,比如可以根据书中的第三人称代词他/她来判定作者的性别,也可以根据作者的用词习惯来判定作者。作者通过数据分析,得出了畅销书的写作“规律”,比如很多畅销书的副词使用都比较少,畅销书的作者很少使用突然和感叹号。作者通过统计学的数据分析,将一些平常看不见的写作“密码”用数字的方式展示给了人们。

本·布拉特曾经担任过《石板》、《哈佛讽刺家》等杂志撰稿作家,并且在《华尔街日报》、《波士顿环球报》等媒体上发表过多篇文章。他在写了《纳博科夫最喜欢的词》之后,将这种大数据分析和论证方法应用与更多的艺术题材,其中包括音乐、影视剧、综艺节目和文学创作。

在这些大数据面前,畅销书的写作规律就如一个人的体检表格,各项指标都被量化了,这才让我们有了参考标准。

一、作者的写作风格就是作家的文字指纹

随着DNA技术的广泛应用,尤其是在法医鉴定这一领域的应用,为公安机关确定嫌疑人、侦破案件提供了强有力的技术支持。比如,在很多的作案现场,作案人员往往会留下一些唾液、毛发和血迹之类的东西,法医人员把这些东西进行DNA检测,做成DNA指纹,然后跟犯罪嫌疑人的DNA进行比对,直接就可以确定嫌疑人到底是不是作案者。

和DNA指纹一样,每个作家的写作指纹也是独一无二的。

巴克曼是个恐怖小说家,出版过很多的恐怖小说,不幸的是他在1985年死于癌症。然而,事情并没有结束。有一名读者注意到巴克曼的作品风格跟他喜欢的另一位悬疑小说家的风格很像,于是他就在图书馆的目录上进行搜索,居然发现巴克曼的小说列在了斯蒂芬·金的名下。

巴克曼和斯蒂芬·金到底是不是同一个人呢?

作者本·布拉把巴克曼的4本书与50位畅销书作家进行比较,数据的结果更倾向于斯蒂芬·金,在196次比较中,全部符合这个结果。

与写作风格类似的,还有作家的用词风格。比如雷·布莱伯利常用的词语就是ramshackle(摇摇欲坠)和cinnamon(肉桂),纳博科夫最喜欢的词就是mauve(淡紫色)。这些词语在他们的作品中出现率远远高于其他的一些词语,这就是作家的用词风格。

凯瑟琳·安·波特说过:“你的风格就是你本人的化身”。

如果哪天有人剽窃了你的作品或者论文什么的,你完全可以利用这样的写作指纹来进行鉴定,是骡子是马,一试便知。

二、细节代表着你的写作态度

很多的写作者都有投稿的经历,有投中的,也有被拒稿的。那些被拒稿的人可能想不明白,自我感觉良好的稿子,为什么就入不了编辑的法眼?

其实,最为关键的因素就是你的写作细节。试想一下,如果你是一个编辑,你审的稿子错别字很多,标点符号乱用一通,或者该分段的没有分段,那么你会是什么感受?

在不久之前,我报名了释若老师的写作课,老师在讲写作要求时,将“你的用户是编辑”这7个字在电脑屏幕上敲了3次,可见这是一件多么重要的事情。

因此,老师要求我们在写完之后,一定要检查,检查自己的错别字,检查自己的语句是否通顺,检查逻辑上是否有跳跃等等。只有在过了重重检查之后,你才能保证你的作品不犯低级错误,这样你的过稿率才能有所提高。

《纳博科夫最喜欢的词》在对大量的畅销书进行了数据分析之后得出:很多优秀的作品都较少的使用感叹号,也很少使用“突然”这个词。

比如在不应该加感叹号的地方你加了,别人会以为要么你的经验不足,要么你是想在平淡的文字里制造一些不存在的刺激。再比如有的人经常使用“突然”这个词,而读者读了之后压根没有感受到一点的意外,那么你的以后的作品很可能会被读者列入黑名单。因此如果我们没有那么深厚的写作功底的话,还是要避免这种一惊一乍的写法。

这都是一些关于写作的一些细节上的问题,但却反应了个人的写作态度。成功的作家会注意每个词和每个标点符号的作用,打磨自己的作品。

正如本·布拉所说:“不管是经典作品还是畅销书,最终能让留在每一页上的语句产生打动人心的力量的因素,可能还是作者的写作态度。”

三、通俗易懂的作品,更容易被人所接受

凯鲁亚克在《达摩流浪者》中写到:“有一天,我将找到恰当的话语,而且这些话语是简单的。”

在去年的《相声有新人》的节目中,来了一对儿博士夫妻。他们自创了一套公式相声,但根据他们表演的效果来看,真的很一般。结果在第一轮,他们就被淘汰了。

虽然他们在言语上表现的一点都不客气,比如他说以后会坐在评委的位置上,比如他认为郭德纲看不懂他送的书。但郭德纲对于新人还是很包容的:“我也认同你,我只是告诉你,在这个舞台上,你那个,行不通。”

为什么郭德纲的相声那么受欢迎?为什么博士夫妻的相声却反应平平?

其实,一个作品真正好不好,就应该看看它是不是“接地气”。博士夫妻讲的那么专业,那么高深,但是可惜很多人都听不懂。郭德纲小学没毕业,但是能把观众逗乐了,就是因为他的作品大家都能听懂。 

再看一下豆瓣畅销书排行榜前十名,你会发现他们几乎都是小说。比如《小王子》、《围城》和《追风筝的人》等等。其中的《小王子》更是一种儿童文学小说。这更是说明了:越是通俗,越是简单的内容,就越容易被人们所接受


如果你仔细留意你身边的同事或者同学,你会发现,他们看的小说大多倾向于玄幻修真类或者言情类的小说,而不是看那些专业书籍或者古典名著。并不是因为后者不好,只是因为它们看起来比较困难一些。

弗莱斯曾近发明了一个测试阅读难度等级的公式,即先给两个数字以不同的权重,然后加在一起。

阅读难度公式:0.39×(总单词数/总句子数)+11.8×(总音节数/总单词数)

为了找到其中的规律,作者本·布拉搜集了1960年至今《纽约时报》畅销榜的563部作品,结果发现:作品的阅读难度越低,反而会越受欢迎。

这个结果再次证明了一个经典的词语——大道至简。越是简单的东西,才越容易被人们所接受。因此,如果你不是写论文或者报告的话,你的文字就应该简单一点,通俗一点,这样你的作品才可能会被多数人所接受,你才不会整天纠结于你作品的阅读量上不去。

在很多人还停留在对文学作品的创作背景和内容进行研究分析的时候,本·布拉却另辟蹊径,以数字的方法来解读文字,而且这种解读十分的新颖、有趣。《纳博科夫最喜欢的词》正是以统计学的方法,将那些我们平常看不到的写作规律以数字的方式展示给了我们,即让人看到写作路上的标杆,又让人看到了写作路上的大坑,知道了这些,写作之路才会走的平稳。

苏轼的《题西林壁》中有一句“不识庐山真面目,只缘身在此山中”。生活中,我们不妨大胆一点,从不同的角度去分析事物,或许你也能在山重水复之中看到柳暗花明,看到一些平常看不到的规律,或许你也会忍不住感慨——“原来如此!”。

你可能感兴趣的:(当文学作品遇上统计学,很多写作密码就被破译了)