纳博科夫最喜欢的词:大数据分析告诉你,如何写出受人欢迎的作品

先跟大家讲个关于文字的奇案。

被誉为“美国宪法圣经”的《联邦党人文集》,集结了许多美国宪法和联邦制度的评论文章。在这本文集中,有12篇文章的作者不明,可能的作者有三个:汉密尔顿、麦迪逊和杰伊,那么到底是谁写了这12篇文章呢?

历史学家们为此争论不休,也没能解开谜团。直到1804年,汉密尔顿在写给朋友中的信中,说自己写了这些文章,至此,这桩疑案原本可以告破,不料中途波澜又起。事隔13年,在结束了第二任总统任期后,麦迪逊总统列出了自己的著作清单,之前被汉密尔顿认领的文章,赫然在麦迪逊的著作清单内。

(麦迪逊)

广大的吃瓜群众们不淡定了,开始了新一轮的猜谜游戏。历史学家也分为两个派别,有的支持汉密尔顿,有的拥护麦迪逊,还有一小撮甚至怀疑,可能杰伊也参与其中?

直到1963年,这个历史难题才得以解决。我要隆重介绍下两个人:莫斯特勒和华莱士。他们不是历史学家,而是统计学家。面对这个历史疑案,他们摒弃了政治和意识形态的分歧,别出心裁地利用统计学的原理,来确定这12篇文章的著作权。

统计学的研究分析比较专业,涉及很多概率方程,常人比较难理解,但这个方法的逻辑就是:

首先,统计汉密尔顿和麦迪逊撰写文章中,常用词出现的频率。

其次,统计《联邦党人文集》12篇有争议的文章中,相同词语出现的频率。

最后,根据上述的用词频率,确定有争议文章的作者。

根据一番运算和统计,莫斯特勒和华莱士认定,麦迪逊才是这12篇文章的真正作者。这点已经得到统计学家和历史学家的认可,并形成共识。——是不是很神奇?一个关于文字的难题,居然通过数字的方式解决了。

莫斯特勒和华莱士解决问题的方式,为后来的文学研究提供了一个新思路——利用数据分析来研究写作。《纳博科夫最喜欢的词》就是这样一部作品。

纳博科夫最喜欢的词

本书的作者是美国的本·布拉特(Ben Blatt),他是杂志撰稿作家,在《华尔街日报》、《波士顿环球报》以及《哈佛讽刺家》等媒体上发表过作品。

布拉特是数据分析的重度爱好者,他不仅用数据分析来研究文学作品,还将之应用到音乐、影视剧以及综艺节目等领域。

这本《纳博科夫最喜欢的词》是布拉特用数字写成的文字书。在书中,他充分利用现代技术手段,从统计学的角度,来研究文学作品,揭开了许多困扰人的文学难题。比如:

书籍的难易程度和畅销程度有关吗?

作家提出的创作建议他自己会遵守吗?

男性和女性作家的写作方式有何不同?

等等。

从书中,我们不仅能发现许多有趣的现象,还能学到不少写作技巧。经过认真研读,我从书中get到不少黄金写作法则,现在我将从遣词造句、谋篇布局以及风格打造三个方面,来分享伟大作家的创作经验。

遣词造句:尽量少用副词,使用简短的句子

海明威素以文风简洁而著称,他认为作品应该尽可能精简,只保留核心内容,冗余的文辞只会损害作品。持这种观点的人不在少数,斯蒂芬·金、E·B·怀特都是简洁文风的拥趸。斯蒂芬·金在《论写作》中,界定副词为“通常以ly结尾的词”,这些副词非常扎眼,应该尽量少用。

斯蒂芬·金


布拉特通过大数据研究,有两点发现:

1、那些影响深远的作品,确实很少使用以-ly结尾的副词。

2、副词在大多数情况下,并无必要,反而会使文句钝拙。

这本书是以英文写成的,研究的样本也都是英语。在中文中,并没有ly结尾的副词。那么对应到中文写作中,这条规则指的是什么呢?不妨来看看这些作家反对使用以-ly结尾的副词的原因。

恰克·帕拉尼克在《比虚构更离奇》(Stranger than Fiction)中表达过这样的观点:不要使用愚蠢的副词,比如:困倦地(sleepily),暴躁地(irritably),悲伤地(sadly),而应该通过细节描写,场景设置等,来表达角色有多么困倦、暴躁或者悲伤,而不是依靠以-ly结尾的副词。

作家托妮·莫里森的文风之简洁不逊于海明威,她曾经说过,

“我从来不写‘她柔声地说’(She says softly)这种句子,如果在此前的文字中没有体现出温柔,我绝对会花费时间和篇幅围绕温柔进行描写,直至让读者感觉出温柔。”

所以,这条规则引申到中文写作中来,就是要求我们在写作中,要摒弃华丽的辞藻修饰(比如形容词和副词),通过场景构建、细节描述以及事实说明等方式,去描摹事物,让作品言之有物,而不是堆砌空洞的辞藻。

比如:想表现“冷”,不必一味说冷,而是通过细节来表现:温度在零度以下,河面结了冰,路上的行人把自己裹得严严实实,时不时还在手上哈口气取暖。等等。尽管没说冷,但却能让人感到冷。这颇有点古人说的“不着一字,尽得风流”的意思。

除此外,在遣词造句上,还要力求简单。

在英语国家,有个数学公式——弗莱施-金凯德阅读难度等级测试(Flesch-Kincaid Grade Level test ),可以用来测试文本的难度,这个公式是这样的:

0.39x(总单词数/总句子数)+11.8x(总音节数/总单词数)-15.59

公式计算出来的分值就是阅读这个文本要求的学校年级水平,如果计算的年级水平为5,那么表示5年级以上的学生阅读本书没有困难。这里需要说明下,美国的年级分为K-12,K和1-5属于小学,6-8属于初中,9-12为高中。

布拉特研究了《纽约时报》畅销榜首的书籍,发现自1960年以来的大部分作品,等级都在4-7之间。这表明大部分的畅销作品,都不是高深复杂的,相反,这些作品初中水平就可以阅读。

由此可见,优秀的作品未必就复杂艰深,简单反而会有更广的受众面。阅读难度的划分,只是将水平不足的人排除在外,并不表示读者就必须是这个水平的。比如:想要阅读难度为5的作品,你并不一定就是一个小学生。

这让我想起大诗人白居易,据说,他每次写完诗,都会念给老奶奶听,老奶奶听得懂,他就觉得好,如果老奶奶听不懂,他则会进行修改,改到老奶奶能听懂为止。

所以,白居易的诗明白晓畅,有广泛的群众基础,他也跻身唐代三大诗人之一。可见,古今中外,受欢迎的作品大都是接地气的。

白居易给老奶奶读诗

谋篇布局:开头要有震撼力,结尾要留有悬念

在谋篇布局上,我们古人提出了“凤头、猪肚和豹尾”的原则,说的是文章的开头应该像凤头一样奇巧精美,正文应该像猪肚那样充实饱满,结尾要像豹尾那样别致有力。那国外这些名家大师们,又会给我们提供哪些借鉴呢?

布拉特对伟大作品的开头展开了研究:玛格丽特·阿特伍德的15部小说中,开头字数的中位数为9。《白鲸》的开头被公认为最佳,只有三个字。斯蒂芬·金最喜欢的开头平均只有6个字。从中,我们似乎可以得出结论:作品开头要简短。

然而,不少伟大作品的开头也并不短,比如:《双城记》的开头有119个字,《麦田里的守望者》开头有63个字。布拉特经过大量研究,发现:长短并不是判断开头好坏的标准,伟大的开头都有独创性,出人意料,让人难忘。

开头就想牢牢抓住读者注意力,除了要有震撼力之外,还要避免陈词滥调。大数据统计发现,最糟糕的开头是这样的,“这是一个黑暗的暴风雨之夜……”

这是爱德华·鲍沃尔-李敦的小说《保罗·克利福德》中的开头,在1830年,它还是优秀的典范,作为最著名的开头之一,广为流传,不过随着时间的更迭,以及大量以天气开头文学作品的出现,这个开头惨遭唾弃,上了黑名单。

这让我想起初中英语老师说的话,他说,第一个将姑娘比作鲜花的人是天才,第二个是庸才,第三个就是蠢材。有些东西被滥用后,批量生产,自然就丧失了其独特性,也不再吸引人。

尽管用天气开头会显得老套,但也有人能化腐朽为神奇,比如乔治·奥威尔《1984》的开头被认为是最伟大的开篇。他是这么写的,

It was a bright cold day in April,and the clocks were striking thirteen。

四月间,天气寒冷晴朗,钟敲了十三下。

由此可见,高明的作家总能别出心裁。尽管用天气开头饱受诟病,但不少伟大作品仍以此开头,在86部普利策获奖作品中,就有13部用天气来开头。

这说明了什么?世事无绝对,敢于打破常规,另辟蹊径,就能翻出新花样,成就好的作品。

乔治·奥威尔

说完开头,再来看看结尾。经过大数据分析,布拉特发现,在畅销童书和青少年读物中,作者都喜欢在章节末尾留有悬念,这样能够吊人胃口,让读者有追看的欲望。

布拉特将感叹号、问号、破折号和省略号,统称为“明显的悬念符号”。除了用这些悬念符号来渲染感情,制造悬念外,很多畅销书作家会在篇章的末尾,用一句话来独立成段,比如:

柯林斯的《饥饿游戏》三部曲,共计有82章,但每章结尾的最后一段,只有一句话的段落高达62%。我们来品品这些句子:

蚂蚁钻进了我的眼睛,我昏了过去。

这是他设置的死亡陷阱之一。

……

当读到这样的句子时,你是不是很想继续读下去,看看究竟发生了什么?

在结尾制造悬念是惊悚小说的常见写法,但它的升级版——用简短句子结束章节的方式,则广泛延伸到了文学小说中。

布拉特考证了2013年-2014年年间的41部获奖作品,发现有38部作品分了章节,这其中又有20部作品大部分的章节都是一句话结尾。

虽然暂时没有迹象表明严肃文学作品都喜欢以悬念结尾,但那些让人爱不释手的作品似乎都喜欢用一句话来结尾。为什么呢?

因为人类天生就有好奇心,制造悬念很有用。

苏珊·柯林斯

个人风格:打造独特风格,提升辨识度

作家的风格是本人的化身,是区别于其他作家的标志。许多作家风格独特,颇具辨识度。比如:

狄更斯喜欢首语重复(anaphora,指的是连续句子的开头都是同一个单词或者短语),他《双城记》的开头至今仍有人模仿,“这是最好的时代,这是最坏的时代……”

劳伦斯身兼多重身份,他是游记作家,又是诗人。他喜欢大自然,对鸟情有独钟,写过著名诗集《鸟、兽、花》,在他的12部小说中,有116个不同的鸟类比喻。(感觉可以当鸟类科普来看了,我认识的鸟都没有116种。)

纳博科夫痴迷蝴蝶,他最喜欢的词是mauve,淡紫色,这个词在他的8部作品中都出现过。他具有出色的“联觉”能力(有些人在听到声音时,会产生视觉反应),所以最喜欢的词是mauve,也能够解释得通。

纳博科夫

这项研究给我们的启示是:作为作家,想要有所成就,需要打造自己独特的风格。风格有点像人的气质,虽然琢磨不透,却能让人感受到。风格的形成是诸多要素综合的结果。个人的性格、经历、成长环境,以及所受的教育,还有主观的努力,都对风格有影响。

《华氏451度》的作者雷·布莱伯利最喜欢的两个词是“摇摇欲坠”(ramshackle)和“肉桂”(cinnamon),关于他为何喜欢“肉桂”这个词,则是建立在某种私密联系上。小时候,他每次走进外婆的储藏室,都喜欢大声念出香料盒子上的标签,这个标签里面就有肉桂、咖喱等。

我最近在读汪曾祺的散文,他的散文非常有特色,长短句结合,既有接地气的大白话、方言,也不乏精炼古典的句式,平淡质朴,雅俗共赏,这些也跟他的个人经历,以及性格有关。我们常说,文如其人,指的就是这种情况。

想形成自己独特的风格,可以找自己喜欢的作家,对他的作品进行研究和模仿,不要担心最后会变成他那样。首先,这个难度很大,其次,人和人天然有差异,这种差异不会那么容易泯灭。相反地,很多人能在模仿中,形成自己独特的风格。

总结

我们生活在大数据时代,技术的进步解决了很多难题,利用数据分析来研究畅销作品,以及喜欢的作家,可以帮我们打开了新世界的大门。正如本书作者布拉特所说,“文字的世界和数字的世界不应该被截然分开,同时热爱两者并非不可能。把写作和数学结合起来,从喜欢的书籍和景仰的作家中,我们能找到许多值得学习和借鉴的东西。”

你可能感兴趣的:(纳博科夫最喜欢的词:大数据分析告诉你,如何写出受人欢迎的作品)