读书 | 从《可视化未来》看人类的进步

我所说的一切都可能是错的!
即使你赞同我的观点,你的生活也不会因此有任何改变!
除非——你采取了相应的行动。


(这是书先生在的第73篇文章。本文约2300字,请花5分钟来阅读。)

我们对真正的力量一无所知

恩格斯对人的定义是“制作工具和使用工具的动物”。虽然动物界也有其它能够制造并使用简单工具的动物,比如大猩猩和某些鸟类(如渡鸦),但从工具的精密程度上来看,人类无愧为万物之灵。

工具是人类大脑和身体的延伸。没有鸟儿的翅膀,我们发明了飞机;没有猎豹的速度,我们发明了汽车;没有狮子老虎的尖牙利爪,我们却拥有足以毁灭脚下这个星球的恐怖力量。

然而,工具的进步可不是一朝一夕之功,需要知识的积累和传承。而让知识的传承和积累成为可能的是人类最强大的武器——语言。因为有了语言,某一人类个体创造的知识可以被记录下来,为后人所用。后人可以在前人的基础上不断的改进工具、提高认知,人类于是在发展上将其它动物越甩越远。

说来有点矛盾,人类的语言给了人类强大的力量,让人类的协作远超其它动物,让人类的知识可以传承,可是对人类语言本身,我们却一直缺乏了解,尤其是缺乏一个可靠的工具来观察它、研究它。直到近来,这一情况才有所改变,而这正是《可视化未来——大数据透视下的人文趋势》一书向我们展示的图景。

一种新的工具

长久以来,我们对语言的理解主要依赖于语言学家的直觉,于是产生了不少所谓的“正式语法”。拿英语来说,曾经有语法规范要求不定式to do之间不能插入副词,比如我们不能说to forcefully promote,只能说to promote something forcefully;也有语法规范要求一个句子不能以介词结尾,也就是说我们常说的What are you talking about?必须说成About what are you talking?

以前,对于这样的规定,人们无法反驳,只好遵循,因为我们没有证据证明可以不这样用。但现在我们有了新的工具。计算机的发展使得大规模处理文本数据成为可能,各种语料库处理软件,让我们可以从一种全新的角度来观察语言。

用语料库语言学创始人John Sinclare的话来说,“Language looks rather different when you look at a lot of it at once.”(当你能一次性观察大量语言数据时,语言看起来非常不同。)

的确不同了,至少我们已经发现to do不定式中间插入副词其实并不少见,人们在使用语言时也并不在乎一句话是不是以介词结尾。甚至像there be句型的就近原则这样永恒不变的考点,也被发现其实并不存在。

一句话,人们对语言的认识越来越从语言的结构转向语言的功能——凡是能够成功实现使用语言之目的的用法都是合理的,或者终将成为合理的。虽然仍然有一些“老派”的人,坚持着所谓语言使用的“规范”,比如《生活大爆炸》里的Sheldon,不过这个趋势看来是不会反转了。

就像白话文刚推行的时候,文言文的支持者会提出各种质疑,最终还是白话文胜出——无论是口语还是书面语。

当我们把大量的文本放在一起观察时,我们对语言的理解大大加深。从最早的只有100万词的布朗语料库到现在接近5亿词的COCA语料库,更多的数据带来更深的认识。试想一下,如果我们把全人类的书籍都电子化,放在一起观察,会带来什么样的认知?

一个新的学科

还真有一个机构开始了这样的尝试,那就是Google和它的Google Books计划。有两个人看到了这个宝库的价值,决定用自己的专业知识来挖掘这个宝库。这两个人就是《可视化未来》一书的作者埃雷兹·艾登和让-巴斯蒂安·马歇尔。

雷兹·艾登本是哈佛大学研究基因组学的数学博士,当他接触了Google Books这一宝库后,开始把研究基因组学的数学方法用在研究文本资料上。他和他同事研究的成果转化为了一个网站https://books.google.com/ngrams 和一个全新的学科“人类文化组学”(culturomics)

他们的逻辑看似非常简单:人类一切的思想和行为,最终都会记录在语言里。只要有一个合适的算法,我们就能从语言数据中观察出人类文化的变迁。我相信,这个简单的逻辑将会产生深远的影响。事实上,这种研究方法已经得出一些有趣的结论,它们就记录在《可视化未来》一书里面。

比如,书籍的作者发现了不规则动词变为规则动词的规律,甚至计算出了它们的“半衰期”。要知道,500年前,英语中几乎所有动词都是不规则变化的。在过去的500年里,规则变化开始了对不规则变化的“大屠杀”,到如今,只剩下177个不规则变化的动词。这些动词能够保留下来,是因为使用频率很高。

就是这“幸存”的177个,在今后的500年里,有一半以上也难逃厄运——书籍的作者通过计算,认为到2500年,将只会剩下83个。这场对于不规则动词的灾难,对于英语学习者却是好事,如果2500年英语还是世界语的话。

哪个词的不规则变化会最先消失呢?作者的答案是wed。这个词现在已经有两种过去式和过去分词形式,一是wed,一是wedded。不出意料的话,后者会在竞争中胜出。所以,请珍惜现在新婚时打出"newly-wed"牌子的机会,几百年后,我们只能写"newly-wedded"了。

危机危机,有危有机

语言在演化,拘泥于语言形式的语言教学方式显然已经过时了。要想真正学习语言,必须要面向使用,面向功能。这对没有接触过前沿语言学理论的许多一线英语教师都是挑战。但要在行业生存,就必须接受挑战,不断学习。

另一个挑战是数据科学的爆发式成长。数据分析在各个学科开始展示它强大的力量,让人想不到的是,人文学科居然首当其冲。从此文科的学习者和研究者再不能拿数学不好当做借口了,不会数据分析将寸步难行。

我是英语教师,我自觉采用面向功能的语言教学方法,我自学编程、自学数学,我努力不在变化中落伍。我知道,这危险中往往潜藏着机会。那些前行的阻挡的墙,并不是为了阻挡那些奋斗的人,而是帮助你删除掉那些懒惰的竞争者,让墙后的路更加宽阔。

我已上路,期待与你同行!

【作者简介】
书先生和路夫人,80后大学教师一对。
书先生语言老司机,玩转英语、德语、Python计算机编程;
路夫人旅游达人,足迹遍及欧洲、美洲、亚洲和大洋洲!
读万卷书、行万里路、过精彩人生!

你可能感兴趣的:(读书 | 从《可视化未来》看人类的进步)