《我们从五百万本书里学到了什么》观后感

时间:2014年5月14日
http://v.163.com/movie/2014/5/S/D/M9PEG3P9U_M9PJF4ESD.html

我的感悟:

我每次看TED都是无声看字幕的,要么是在办,工作偷闲的时候,要么是晚上宝贝睡着后,而且我看的是中文字幕,不想费精神去琢磨英语了,对自己是否能看得懂英文也有所怀疑,但看的速度远没有说的速度快,所以在第一遍看的时候,他们讲到了四字格,我还很糊里糊涂,觉得他们在说我完全听不懂的内容,但还是用跟不上的节奏跳跃着看完,慢慢发现其中的奥妙,渐渐理解其中的乐趣,我想他们做着这项研究是享受着无限的惊喜的。因为说话的速度远快于我阅读字幕的速度,所以我不得已看第二遍,并做记录,做记录的时候偶尔会暂停。
最开始,演讲说一幅画面包含的词,5千亿个词。说想找到一副展现人类文明和人文历史的画面。我们需要依靠书本,而书本的量太大,我们不可能读完,但精读其中几本,又无法让我们了解历史的变迁。就此引出谷歌对印刷出版的书记的了扫描,经过筛选保留的5百万本书。但因为版权原因无法公开整本书,其实即使没有版权的问题,我们也不可能读完这5百万本,我们仍旧需要对这5百万本做更深入的研究。这项研究是这样进行的,研究在书中某个词或词组出现的次数情况,也就是在某段时间内被使用的频率,对所有的单词和词组这样处理,就得到了20亿个曲线,这些曲线帮助我们了解文化的走势。通过对不同语言书中曲线的对比,我们会发现当地的政治和文化差异对于书本产生的影响,反过来,我们从书本中当时的词汇的表现能印证当时历史上发生的事件。另外,宣传的作用——书籍审查——也会产生这类影响(这句话我不知道理解的对不对)。这非常的有趣。最后给出“文化组学”的定义:指的是对人类文明研究的大规模数据收集分析的应用,以数字化的历史记录片段作为透镜。计算机的功能真是强大,这样的数据分析只能发生在计算机时代。

关于这一篇演讲我几乎不能发出思考,除了开眼界还是开眼界,为我们的应用数学的发展高呼喝彩。眼见我们的学科分支越来越细,越来越边缘化,但实际上,却越来越交叉,越来越密切相连,你中有我,我中有你。我们用数学化的方法来研究历史研究文明,而且研究的结果和真实的历史还是如此吻合,真叫人惊叹!

你可能感兴趣的:(《我们从五百万本书里学到了什么》观后感)