大家好,我是八爪鱼,今天给大家分享的书籍是《数学之美》
这个题目估计会把人吓跑一半,是的,这是一本科普书。
虽然是科普书,确把我看得热泪盈眶,不是书写的多么感人,而是,这本书实在是相见恨晚。当然这么说好像是有些夸张,但这本书确实是让我感觉应该早一些看看就好了。因为八爪鱼虽然是正宗的理工男,但真的非常讨厌数学,更认为自己没有数学天赋,导致自己一路走来,虽然也算披荆斩棘,但每次只要是跟数学有关的考试,都大败而归。
在八爪鱼看来,每次一说到数学就头大,脑海里就会浮现一大堆枯燥无聊的符号。有人说,数学是上帝的语言,是什么什么理解自然的钥匙。自己千辛万苦从学校蹦出来后,勉强认为算是拿到了几把钥匙,但这么多年来真的不知道那扇门在哪,钥匙也就锈迹斑斑了。
而自从看完这本书,我越来越认为,自己的数学残疾完全是因为学校里讲数学太烂了、数学教材太烂了。如果八爪鱼上高中的时候能看到这本书,现在的八爪鱼也许能从理工男变身于it男,金融男,能天天品着茶、大把大把数着钞票。。。唉,反正至少不会像现在这么苦逼吧。。
所以,我强烈建议教育部,把高中数学教材换成这本《数学之美》,把数学老师的考核方式改为背诵本书中的名言警句。把高考高考解题变为写本书读后感,来拯救哪些本来像我这么禀赋过人,但深受传统教育毒害的同学们。
你可能问,说你这么讨厌数学,怎么会找着买这本书呢,这里插句题外话,就是京东实在太坏了。这本书是刘强东硬送我的,东哥他们是在是大大的奸商,非常的狡猾奸诈,我已经被他们诱骗两次了。第一次很多年前是买了几套专业书,然后送了我《明朝那些事》第一本,结果看完第一本后吊足了我的胃口,就毫不犹豫的买了第二本,接着是第三本、第四本。。。一趟下来本来预算只有100元,结果从我口袋里夺走三四百大洋。
这次也一样,京东送了我这本《数学之美》,后来我发现作者竟然还写了《浪潮之巅 上下》、《文明之光》、《大学之路》,于是跟明朝那些事一样,我咬牙切齿又买了第二本、第三本。。。
不过,话说回来,写的真心是不错。和八爪鱼之前分享的从零到一类似,本书一开始是作者在谷歌黑板报上的一系列文章,获得了大量的点击量后在编制成书。
作者吴军是谷歌的早期员工之一,谷歌资深研究员,毕业于清华大学和美国霍普金斯大学,是谷歌中文搜索引擎的主要设计者,曾任腾讯搜索引擎副总裁,霍普金斯大学校董。
他把数学后面的本质思维写的生动透彻,文字引人入胜,吴军的笔下,数学不再是一堆深奥的符号,而是实实在在的在源于生活的有趣的现象和思想的延伸,让人惊叹。
那么从作者的角度数学之美到底美在哪里呢,又能带给我们什么启发呢。
一直以来,我们认为数学主要是跟工科理科类的专业联系在一起,比如天文学学、工程学、经济学、力学、物理、化学,甚至生物学,和语言学几乎是没有交集的。而本书也是作者借助在语言和信息领域的工作经验。从语言和数学的关系方面切入进来,让我感到很新颖。
我们大概都明白语言的产生过程,早期人类需要了解和传播的信息是很少的,因此他们并不需要语言,随着人类进步和文明的发展,表达的信息越来越多,语言也就自然而然产生,而且随着历史的推进,语言越来越丰富,越来越抽象。当语言和词汇多到一定程度,人类仅靠大脑已经记不住所有词汇了,于是记录信息的需求就产生了,这便是文字的起源。比如,公元前3200年的古埃及,文字的数量大约也就500多个,到了公元前500至700年,文字的数量增加到了5000多个,而后到现在文字的数量就不再增加,应为一般而言我们根本记住不这么多文字。就汉语来说,我们常用的也是这5000多字。但是文明继续发展,需要表达的信息越来越多,于是我们发明了归纳和分类,我们用同一个字在不同的场合表达不同意思,当然随之而来歧义也就产生。
而在记录文字的过程中,人们也发明了很多有意思的方法,比如,在没有印刷术之前,西方的圣经主要依靠人工抄写传播,但人工抄写就免不了会出错,尤其每每写道上帝这个词时,抄书的人要虔诚的洗个手祈祷一下,等回过神来,就想,我靠,我刚才抄到第几行了,这样错误就更多了。于是犹太人想了个办法,每个字母都用一个数字表示,这样每行文字加起来就是一个特别的数字,数字错误就代表抄错了。听到这里,搞it的人已经笑了,这不就是校验码吗,是的,这个古老的方法直到今天都在我们生活中广泛的应用,比如我们电脑拷贝文件的时候,再比如我们额身份证最后一位校验码的应用。
可以看到,文字可以看做是数字编码,如果我们用不同的数字来代替独立的文字,再来用计算机来处理这些数字编码再合适不过了。于是我们设想,机器能不能懂得自然语言呢,能不能翻译工作呢,能不能自己写作呢,现实已经告诉我们答案是肯定的,而且做的相当不错。
当然我们一开始走了很多弯路。开始的时候,大家都认为,如果要让机器明白我们的语言,就必须让机器跟我们有一样的思维方式,有一样的智能。为什么,很简单,因为我们就是这么做的,我们自然而然就想到了这个。
这顺利成章的让我们想到如果我们语法概括的越全面,计算机速度只要足够快,就能让计算机理解语言,于是我们想只要分析好语法规则就好了。而对于计算机这样的严谨的机器最擅长的就是根据拟定好的程序运行,可以说最喜欢东西就是固定的规则,于是那个时候涌现出了一大堆语言学家开始研究语法和他们的应用。就拿翻译来说,所要做的就是不断的总结归纳语法,然后把每个句子应该应用哪条语法规则找出来,换成另一个语言的语法,再把词换掉,就算完成了。
但是这帮语言学家整了几十年,发现即使是总结了几万条的语法规则,也不过只能覆盖生活中不到20%的真实语句。而用计算机计算时,分析每一句话计算及需要在几万个规则里寻找到可用的一个,即使是用现在的最新i7电脑,分析一个三十个词的长句也要好几分钟的时间,效果就可想而知。
早年的翻译软件,比如金山快译用的就是这个方法的简化版。
直到1970年IBM花生实验室的一名叫贾里尼克的人,开发语音识别的软件时,发现根本没有必要分析句子的语法,而是只要统计统计类似的文章,看看一个单词、或一个句子,在类似的上下文中这个单词或句子出现的概率是否大就万事大吉了。这个发现一下子把语音识别的准确率从70%提高到了90%以上,并且计算量得到了大大降低。贾里尼克甚至幽默的说,他每开除一个语言学家,语音识别率就会提高一点。
到现在,这个通过概率统计方法被大量的用在了语音识别、手写识别、文字识别,语言翻译等等各种各样的场合。所以别被所谓的现在的人工智能吓倒,现在计算机还没真正的智能,只是通过计算或是比较以前的样本,告诉你最有可能对的结果而已。
看到这里,曾经认为概率论跟我一毛钱关系都没有,大学概率学曾经拿过近乎零分的我,一下子豁然开朗,感觉复杂的问题一下子简单化了,这里我看到了概率的魅力,数学的魅力。也展现了解决问题的一个思路, 就是换一个方向,效率可能更高。
如同我们发明飞机之前,我们曾尝试各种通过模仿鸟儿飞行来制造飞机,都以失败告终。但实际上,我们并没有模仿出鸟儿的飞行,而是是通过空气动力学解出的方程发明了飞机。能突破自己的固有思维,也许我们面临的最大的障碍。
接着刚才说的语言分析,其实可以发现,实际的语法是无限条的,换句话说,任何文字文学都有语法覆盖不到的地方,而其实正是这些例外或是不精确不确定性,让我们的语言和文学更加的丰富多彩。比方说我们的散文、和诗歌吧,如果按照语法检查,我相信大家一定能找到很多病句,但可能就是这些病句反而成为了很多经典。
刚才我们曾说道文字从诞生到现在我们常用的也只有5000多字,但需要表达的不同意思确却远远大于这些字,所以免不了会产生歧义,怎样消除歧义的影响呢?接下来,作者将不确定性的思路反过来,引出了书中一个很唬人但最重要的概念,就是信息熵。
当我们需要搞清楚一件非常非常不确定的事,或是说我们一无所知的事,就需要了解大量的信息,而对某件事已经了解很多,则不需要了解太多的信息就能搞清楚。可以说,信息量就等于不确定性的多少,信息熵其实就是信息量的定量表示。信息熵是可以计算的,单位是比特,一个汉字的信息量大约是5比特,比如一本50万字的书籍,信息熵大约就是250万比特。一本很厚的英语小说,翻译成汉语,会薄很多,也就是说相同量汉语的信息熵比英语要高,信息量更大。而信息的作用就是消除这些不确定度。
进一步延伸下去其实我们所做的很多事,甚至所有人类活动,都可以理解为消除不确定性。而我们追求的就是通过高效的方法,更少的信息量来消除不确定性。比如,我们使用某个软件觉得非常方便好用,实际就是软件将大多数不确定度都帮我们消除了,消除剩余的不确定度我们花的代价越小,就觉得越方便。再比如我们学习某项技能、我们使用搜索引擎,我们进入某个特定的领域等等都是消除不确定度的体现。
消除不确定性成为了作者在本书中的主要观点之一,生活中也有非常的受用,作者提到的贾里尼克告诉他最多的就是怎样的方法不好,而不是应该怎么去做,这实际上就是在消除不确定度。这一点也和股神巴菲特告诫投资者们,我不告诉你们应该做什么,只告诉你们不要去做什么的套路不谋而合。
从信息的不确定度和熵的概念,作者又进一步引出了更为深奥最大熵原理,简单讲就是当我们遇到不确定性的时候,要保留各种可能性才能获得更好的结果,有些类似不要把所有的鸡蛋放在一个篮子里。在自然界,我们尽力保护每一中生物不被灭绝,我想也是这个道理。这么讲看似简单,但应用确不那么容易,据说目前世界上能有效实现最大熵算法的不到一百人。而上面讲到的贾里尼克离开IBM后,应用最大熵计算模型的在金融领域获得了巨大的成功,成立了世界上最成功的对冲基金公司之一,其能量可见一斑。不知大家是否想试试。
熵是在是非常神奇的东西,在八爪鱼的所学工程专业中一个重要的概念,与信息熵一样也蕴含着很深的哲学思想,比如所有事情一定会自发的朝着熵增加的方向发展,如同我们中国道的概念。待有机会八爪鱼给大家分享分享,看看能不能给讲明白。
除了信息熵,作者还讲述了信息加密及破解、内容的分类、智能推荐、搜索引擎、以及最近比较火的大数据、人工智能的背后原理等等。也讲了很多古典数学发展及现代信息大师的很多故事,比如哥白尼怎么发现的日心说,现代历法是怎么精确计算出每年是365天,以及很多的小感悟等等,非常的有趣。
最后,需要告诉大家本书虽然是通俗的讲解数学,但一些内容仍有一点点的专业度,需要一定的数学基础。如果觉得挑战实在有些大,可以看看作者的另外一本书,智能时代,写的更加通俗一些。
另外作者的另外几套套书浪潮之巅, 文明之光、大学时代也超级棒,一套是讲硅谷的创业史,一套是高等教育的发展和思考,尤其是文明之光、大学之路,非常值得一读,希望未来有机会向大家分享。