2013.9.15
在这周里,我逐渐养成了自己的良好习惯,每天至少看一小时文献,观看机器学习公开课视频,每晚离开实验室之前记录好一天的工作内容及进度。我相信,在良好规划的指引下,进步会越来越明显。现在主要精力还是放在论文阅读和写作上,那天导师问我有个小项目做不做,我没有回答,大概他从我的眼神里看到了我的拒绝,他也没问下文了。我想如果项目超过了五十万,那么我会帮忙做下,如果没有,我宁愿少赚钱也要先把学术做好。毕竟,从长远来看,年轻时做学术将来可能走得更远。
回到今天的主题——《数学之美》,大部分人应该都知道这是Google吴军的大作。虽然吴军现在已不在Google工作了,但是我认为只有在Google他才有机会写出这样一部名作,Google也是给予了他最多的地方,所以这得把该书的一部分功劳归于Google。
大学至今,我都是在学工科,电子、信息、通信的一些基本课程我都上过,当然,数学是学得最多的,大一、二年级时花了几百个课时学数学分析,此外还学了线性数学、概率论与数理统计和计算方法等,研究生还修了高等工程数学。以前,我认为数学是一种计算工具,在科研中可以利用它来计算结果。它在我心中从来没有超越“数学工具”的概念。直到我阅读了《数学之美》,作者用通俗而又精准的语言描述了数学在各个领域的应用后,才明白它是那么的神奇而有魅力!
这本书不是简单的科普书,阅读它需要一定的理论基础,数学基础自不用说,此外还要有信息论、信号处理、算法导论的一些基础(不是每章都要求具有所有的基础知识,这是对通读全书的所有要求)。否则,一般读者看了不知道他在说啥,自然就不能体会数学之美。
此后,我还看了部分的《机器学习》视频课,联想到《数学之美》,我有了一些感受。
1.“数学模型”比“数学工具”的概念重要
不得不佩服吴军,他的研究领域很广且深,从搜索、语言处理到搜索反作弊。谷歌中日韩搜索他的功劳最大,搜索反作弊甚至还得到了Google工程奖。他给我们讲述了统计语言模型、隐含马尔可夫模型、PageRank、地图搜索、新闻分类、信息指纹和搜索反作弊等。可以看到,数学最大的作用在于将各种各样的问题具体成数学模型,也就是将生活中一些翻译成了数学语言。数学工具本来不能解决任何问题,直到有了数学模型后它才有用武之地。
2.很多高科技应用的不一定是很高深的“数学模型”
比如在自然语言处理问题中,过去几十年用尽了各种复杂的算法,想尽可能让机器有人类对语音的识别功能,然后由于计算机速度的限制和模型太复杂使得过去几十年的语言处理发展缓慢,导致过去几十年最大的进步是知道了哪些方法行不通。直到隐含马尔可夫模型的提出,才奠定了今天语言处理的基础。“隐含马尔可夫模型是一个并不复杂的数学模型,到目前为止,它一直被认为是解决大多数自然语言处理问题最为快速、有效地方法。它成功地解决了复杂的语音模型、机器翻译等问题。当我们看完这些复杂的问题是如何通过简单的模型描述和解决时,会不得不由衷地感叹数学模型之妙。”
这样的例子在机器学习中尤其多,机器学习理论的出现可以说改变了计算机的定义。以往,计算机只能完成程序里有考虑的工作,一旦超过人所规定的范围,它会不知所措。但是机器学习使得计算机有了学习的能力,它能够通过自身的学习来处理从来未遇到的问题。当然,现在机器学习的智商大概还处于小学生相当的水平吧。纵观机器学习,其中理论不外乎经典的概率论中的模型,贝叶斯判别法、Fisher判别式、数据拟合,这都是我们曾经耳熟能详的基础知识。
3.学懂数学比考高分重要得多
有了上两点感触,这一点几乎可以不用提了。但是出于强调的考虑,在这里还是单独作为一点。因为,我曾经作为一名初入门的本科生时,从来没有觉得理解数学思想比考高分重要,这样做的后果是让我现在不得不认真思考隐含在数学模型背后的含义。还是以贝叶斯方法,这个简单的公式在高中就已经学过,它很久以前(估计19世纪,不确定)就提出来了,它的公式是如此简单甚至让人产生不了任何联想,可是如今最火热的机器学习方法却有它很大的用武之地。不得不说,数学的奥秘无穷无尽,即使最聪明的数学家也难以穷尽其应用,只有将数学应用到实际中才会碰撞出惊人的创新火花。