关注:灰质,有趣有料的AI技术分享
数学在科学中的地位无可争议,爱因斯坦说,“纯数学能使我们发现概念和联系这些概念的规律,给了我们理解自然现象的钥匙。数学之所以比一切其它科学受到尊重,一个理由是因为它的命题是绝对可靠的,无可争辩的,而其它的科学经常处于被新发现的事实推翻的危险。”可以看出,一门学科的核心内容能够用数学做形式化标识,代表了其精确表达和可稳定重复,而且或许还可以借助数学的工具推理出很多未被发现的规律。
那么,在AI研究中是否数学还是那么重要呢?哪些数学与AI的关系更加紧密呢?今天我们来聊一聊。
数学是什么
直言不讳的说,恐怕我们大部分人都不喜欢数学,这恐怕与我们从小被强行灌输了很多数学知识并且不断被考试做题有关,让人感觉数学就是一门死记硬背,熟能生巧的计算器式的又机械又枯燥的科目,终有一日终于可以不必学习的时候就马上抛之脑后了。
其实如果追溯到数学的起源来说,数学并不是一门枯燥的学问,相反,数学产生于现实的生活,而且是被用于描述现实生活的,从结绳计数开始,到几何形状的描述,都是数学对生活现象进行抽象的一个过程,比如说球是圆的,但是真实世界中并不存在一个完美的圆,圆形本身是对类似圆形事物的一种概括和抽象。再比如阿拉伯数字1、2、3,是对数量的一种计量,但是实际事物有很多属性,数字本身无法完全描述,数字只是从一个角度去抽象了数量的概念。
这里在西方有一个主要的起源就是古希腊的毕达哥拉斯学派,他们说,“数学是现实的核心,万物皆数,数统治着宇宙”等观点,像是电影《达芬奇密码》中的背景就是这个学派的事情。后来巴比伦、埃及和我国古代都有很多类似的计数和算术的概念和方法发展出来。但是我们可能还是比不过西方对数学计算的崇拜的,将其发展到非常庞大与复杂的地步,更是有很多人认为数学是世界的本质,当然这里面每个人可以有不同的认识。我更相信数学是一种非常便于对世界运行规律进行精确描述的语言,而不是本质自身。
相对而言,我国后来对数学就没那么看重,一方面可能是因为我们的农耕文明发展到一定阶段靠着人力密集加上一定的科技水平就够用了,没有发展的动力;另一方面可能是我们的人也实在是太多了,资源相对紧张,大家都忙着奔命找活路,没那么多心思搞这些看起来短期没什么用只是用来满足好奇心的东西。总之呢,结果就是从古希腊人的文明开始,西方社会靠着好奇心和兴趣把数学的大厦建立了非常宏伟,直到越来越发现数学对于生产、装备等发明创造的好处,于是将数学在各个领域广泛应用,形成了应用数学方向,比如运筹学等,而原来纯数学的研究则继续作为独立的方向发展。
数学里的计算本身其实是个很有意思的事情,核心是通过抽象化的规则推理,就可以把实际事物运行的结果计算出来,提前预判事物可能产生的结果。可是如果想一下,这些规则从何处而来?他们并不是凭空产生的,而是对人类所见到规律的一种总结,所以,一个数学方向的建立就像是盖房子,总需要一些不证自明的公理作为地基,比如加减乘除的计算规则等,然后在公理基础上去建立定理,最后不断推理演绎出整个公理体系。而且多年以来,数学家们在不断的修正这个体系,让他对现实世界的描述越来越准确和可靠。
可以看出,数学的核心思维在于逻辑和量化,使用的手段是抽象和推理,逻辑表现在符号和图形,量化则是计算和代数。整个数学的体系也是建立在代数和几何,即所谓的数与形两个基础方向上演化出来的。
因此,学习数学本身更多的是在学习一种逻辑,而且不同的数学方向逻辑并不相同,因为数学的逻辑推理是建立在公理基础之上的,然后在假设的基础上得到一系列的定理,逐渐搭建起一个体系。公理就像是打地基,定理则是房梁和柱子,然后才会有整个房子。
继续想一下,如果是一种新的公理基础,就会搭出新的房子,经典的公理通常来源于某种观察或实践,逐渐确认后提出来的。比如1+1=2。如果你在某种情况下发展1+1不等于2了,而是等于3,那么基于此又可以建立一种新的计算方式。
说到这儿细心的朋友恐怕会发现,所谓逻辑是可以在不同情境下互相矛盾的,因为,现实中就是可能存在规律不同的事物,比如量子力学、相对论等就带来了直觉与现象的不一致,再比如视觉效果上,平行线在远处看起来是相交的,这是因为平行线在欧式几何中将空间曲率设定为0,当类似于地球曲率一样的非欧几何空间中,我们看远处的平行线就可能是相交的状态,这时候我们小时候所学的经典的欧式几何就变成非欧几何空间中的特例了。是不是很神奇。这也是数学家们经常要做的事情,把新的公理系统与之前的基础兼容起来,让他们不要自相矛盾,尝试建立一个统一的体系。
所以,本质上可以说数学不属于任何学科,类似于人类的语言,数学是一门科学研究经常用来做精确描述的语言,好处在于可重复性强,不容易出现歧义,因为已经把要表达的意思抽象成一种绝对的意义,在数学的世界里都有统一的定义,比如点,线,面,整数,有理数等,这些东西在真实世界中并不存在,但是对于很多现实问题的计算都可以抽象成数字来表示。而且数学并不是万能的,也是在伴随着所解决的问题不断发展的,比如一个问题怎么求解不知道,数学家们就会去寻找新的方法来解决。
反过来,数学家经常出于兴趣也好,好奇心或者荣誉感也好,提出一些猜想或者做出一些推理演绎,从纯数学的角度发展出来一些新的方法。过了很多年,居然在某种物理规律的建模中发挥了重要运用。
这里有个故事,狄拉克方程,就是这个方程开辟了现代物理中量子力学的新领域,首先是狄拉克把前辈们建立的量子力学、海森堡、薛定谔等相关的成果进行了融合,建立了狄拉克方程,对当前的氢原子结构等物理现象可以做精确的描述,同时还计算出了负能量态的粒子,比如正电子就会对应于负电子,可是当时的物理试验中没有办法观测到这样的粒子,直至后来发现了负电子,印证了反物质的概念是成立的。简言之就是,这个宇宙起初是由无数物质(电子)和反物质(正电子)构成的,物质和反物质的湮灭产生的无数的正负电子对就是所谓的迪拉克之海,也就是构成这个世界的基础。宇宙中物质多过反物质,所以未湮灭的物质构成了我们现在生活的这个世界。这就是数学推理的伟大之处了,预测还没有被发现的规律及现象。
AI中正在使用的一些数学方法
智能技术发展至今,其实经历了很多变化,上一个时代是机器学习,本质上是用一些函数拟合数据分布,然后用来做分类或者外推(预测)。这个时代则是神经网络,用各种网络模型来拟合数据,神经网路这种模型具有自己从数据里面迭代优化找规律的能力,设计调试好了可以逼近非常复杂的非线性规律。但其本质都离不开数学的支撑,比如神经网络训练的梯度下降法等,都是来源于数学的工具。
AI的核心技术大家都知道是算法,而算力和数据是其他专业发现出来的,算力属于半导体方面的硬件设备,数据是伴随着计算机,通信和传感器等使用而产生的数字化计量方式。那么,在算法的发展中必然就离不开数学的支撑了,因为对于数字的计算首先就需要数学,而复杂的问题求解就更离不开有效的数学工具。比如大脑的结构,极其复杂,目前是没办法在微观上精确测绘大脑在处理信息时的变化过程,因为神经元和网络太复杂了,变化也很多。而且,就算是目前把老鼠的大脑测绘出来了也没办法做精确的建模分析,因为整个网络的建模计算无法完全求解,只能先做一些简化假设,比如神经元的电位变化设定为0和1,但实际上并不是,所以数学在AI理论分析的很多方面至今还是比较缺乏手段的。
反过来说,当今神经网络推广应用的瓶颈也是数学模型不够清楚的问题,一个多层大量参数的神经网络为什么就能够代表一种规律,这种规律是否足够可靠?使用的限定条件是什么?等等。由于数学目前还无法对这样复杂的网络进行准确的建模描述,难以说清楚为什么这个输入的数据会给出这个输出,所以在可解释性,安全性等方面遇到了很多担忧和顾虑。
也可以说目前的神经网络有点像中医,经验性东西多一些,定理化的东西少,所以大家经常戏称算法工程师为炼丹师,因为这一炉丹药的炼制有比较大的不确定性,经验上觉得大致方向没问题,但是不一定具体是啥效果,试出来的配方就可以重复用,但是不保证下一种配方多少次能试出来。神经网络建模调参的过程大致如此。
不过呢,目前神经网络中用到的数学方法还是非常多的,比如偏微分方程求导计算方法,梯度下降等优化方法,马尔可夫过程的决策方法,概率统计方法,向量计算方法等,作为掌握当下的神经网络类模型是必要的数学基础。
如果扩大到智能的范畴来看的话,涉及的数学方法就更加广泛了,运筹学和优化理论,图论和拓扑学,概率论与统计学等等,几乎都与各种各样智能模型的建立有联系。但是对于具体研究方向和工作岗位的人来说,没必要都去掌握,不可能也用不到,因为大多数人所做的事情是在一个确定的方向下持续的精细和优化,才能够做的足够好,成为所谓的工匠或专家。
当然,工匠这个思路有时候在欧美并不这么认为,他们有时候会更强调创新性思维,鼓励破坏和创造,比如马斯克大佬,有些人会觉得这种创新比抠细节更有意义,有些人认为细节的优化是创新无能的体现,都是一种观点吧,没有绝对的对错。但是伴随着个人年龄的增大,多数也会逐渐减少这样的工作,用越来越有限的精力做更熟悉和细节的事情。
目前的AI数学化的过程是比较缓慢的,可能主要的原因是过于复杂的网络结构和庞大的数据量分析使得数学分析变得非常困难,这可能也是计算机、传感器等电子化设备的使用对人类大脑处理能力的带来的巨大挑战。让人类的大脑容易宕机,可以说当今社会之中,人类必须要熟练掌握计算机这个工具才行,否则很难适应时代发展的速度。没准将来就变成攻壳特攻队中的样子,人类逐渐把身体的各个器官替换成人造器官,直至最后把大脑也换了,如果人造大脑可以完美兼容现在人类大脑中的信息的话,那么人与机器的最后一道屏障也就消失了。
提醒一句,学习AI的数学别被很多讲大部头著作的帖子劝退了,什么学一下这个学、那个数的,duck不必,完全可以边用边学,比如先上手模型调个参,然后研究研究每部分为啥这么写,哪块有数学问题不懂了就去学,搞明白了就继续试验模型,千万别教条的先把概率统计学完了,再去看模型,那是搞理论的人才需要的做法,做工程和一般的使用完全不用这么做,主要是很容易坚持不下去。
未来展望
可以看出来,数学既是智能研究从经验到理论的必须手段,也是让智能变得可解释、高效使用的重要途径。在人类社会中,智能模型必然要获得人类的理解才能够被妥善的使用,就好像你信任的人才能够去高效的合作一样,否则总会有阴云浮在AI的上空。
更何况,就像飞机最早被制造出来靠的是模仿,但是当今社会能够制造高超音速的飞机就必须要对空气动力学有非常深入的理解和使用能力才行。所以AI的数学化发展才刚刚起步,当AI,尤其是神经网络的数学理论建立的那一天,人类的智能真的就可能被超越了,因为大脑处理复杂信息的秘密被揭开了,就可以被高效的使用了。
一点关于数学和AI的粗浅认识,班门弄斧,如果觉得还行,请给咱们支持一下吧,点赞、分享、收藏各种走起,在此多谢啦!
交流合作
请加微信号:yan_kylin_phenix,注明姓名+单位+从业方向+地点,非诚勿扰。