机器学习杂谈(一)

此开卷第一回。即要言引导未来之技术,必要从人类之宏大目标说起,这个目标就是:从已知预测未知。

自东方的盘古开天地or西方的上帝创世纪始,能够从已知预测未知,就是人类孜孜以求的目标。东方的长老,西方的先知,之所以能受人尊重、被人敬仰,盖因为他们能从目下的已知推测\占卜\预言\计算未知。当然,这份预测的能力,也在随着人类文明的进化不断向前发展。下面,我就为大家截取两个片段,与大家分享一二。

第一个片段是关于占卜的。没错,占卜是人类由已知推测未知最古老的方法。而这其中的大成者,当数中国的《周易》。无论你怎么定义《周易》,但它本身是本占卜书想来没人会有异议。周易,其实是有着严格的占卜操作过程的。首先,是要用蓍草推算出六爻,再根据六爻从周易卦辞中的含义,加上巫卜神职的解说翻译,用以预测未来。预测的准吗?反正史书上记载卦无遗策。(对了,忘了跟大家说,史书最初也是巫卜负责编写的。)这占卜算卦,其实依靠的就是卦象与未知的相关性,当然这个相关性就只有卦书和巫卜知晓咯。

第二个片段是关于机械主义科学的。对,就是牛顿用数学公式描述的那个科学世界。熟悉科学历史的童鞋应该都知道,牛顿的运动定律,并不是苹果砸出来的。而是从开普勒三大定律推演而来。而开普勒三大定律则离不开开普勒老师第谷一生孜孜不倦地收集记录星空数据。其实牛顿就是在数据的基础上发现了一套公式,而在这套公式之上,科学家又不断完善,建立起来了一个宇宙体系。人类便可凭借这套体系,预测宇宙的未知变化。这套依靠确定性因果关系的体系如此强大,以至于在爱因斯坦之前,人们坚信物理学已没有新知识,只要知道初始条件,人类可以预言一切。

当然,最终这两个历史片段都没能完全完成从已知预测未知的任务,但是其中的共性却值得我们思考。首先,人类在预测未来时,都需要已知的数据。占卜来源于日常生活经验,科学则需要观测和实验的数据。而且对预测的要求越高,需要的数据就越多:科学就比占卜需要更多的数据。其次,预测需要从已知数据中总结出与未来有关的相关规律,或曰算法。《周易》就是占卜的算法,而牛顿的算法就是他的三大定律。第三,要完成预测,需要将算法结合数据,建立起一个模型来,人们用这个模型就能开始对未知的预测了。在占卜中,模型就在巫卜神职的脑子里;牛顿世界的模型是他之后无数科学家建立起的宇宙体系。当然,一般数据和算法确定了,模型也就确定了,所有数据和算法为体,模型为用。人类预测未知的过程,其实不外于此。

兜了这么大一圈,我们现在回来看看机器学习。其实机器学习就是把上面过程中最后一步——也就是根据数据和算法确定模型的过程——让机器自己来完成。机器学习就是依靠机器强大高效的运算能力,建立起一个针对具体未知事件预测模型的过程。当然,这个过程中,数据是要提前整理的,算法是要人类选择的,只有最后一步是机器自己做的。但是仅仅是这最后一步的自动化,就为人类带来了突飞猛进的发展,足见机器学习之强大!

最后,在总结一下,机器学习是人类用已知预测未知的新武器,它使用特定的算法,从已知数据中建立预测模型,然后再用模型来预测未知。

想知道这个模型建立过程的具体细节,且听下回分解。

(从占卜到机械科学,再到机器学习,是一个从相关关系强化到因果关系,最后又泛化为相关关系的过程,但是符合哲学上的否定之否定原理,说明事物发展的螺旋上升哈)

你可能感兴趣的:(机器学习杂谈(一))