[2016年6月23日 星期四 下午4:57]
上午和老大讨论到了人工智能。星巴克里阳光跳跃。老大作为创业圈里浸淫多年的典型代表,心中自有滔滔伟略。我多想说我作为工业界混学术圈的典型。可我偏偏是一门外汉。门都见不着那种。为了写篇博客,Goolge了半天,终于起了个头。
庄子写《逍遥游》,引出贯穿整部书的“小大之辨”。何谓小而何谓大,独不敢妄下结论。姑且仅就“辨”,依据本人有限的见解,整理一些浅见如下。首先是一篇笔记。最希望看到的一种情况是,三五年之后,自己再翻出来看到这些结论的时候,只会轻轻“呵呵”两声,然后伸长大拇指按了按左上角的“返回”。
关系
在大众媒体,创业家,包括产品经理,业务代表的眼中,人工智能的世界或许有下列的递进关系:
A关系:概念(Concept) > 人工智能(AI) > 领域(Domain) > 场景(scene) > 应用(Application)
他们的脑电波是类似这样的:
酷,简直太酷了,我们要模拟人脑!人脑强不强?强!会推理,会联想,会判断,会画画,会下棋,会写歌,会撩妹!Ok,我们模拟人脑准没错啦。好,人工智能是模拟人脑,那我们来看看人工智能。哦对了,我们是哪个行业来着?移民火星,您的一站式人生规划平台。你来一个客户,我们的人工智能平台会告诉你,选择套餐A、套餐B、套餐C,就可以把你送上火星把你打造成华人地区首富。是不是很牛逼?赶紧掏钱加入到我们的人工智能平台中来吧。
而另外一种递进关系,会否可以是这样:
B关系:领域(Domain) > 概念(Concept) > 场景(Scene) > 应用(Application) > 人工智能(AI)
Hi,我们帮助你移民火星,您的一站式人生规划平台。我们公司有三千名经纪人为你量身打造属于你的火星生存发展规划。不过,现在的客户都他妈太扯了!纳尼?这提的是什么要求!我们三千经纪人穷于应对,纷纷跳楼自杀了。我们现在需要一种能够主动学习每一个客户千差万别的情况,能够综合分析各类因素,脑袋比人快3万倍的,那个,机器人!是的,机器人。它(他)还不是个铁皮驴子,还是会思考的,牛逼吧!
这两种关系,可以被解读为“战略”与“执行”的关系。战略家有战略家的方法论,执行者有执行者的脑线图。两种顺序孰优孰劣,不是重点;重点是方法论采用了哪种顺序,而脑线图又采取了哪种顺序。基因决定之。
推论
前文提到了“机器人”。赋予了人工智能属性的机器人之所以会被创造出来,是因为:
- 1,要用人工智能来代替繁重的人类劳动,比如自动问答。
- 2,要用人工智能来做人类做不了的事情,比如决策支持。
当大家谈到人工智能,更多的倾向于后者。确切来说,更倾向于基于神经元模型、神经网络理论等实现的机器智能算法。自动扫地机器人算不算是人工智能?它还会规划清扫的线路,扫完了还拖,没电了就返回充电,应该是人工智能吧。但它怎么就算是人工智能呢?但是,Who care?
对于习惯使用A顺序思考的战略家来说,扫地机器人必然对他无动于衷。习惯于使用B关系思考的执行者来说,似乎更容易看到扫地机器人和“移民火星”机器人的区别与联系。摆在扫地机器人和“移民火星”机器人面前的场景是:给定一个不规则的输入,我挑选一套方案。
最近,传说中的深度学习打破了上个世纪六十年代神经网络的思维窠臼,又让后者重回主流。毫无疑问,会下国际象棋并且下的无比厉害的机器人AlphaGo,自然是人工智能,并且是顶尖的神经网络人工智能。然而,会下象棋的机器人早已有之。摆在AlphaGo或是任何其他下象棋机器人面前的场景是:给定一个任意的棋局,下一手怎样落子胜率最大。
就本质而言,所谓“机器人”即程序。
就我而言,扫地程序能够扫地,象棋程序能够和我交手几个回合并且让我煞费苦心,在B顺序人眼里,仅此足矣。而在A关系人眼里,这么low的东西还拿出来讨论简直是可笑。
好歹有点技术
人的思维能力从何而来,大约只有上帝知道。五十年代计算机科学家企图从解剖学角度,用“突触”、“递质”、“脉冲”,结合概率模型,优化理论,构建了一套粗浅神经网络计算框架。大约又过了几十年,钻研神经网络的计算机越来越感觉到心有余力不足,深有误入死胡同之感。他们之中的有些人开始另辟蹊径,他们:
- 在几何结构上下功夫,发展出更高效并且能够自圆其说的分类器。
- 在概率随机理论上下功夫,发展出凸优化模型。
- 在数学公式推导上下功夫,发展出更简洁的感知机。
- 在先验和假设上下功夫,发展出更优美统计方法。
- 引入信息量和熵的概念,发展出最大熵模型。
如果谁能把这个列表写完,也许是篇不错的综述论文。
这大概一晃又过了十来年。得益于计算能力提高,“突触”、“递质”、“脉冲”那一套东西又被重提(深度学习),更诡异的“隐藏层”,更别开生面的“激活函数”,更刁钻的各种“记忆门”。时至今日这一套理论依然有巨大潜力尚待挖掘。
简而言之,我们期望现代神经网络能够解决这样一类问题:
复杂内部因素 + 复杂外部因素 -> 结论
因此,此类模型非常强于处理非结构化数据或是高维数据,比如图像,声音,棋谱套路等等。它能够给我们带来更多“意料之外、情理之中”的结论。
有别于现代神经网络,传统机器学习擅长所谓特征工程:
知识库 + 特征工程 -> 结论
它能够给我们带来更简练,更容易获取、易于理解的结论。如营销策略,潜客挖掘各种场景。一点也不用觉得奇怪,因为人对特征进行了干预。这种干预是好是坏,需要进行判断。
无论哪种智能技术,都必然需要“学习(Training)”,和“推断(Inference)”过程。相信如果有外星人,他们要发展某种“外星人工智能”,“学习-推断”的逻辑终将是他们的绕不开的首选。只不过由于大脑的结构不大一样,学习的方式也会不同罢了。
总结
这篇笔记提到了许多之辨,创想与实干之辨,工业届与学术界之辨,场景与落地之辨,传统机器学习技术与神经网络之辨。再次,我希望证明我是错的。越快越好。