CAO做的事情
为企业引入成熟的机器学习方法,把数据变成训练材料,塑造自动化机制,寻找、发掘有价值的管理模式和客户模式,或者合理引入第三方人工智能流,支撑企业业务发展,并找到一个合适的创新循环:数据—算法—知识—用户体验—新的数据,循环往复,滚雪球式前进,在这个过程中创造商业价值。这就是CAO做的事情。
李彦宏(Robin )
CAO作为一个新角色会面临很多不确定因素。当他去寻找人工智能服务时,应该遵循什么标准?
吴恩达认为,人工智能在当下并不十分成熟,还谈不上统一服务标准,各家都在尝试。在这个层面,各个企业的CAO都很重要,因为他们也担负着探索的责任。但是,稳定、方便、好用的工程化产品应该是正确的方向,有助于人工智能的“标准化”。
比如开发者将可以在某个人工智能平台上方便地调用接口,享有稳定的智能流输出,支持企业运行和创业,就像现在人们在手机和开发平台上创造App一样。比如百度大脑平台。
关于AI的行业标准
对于深度学习神经网络,调节神经网络参数的工作极其复杂和多变,需要根据不同业务场景做特别优化,虽然算法的基本思想差不多,但发展各异,也谈不上统一标准。因此,训练神经网络又被称作“炼丹”。吴恩达的新书《machine learning yearning》堪称一部“炼丹”手册,不是在讲“丹药”怎么好,而是在讲“炼丹”当中遇到的难题和解决办法。深厚的经验和务实的方法,大约就是一种标准吧。(接下来的blog会涉及此书)
AI的看法
“机器学习不是为了证明某些原因,它的存在是为了针对一些特定的数据、行为或者是模式做出一些高质量的预测。算法唯一的工作就是让你能够更加有效、更加精确地达成目标,而不是告诉你为什么。”
数据分析公司MixPanel的CEO苏海勒(Suhail)
问问“为什么”也是重要的。在大量的企业应用中,有些企业家急切地希望深度学习网络和数据挖掘能够马上带来利润的大幅度增加,而忽视了机器学习的规律以及企业自身的学习规律。
当企业大到一定规模,业务和数据复杂到一定程度之后,自身的运作逻辑往往是模糊的,不同于企业明文手册上的描述,即便是企业管理者对此也会感到陌生。机器学习具有根据数据反向求得函数逻辑的能力,这种反向推演能力可以给企业运作者提供一种观察企业非显性逻辑的视角。
比如对企业邮件往来的关系分析,对电商用户下单时间的分析,对新闻网站发布资讯的时间段分析等,都可以帮助企业了解自身可以在哪些方面进行优化。
在对外业务上CAO可以带来显著的锦上添花的作用。比如建立自动化的客户需求分析系统,能够即时提交订单信息和生产信息给客户参考。但对内管理也十分重要。以制造型企业为例,生产管理、物料管理、质量管理、设计变更的信息化和数据化都需要整合,数据化达到一定程度后,辅以算法和开发,人工智能就水到渠成了。
在企业内部,智能的素材已经以“流”的形式出现,产生于每个员工、每个机器的每一个工作环节。这些数据流、信息流每天都在产生和流逝,但很多企业却没有意识到,更谈不上利用,而是任其挥发。企业内功是和每个员工都相关的问题,比如个人的信息共享、知识管理、工作操作习惯的记录和优化等。
举个例子,网络新闻媒体的编辑每天都在录入文章,一些网络媒体拥有上千个编辑,每个人做着自己的工作。智能系统会侦测统计他们的录入操作,发现哪些环节的鼠标点击工作过多,这其中可能预示着录入系统的设计不合理,据此提出录入系统的优化建议。
吴恩达认为,传统企业尤其需要依靠CAO来了解前沿应用,升级自身业务。当然,面对很多可能的方向,CAO还是应该先抓住一个部门或者一块业务重点突破,形成典范,吸引其他部门燃起热情。毕竟,企业智能化是一个非常需要创新精神的事业,需要广泛参与。
CEO可以放权让CAO去施展,甚至亲自推进企业第一个智能化业务。
人工智能在模仿人类的思考习惯。科学家普遍强调人机结合是未来的发展方向。类似地,智能科学家和CAO都不会是机械论的化身,而是对各种知识具有全面的兴趣。吴恩达本人就是个例子,他不仅喜欢计算机科学,也喜欢人类学和社会学,还喜欢教育学——为了让更多人受到名校教育,把课堂教育重复使用率最大化,他合伙创立了Coursea在线教育课程项目,至今仍然是董事会成员。另外,他对心理学也有极大兴趣。
CAO可能是《生活大爆炸》里有趣的理工男,善于发现别人没发现的契机。也可能是数据领域的夏洛克·福尔摩斯,善于明察秋毫。不过他终究首先是一个具有“数据感性”的人。
他懂得利用数据,最重要的是在别人看不到数据的地方看见数据。
1. 有能力从纷繁的数据中嗅到可能有的关联
沃尔玛的“购物篮分析”是典型的数据挖掘应用,数据分析师想到从顾客购物小票里发掘购买对象之间是否有相关性。经过数据统计,他们发现除了牛奶和面包会经常被一起购买这种显而易见的关系之外,还有很多以往没发现的关系,比如婴儿纸尿裤常常会和啤酒一起被购买,然后才发现年轻的爸爸在购买婴儿用品的同时,往往会有一种犒劳自己的心理,于是购买了啤酒。
沃尔玛超市因此把啤酒和纸尿裤放在货架上靠近的位置,显著提升了销售额。沃尔玛的数据毕竟有限,并且只有购物小票这种用户数据。倘若数据巨大,且可以自动化调整每天的货架,就具有了人工智能的雏形。
CAO所需要的思维模式究竟是什么——正是我们一再强调的相关性思维。牛奶和面包、啤酒和纸尿裤之间的联系,显然并非是以往科学领域的确定性关系或因果关系,而是一种以概率形式展示的强相关关系。想到从这个角度去发掘价值,这就是CAO具有的素养。
2. 在数据之上,CAO及其伙伴需要有场景感知能力,懂得场景计算(以业务导向转向场景导向)
未来,“业务”的概念将会变得模糊,“场景”成为事物运作的核心,这意味着产品不再像过去那样围绕业务来分类,比如新闻App做新闻,电商App做购物等。现在你有什么样的场景,就可以导入这个场景所需要的一切服务,比如一款移动支付应用,要考虑各种支付场景,如果提供购买电影票功能就要根据用户行为数据猜测用户正处于什么使用场景,除了看电影,是否需要阅读影评,是否需要购买爆米花。企业要做的是根据场景重新规划,打通业务,而不是根据业务来划分产品架构。
吴恩达认为,合格的CAO应该有管理人工智能团队的经验。由于人工智能进化飞快,他们需要跟得上变化,但要求他们必须处于最前沿就没那么重要。更重要的是他们能跨职能部门进行合作。独立的技术是没有什么意思的,技术需要为人提供服务。机器与人的关系非常重要。要想做最好的人工智能,就需要既懂技术又懂人。人工智能是一场人机之间的故事。CAO既要善于理解机器智能,也要善于理解人情事理。
主流科学发展的核心轴线是数学的发展,牛顿的《自然哲学的数学原理》一书把数学在自然哲学中地位推到了无与伦比的高度,以至于在科学类论文的发表必须要有数学公式,要从数学的角度解析万物机理,抽象出简约使用的理论模型。
将其提升到的哲学的角度,一个著名的论断就是拉普拉斯决定论。
个人理解为因果论(世界的一切法,如水中一个个浮起的泡沫,又如春夏时阳光照在大地上,形成的反射幻象,如早晨花叶上的露水,亦如醒来后就立即散去的梦境,庄生梦蝶,物我两虚。因此有一位贤者说:“一切诸法,皆是虚幻本空,而唯有因果,永不落空。”)
拉普拉斯简单地说就是:整个世界就是机械决定论的。给定了初始状态,那么物体就会在物理定律的制约下作出唯一的运动,并且这运动是可以预测的,是可以反向推导的,因而所有的事物都在最初的那一刻被完整的唯一的确定了。
例子:一块石头平衡地置放在山顶上,在它的内部存在着势能,这种势能可以潜伏许多世纪。一旦它受外力的推动,并超过了临界点,那么这块石头就会顺着山坡向下滚动。如果人们精确地掌握了全部有关的因素:它将会碰到的灌木和树枝及地面的摩擦系数、山坡的角度与湿度等等,那么这块石头滚动的精确的速度和到达的终点都是可以预测的。假设决定论是真实的,那么这块石头就会滚到它必然到达的位置。
但是随着量子理论(微观不可测),第二热力学(时间不可逆),以及混沌理论(微小扰动——这个微小扰动可能就是无法精确测量的——会产生两个不同的宇宙)的成熟,拉普拉斯决定论遭到了巨大的冲击。
关于量子力学的概率问题,哥本哈根学派有一个重要论断,玻恩规则 – 事件发生的概率是它概率幅长度的平方 – ,它不需要推导,也不需要解释,因为它很任性地天然真。
哥本哈根学派认为:世界本身就不是决定论的,而是內禀随机的。不但我们不可能准确预言下一刻将发生什么,而且下一刻发生什么本身就是不确定的:我们只能预测它“可能”发生什么,而且整个自然界也只能知道它“可能”发生什么。而玻恩规则给了这种“可能性”一个定量的度量。
人工智能和神经计算框架之间非常有趣的联系,这两个框架都采用分布式表示超大向量,其基本运算都是线性代数而不是布尔代数。它告诉我们人类的大脑和物理性质的计算方式相似。甚至有科学家提出,人类的大脑运作原理与量子物理、量子计算理论、量子计算算法类似。
量子计算跟人工智能有本质上的关系。量子计算的核心就是利用量子的叠加状态。量子有一个能力状态的变化,就是加一定的能量以后会改变状态。不同于现在的计算机数位,0或者1,一个时间只有一个状态。量子的叠加态特性可以在同一时间有四个状态,计算能力呈指数上升。
深度学习的核心计算是不同的,是矩阵和张量的计算,不是0和1的计算,而且一定要进行微分运算。量子计算也是一模一样的,每个量子改变能级的时候,就是一个矩阵和张量的计算关系。大自然其实就是这样计算的,人脑也是一样。Matthew Fisher(马修·菲舍尔)、潘建伟、朱清时等科学家都认为,意识的本质就是量子纠缠。
蜗牛认为:量子计算机相对于拉普拉斯决定论对自然的解释更加开放,玻尔、玻恩等人相信上帝掷骰子这一大胆的想法在科学上的意义不亚于于人类在从懵懂的混沌状态进入了文明时代。
《智能革命》李彦宏
《量子世界的决定论、概率、以及拉普拉斯之妖》 --知乎
百度百科