AI前瞻 | 思考机器学习的方法

我们现在已经有四到五年的机器学习时间,而且几乎每个人都听说过它。这不仅仅是初创公司每天都在形成,或者大型科技平台公司正在围绕它重建自己 - 科技之外的每个人都阅读了“经济学人”或“商业周刊”的封面故事,许多大公司都在进行一些项目。我们知道这是下一件大事。

更进一步,我们大多理解神经网络可能是什么,理论上,我们得到的可能是模式和数据。机器学习让我们可以在数据中找到隐含和概率(因此“推断”)而不是显式的数据模式或结构,以前只有人而非计算机才能找到。它们解决了以前“难以为计算机而且对人们而言容易”的一类问题,或者更有用的是,“人们难以向计算机描述”。我们已经看到一些很酷(或令人担忧,取决于你的观点)的演讲和视觉演示。 

但是,我不认为我们对机器学习意味着什么 - 它对科技公司或更广泛的经济中的公司意味着什么,如何从结构上思考它能够实现的新事物,或者什么机器学习对我们所有其他人来说意味着什么,以及它实际上可以解决的重要问题。

“人工智能”一词并没有帮助,“人工智能”一旦开始就会结束任何谈话。一旦我们说'AI',就好像2001年初的黑色巨石已经出现了,我们都变成了猿猴尖叫着,摇着我们的拳头。你无法分析'AI'。 v

实际上,我认为可以提出一系列无益的方式来讨论机器学习的当前发展。例如:

数据是新油

谷歌和中国(或Facebook,或亚马逊,或BAT)拥有所有数据

AI将承担所有工作

而且,当然,说AI本身。

或许,更有用的话题可能是: 

自动化

启用技术层

关系数据库。 

为何选择关系数据库?它们是一个新的基础支持层,改变了计算可以做的事情。在关系数据库出现在20世纪70年代后期之前,如果您希望您的数据库向您展示,例如,“购买此产品并居住在这个城市的所有客户”,那通常需要一个自定义工程项目。数据库不是用结构构建的,任何任意交叉引用的查询都是一件容易的,常规的事情。如果你想问一个问题,有人必须建立它。数据库是记录保存系统; 关系数据库将它们转变为商业智能系统。 

这改变了可以用于重要方式的数据库,从而创建了新的用例和新的十亿美元公司。关系数据库给了我们甲骨文,但他们也给了我们SAP,SAP及其同行为我们提供了全球即时供应链 - 他们给了我们Apple和星巴克。到了20世纪90年代,几乎所有的企业软件都是关系型数据库 - PeopleSoft和CRM以及SuccessFactors等几十种都运行在关系型数据库上。没有人看过SuccessFactors或Salesforce,并说“由于Oracle拥有所有数据库,这将永远不会奏效” - 相反,这项技术成为了一切可能的一部分。

因此,今天考虑ML这是一个很好的基础方式 - 这是我们可以用计算机做的一个步骤改变,这将是许多不同公司的许多不同产品的一部分。最终,几乎所有东西都会在内部的任何地方都有ML,没有人会关心。 

两者之间重要的相似之处在于,尽管关系数据库具有规模效应,但别忘了网络是有限的,或者说“赢家通吃”的效应,机器学习也一样。如果 B 公司和 A 公司一样,从同一家供应商购买相同的数据库软件,那么 A 公司使用的数据库并不会因此变得更好。机器学习实际上也是差不多的情况:机器学习都是数据相关的,但是特定应用的需要的数据却是不同的。更多的手写数据会使手写体识别器变得更好,而更多的燃气轮机数据也会使系统更好地预测燃气轮机的故障,但是其中一套数据对另一个系统却毫无帮助。记住,数据是不可替代的。

这就是谈论机器学习时最常见的误解的核心 - 它在某种程度上是单一的,通用的东西,在通往HAL 9000的道路上,而谷歌或微软各自建立*一个* ,或谷歌'拥有所有数据',或者IBM有一个名为'Watson'的实际内容。真的,这一直是看自动化的错误:随着每一波自动化,我们想象我们正在创造拟人化的东西或具有一般智能的东西。在二十世纪二十年代和三十年代,我们想象钢铁工人在工厂里走来走去拿着锤子,在20世纪50年代,我们想象着人形机器人在厨房里走动做家务。我们没有得到机器人仆人 - 我们有洗衣机。

洗衣机机器人,但它们并不“聪明”。他们不知道什么是水或衣服。此外,即使在狭窄的洗涤领域,它们也不是通用的 - 你不能把餐具放在洗衣机里,也不能把衣服放在洗碗机里(或者更确切地说,你可以,但你不会得到你想要的结果) 。它们只是另一种自动化,在概念上与传送带或取放机器没有什么不同。同样,机器学习可以让我们解决的问题,电脑不能有效解决之前,但每个这些问题将需要不同的实现,以及不同的数据,对市场不同的路线,而且往往不同的公司。它们中的每一个都是自动化的一部分。他们每个人都是一台洗衣机。

因此,谈论机器学习的一个挑战是找到一方面对数学的机械解释和另一方面对一般AI的幻想之间的中间立场。机器学习不会创建HAL 9000(至少,现场很少有人认为它会很快就会这样做),但将其称为“仅统计数据”也没有用。回到与关系数据库的相似之处,这可能就像在1980年谈论SQL一样 - 你如何从解释表连接到思考Salesforce.com?这一切都非常好地说“这可以让你问这些新题型”,但它并不总是很明显的是什么的问题。你可以做出令人印象深刻的语音识别和图像识别演示,但同样,普通公司会做些什么呢?正如美国一家大型媒体公司的团队不久前对我说的那样:'好吧,我们知道我们可以使用ML来指导我们的人才采访运动员的十年视频 - 但我们还在寻找什么呢?

那么,对于真正的公司来说,机器学习的洗衣机是什么?我认为有两套工具可供考虑。首先是根据数据类型和问题类型的方式进行思考:  

机器学习可能会为您已经提出的有关已有数据的问题提供更好的结果,只需作为分析或优化技术。例如,我们的投资组合公司Instacart建立了一个系统,通过杂货店优化其个人购物者的路由,提高了50%(这是由三位工程师使用Google的开源工具Keras和Tensorflow构建的)。

通过机器学习,您可以询问已有数据的新问题。例如,进行发现的律师可能会搜索“愤怒”的电子邮件,或“焦虑”或异常的线程或文档集群,以及进行关键字搜索, 

第三,机器学习开辟了新的数据类型进行分析 - 计算机无法真正读取音频,图像或视频,现在越来越多,这将是可能的。 

在这一点上,我发现成像是最令人兴奋的。只要我们有计算机,计算机就可以处理文本和数字,但图像(和视频)大部分是不透明的。现在,他们将能够“看到”他们能够“阅读”的相同意义。这意味着图像传感器(和麦克风)成为一种全新的输入机制 - 而不是一种新的,功能强大且灵活的传感器,它可以生成(可能)机器可读数据流。各种各样的事情将成为今天看起来不像计算机视觉问题的计算机视觉问题。 

这不是关于识别猫图片。我最近遇到了一家为汽车行业供应座椅的公司,该公司已将神经网络放在廉价的DSP芯片上,配备便宜的智能手机图像传感器,以检测织物是否有皱纹(我们应该期待各种类似的用途)机器学习在非常小,便宜的小部件,只做一件事,如这里所述)。将其描述为“人工智能”是没有用的:它是以前无法实现自动化的任务的自动化。一个人不得不看。

这种自动化感是思考机器学习的第二个工具。发现织物是否有皱纹不需要20年的经验 - 它真的只需要哺乳动物的大脑。事实上,我的一位同事建议,机器学习将能够做任何你可以训练狗做的事情,这也是思考AI偏见的有用方法(究竟什么有狗了吗?培训数据中有什么?你确定吗?你怎么问?),但也有限,因为狗确实具有一般的智能和常识,不像我们知道如何构建的任何神经网络。Andrew Ng建议ML能够在不到一秒的时间内做任何你能做的事情。谈论ML确实倾向于寻找隐喻,但我更喜欢这个比喻,它给你无限的实习生,或者,也许是无限的十岁孩子。

五年前,如果你给计算机一堆照片,它除了按尺寸排序外,还做不了多少。一个十岁的孩子可以把它们分成几个男人和一个女人,一个十五岁的孩子变得冷静和不冷静,一个实习生可以说'这个真的很有趣'。今天,凭借ML,计算机将匹配十岁,也许十五岁。它可能永远不会到实习生。但是,如果你有一百万十五岁的孩子来查看你的数据,你会怎么做?您会听到什么电话,您会看到什么图像,以及您会检查哪些文件传输或信用卡付款?

也就是说,机器学习不需要匹配专家或数十年的经验或判断。我们不是自动化专家。相反,我们要求'听取所有电话并找到愤怒的电话'。'阅读所有电子邮件,找到焦虑的电子邮件'。“看看十万张照片,找到那些很酷(或至少很奇怪)的人。” 

从某种意义上说,这就是自动化总是如此; Excel没有给我们人工会计师,Photoshop和Indesign没有给我们人工图形设计师,而且蒸汽机确实没有给我们人造马。(在早期的'AI'浪潮中,国际象棋电脑没有给我们一个脾气暴躁的中年俄罗斯人。)相反,我们大规模地自动化了一项离散任务。 

这个隐喻被打破的地方(正如所有隐喻所做的那样)在某种意义上说,机器学习不仅可以找到我们已经认识到的东西,而且可以找到人类无法识别的东西,或找到模式,推论或这意味着没有十岁(或50岁)的人会认出来。这是最好看的Deepmind的AlphaGo。AlphaGo不会像国际象棋电脑一样下棋 - 通过按顺序分析每一个可能的动作树。更确切地说,它被赋予了规则和董事会,并试图自己制定战略,在人生中可以做很多生活时间来玩自己的游戏。也就是说,这不是一千名实习生,因为一个实习生非常快,你给你的实习生1000万张图像然后他们回来说'这是一件有趣的事情,但是当我看到第三百万张图像时,这种模式真的开始出现'。那么,哪些领域足够窄,我们可以告诉ML系统规则(或给它一个分数),但足够深,看着所有数据,如人类所能做到的,都不会带来新的结果?

我花了很多时间与大公司见面并谈论他们的技术需求,他们通常对机器学习有一些非常明显的低成果。有很多明显的分析和优化问题,以及很多清晰的图像识别问题或音频分析问题。同样,我们谈论自动驾驶汽车和混合现实的唯一原因是因为机器学习(可能)使他们能够实现 - ML为汽车提供了解决他们周围事物以及人类驾驶员可能会做什么的途径,并提供混合现实的方式制定出什么我应该看到,如果我想找虽然一副眼镜是什么都有。但在我们谈到呼叫中心的面料皱纹或情绪分析之后,这些公司往往会坐下来问“好吧,还有什么?” 这会带来什么其他的东西,以及它会发现什么未知的未知数?我们可能需要十到十五年才能开始变得无聊。

你可能感兴趣的:(AI前瞻 | 思考机器学习的方法)