在课程开始,雷鸣老师先概述了对产业有较大影响的技术,以及未来将发生的演变。
从技术角度看,未来对产业产生比较大影响的技术有:
基于视频的信息理解和处理技术 。现在,基于静态的图片的处理技术,比如人脸识别、物体识别等,已经达到了可用的水平。但是,在视频分析和处理方面的研究才刚刚开始,还没有非常有效、成熟的技术。产业在未来可能发生的一些演变:
首先是 自动驾驶 。以前我们还会讨论自动驾驶是不是有落地的可能,是不是太危险、太科幻了。但现在来看,我们认为自动驾驶的落地只是时间的问题。今年很快,百度的小批量量产自动驾驶汽车就会投入使用,真正实现商业化。整体来看,AI在各个行业都有很多落地的场景,未来AI自身的发展结合落地的场景,应该会产生很多创新。
杨强:一个AI,两种模式
杨强:今天的题目很应景,叫 “落地的人工智能”。这个题目是拿来跟大家探讨的,因为这是一个大题目。人工智能到现在已经 60 多年,几起几落,它的兴衰也是围绕着 “AI是不是可以落地” 进行的。
今天的讲座,第一部分是人工智能概述。
人工智能分为四个发展阶段。初级阶段是感知环境(Perception),我们知道单层的神经网络也叫 perceptron(感知器),是 60 年代就出现的可以简单学习的神经网络。这是 AI 必要的一步,因为要有感知智能,才能收集大量数据,这一阶段需要传感器、互联网、物联网等技术。
第二个阶段是机器学习(machine learning)阶段。能从数据里面学习。第三个阶段是自动推理(reasoning),需要搜索、逻辑、博弈论等技术。最后也是最高阶段是抽象迁移(abstraction),需要有新的理论和系统。
一个AI,两种模式
通用 vs 特殊:有很多人试图解决通用 AI,但现在绝大部分工作还是在特殊的、任务驱动的人工智能。
辅助 vs 自动:比如计算机视觉是辅助型的,相当于给机器戴上了眼镜。无人车是自动型的,因为它的整个运作是自动的,也有自动的学习能力,人类只是为它提供一些必要的资源。
交互 vs 核心:交互型的 AI 是为了跟人沟通,是闭环的。还有一种做法是把 AI 作为一个核心的系统,它的副产品是对人有用,但它可以完全按照自己的方式发展。AlphaGo 就是一个例子。
说到人工智能落地,第一个问题就是什么叫“落地”,谁来规范什么时候AI可以算作“落地了”? 这个标准是首先要建立的。在任何科学与工程领域,都要首先建立测试“成功”的准则,否则就会事倍功半。要知道,智能的测试是非常难以做到公正的,也经历了很多的考验,比如著名的“聪明的汉斯”,是对一匹叫做“汉斯”的马的智能测试,因为一开始没有注意到高维的特征空间,而得到了错误的结论。图灵测试是一种更合理的测试,但也不是唯一的测试。
我认为深度学习的成功主要来自两个方面:第一,层次之间的演化是一种非线性的转化,这种转化如果进行多次,就有可能产生高维空间的 pattern。第二,所有这些加起来,这个网络本身成为一个特征产生器,产生一个高维的空间,在这个空间里,世界上的任何东西(图像、语音等)都会有统一的表达,并且你可以计算它们的距离。
高维度的、统一的特征表达,这就是人工智能想达到的目标。所有的推理、类比、抽象等,都可以在这个空间里得到。但这个空间是通过在数据中学习获得的,这个手段在现阶段是通过大数据,但大数据不是唯一的手段。
AI为什么要有不断创新的能力?
AI 领域每年有上千甚至上万的 paper,是不是说我们就可以躺在 open source 上面,不用创新了?不是的,我们很有必要不断地创新。
一个例子是 GAN,它的一个作用是可以 “鱼目混珠”,生成器可以创造出一些虚假的图片。在金融界就发现有这样的人,他们对深度学习了如指掌,并且可以用AI深度学习的这些手段去欺诈金融的安全系统,因此我们必须要有不断提高的反击的能力。
第二,有些新的学科,比如迁移学习,非常依赖对数据的模拟。GAN 在这个方向是非常有用的工具。
创新的能力也可以体现在跨界的AI应用上。一个例子是斯坦福大学的一个工作,他们的任务是帮助联合国通过卫星图像,让机器自动地给非洲大陆打标签,这些标签指代地区的“贫困程度。” 但是我们看到一个卫星图像,由于标签的缺乏,我们对图像上对应的贫困程度是一无所知的。传统的做法是派人到本地做经济调查,然后把数据收集起来。这样的做法既危险,又耗时,不准确,数据也非常少。
有没有办法自动地做这件事呢?他们想到了迁移学习,而且是多步的迁移学习。第一步是拿 ImageNet 这种图像来学一个切割模型,第二步是比对白天和晚上的卫星图像,以此获得一个初步的经济模型。因为一般认为晚上比较亮的地方是经济发展比较好的区域。由此得出一些 feature 对应经济发达或不发达的地区。最后的结果,用 survey 的方法的准确率是 75%,用迁移学习的方法准确率是 71%。虽然没有人工的那么好,但是非常省力。
我们现在已经有了不少“迁移学习”在产业应用中的实例。如果已经有了大数据产生的模型,那么在一个新的领域,可以用小数据把大模型迁移过来找到这个领域的要点就是找出两个领域的不变量。我们假设一个领域可以用上亿维的特征来描述,那么我们要找两个领域的特征空间共有的部分来做迁移。
AI落地
网约车识别
这里的一个例子是上海汽车的网约车识别
这个问题是:给定车辆的行驶轨迹,如何判断车辆是否网约车?
我们的策略是引入外部数据来进行迁移学习。外部数据有出租车、公交车的行车轨迹。分两步:首先我们有两个空间,左边是出租车的空间,右边是网约车的空间,我们的目的是把知识从左边搬到右边。但是很明显两边的知识是有差异的,要把这些差异剔除,我们用了半监督学习 + 迁移学习。
这个例子告诉我们,AI 的落地首先要目标清晰,清晰到可以把优化函数用数学公式写下来。
第二,需要去找到合适的数据。
第三,人才需要领域知识,同时也需要 AI 知识,这种跨界的人才才是 AI 真正需要的人才,否则谈不上落地。
然后,我们也来举一个反例。我们都知道,AI的头几个里程碑都是IBM创造的。但是在AI落地的过程中,IBM也遇到了难题。一个例子就是IBM WATSON在医疗领域的落地。
我们先来看一下IBM WATSON的流程。 首先,当一个问题到来的时候,系统把输入的问题和知识库里的问题加以对比,再按照匹配的概率排序。 如果有匹配度高的问题,那就可以把对应的答案作为输出。 在这个流程中,需要知识库的建立,和问题集的收集。当然,这个流程中又很多依靠机器学习的阶段,比如问题的特征抽取,特征空间的建立,匹配的相似度学习,等。但整个流程的建立还是要依靠专家来进行的。比如,知识库的建立,知识的扩展,以及问答系统在整个医疗系统中的定位等。恰恰因为这些需要人工的地方成为瓶颈,以至于最终用户的定位错误,导致系统并没有完成既定的任务。最后,IBM只能从美国一个很大的医疗机构撤离,也导致了媒体大量的负面报道。
总结起来,这个例子说明,仅仅在一个游戏领域成功(问答的电视大赛),并不表示在开放的实际场景(医疗)就可以取得成功。 首先,IBM Watson的目标客户群是医生,还是病人? 系统的角色是助手还是替代? 有没有既懂医疗又懂AI的专家在团队中? 系统有没有做到前端和知识库的维护的闭环?这些有关落地的问题,都有待回答。
总结:
第一,人工智能是走了很长的路,但是除了深度学习以外,还有很多的领域有待发掘。所以千万不要以为深度学习就是人工智能。
第二,人工智能在企业的落地是一门大学问,而且是一门艺术性的学问,因为还没有到科学的程度。所以一个问题是,AI 是产品,还是技术,还是解决方案?第二个问题是,AI 如果在一个领域落地成功,需要哪些基本条件?
最后,我觉得非常有趣的一个点,是 AI 出现了以后、会出现一个新的、以机器智能为主体的产业和社会。那么这个新的商业社会也可能会部分地颠覆我们已有的商学院的知识。现有的商学院的知识主要是针对人的管理和人的决策。那么 AI 对应的是机器的管理和机器的决策,这个学问现在还是空白。
原文发布时间为:2018-06-5
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。
原文链接:【清华 AI 公开课】IJCAI理事长杨强:人工智能在企业的落地是一门大学问