发展通用智能,需要无监督学习

https://mp.weixin.qq.com/s?__biz=MjM5NTg0NDE1Mw==&mid=2652601098&idx=3&sn=0dedb8212884d4114bbced061606f094&chksm=bd1d825c8a6a0b4ac063d1f158e58d284a027f7ac4b5b56b356017c5c0685a4153364714034b&scene=27#wechat_redirect

 

在过去十年中,机器学习在图像识别、自动驾驶汽车和围棋等领域取得了前所未有的进步。这些成功在很大程度上是靠监督学习和强化学习来实现的,这两种方法都要求由人设计训练信号并传递给计算机。

 

在监督学习的情况下,这些是“目标”(例如图像的正确标签);在强化学习的情况下,它们是成功行为的“奖励”(例如在Atari游戏中获得高分)。因此,强化学习也可以被认为是一种监督学习,这两者构成了当前机器学习的主要学习方式,也为机器学习构建了一个极限:人类训练师和数据量决定了机器学习深度和精度。

 

很显然,机器学习如今遇到了瓶颈,无论是人类训练师还是数据量,都难以支撑机器学习更进一步的发展出高水平的人工智能,更不用提通用智能,人类和数据成为了通用智能发展的阻碍,无监督学习则是这一难题当前唯一的答案。

 

什么是无监督学习?在知乎上有人答到:是否有监督就看输入数据是否有标签,输入数据有标签,则为有监督学习;输入数据没标签,则为无监督学习。

 

换句话说,就像是幼儿学习,不仅有指导(监督学习)和鼓励(强化学习),还应该有自由探索世界的能力,不需要人为的干预,这就是无监督学习。这就是为什么,如果要让AI脱离人类发展成出通用智能,必须要让它掌握无监督学习的技能。

 

无监督学习的收益是巨大的,加州大学伯克利分校(UC Berkeley)人工智能研究院(BAIR)最新公布一项研究成果显示,通过让机器人在无监督学习的情况下与环境交互,进而建立一个可预测因果关系的视觉模型,无监督学习可以让机器人具备一种“通过模仿及互动模式来学会如何使用工具”的能力,在训练之后,机器人尽管遇到先前从没见过的工具,一样会知道如何使用。

 

这意味着未来机器人能够使用多个物体来完成复杂的多对象任务,甚至可以在新场景下使用即兴工具,从而构建起真正具有通用智能的机器人。

 

作者:崔昊(阿里云研究中心专家) 

责编:张晶晶

你可能感兴趣的:(人工智能)