Jarvis:小扎的一小步,人工智能的一大步

想必大家都看过电影《钢铁侠》,小编还是死忠粉呢!电影中除了非常有魅力的小罗伯特.唐尼外,印象最深的就是钢铁侠的人工智能管家Jarvis了。电影里的Jarvis可以帮助钢铁侠处理各种事务,而现实版的Jarvis也许有望实现。小编做梦都想拥有一个这样的人工智能管家,想想都有点小激动呢。哪位大牛开发出了Jarvis,混迹科技圈多年的小编发现原来这位大咖是Facebook创始人小扎。热爱学习的小扎每年都会给自己定一些小目标,比如读书,跑步等。2016年他给自己定下的小目标可不是赚它一个亿,而是借助Facebook工具亲自动手为自己打造一个人工智能系统,事实上小扎也实现了并取名为Jarvis。

Jarvis在技术上的实现

Jarvis:小扎的一小步,人工智能的一大步_第1张图片
图片发自App

这个Jarvis能够做点什么呢?小扎可以在手机和电脑上与之交谈,它可以调控小扎家的灯光,室内温度,家用电器,可以播放音乐,实施安全保护,学习语言知识,甚至可以逗Max(小扎的女儿)玩儿。要实现这些,Jarvis可是使用了好几种人工智能技术,包括自然语言处理,语音识别,面部识别和用Python, PHP and Objective C编写的强化学习。究竟是怎么做到的,下面就随小编来看一看吧!

建立Jarvis的第一步:从家开始。据小扎称,在某些方面,建立Jarvis要比之前预想的简单得多。例如,小扎2016年的另一个目标是跑365英里(一英里约合1609米),反而是这个目标占用了更多时间。不过,一开始小扎以为只是将自家的系统连接起来,实际上更复杂。在小扎建立Jarvis之前,首先,小扎要编写代码来连接这些系统,而这些系统都使用不同的语言和协议。用Crestron系统来连接灯,恒温器和门等,而用Sonos系统来连接Spotify和三星电视等。

自然语言处理

Jarvis:小扎的一小步,人工智能的一大步_第2张图片
图片发自App

据小扎说,最初也是需要写代码。刚开始只能使用短信进行通信,后来添加了语音功能,并将语音转换为文本。一开始很简单。例如,对Jarvis发出指令,我要打开卧室的灯,然后Jarvis会通过搜索关键词如卧室,灯和打开来执行指令。这还不够,Jarvis还需要学习同义词。例如,在小扎家,起居室(family room)和客厅(living room)指的是同一个空间,而Jarvis需要理解新单词和新概念。理解上下文对任何一个人工智能系统来说都很重要。例如,在没有特指一个房间的情况下对Jarvis发出播放音乐的指令,很可能就会在Max要睡觉的时候播放了一首刺耳的音乐,那可就太糟糕了。

对自然语言处理来说,音乐是一个更有趣,更复杂的领域,因为需要处理涉及艺术家,歌曲和专辑的关键词。例如,发出指令如"播放someone like you这首歌(play someone like you),播放类似Adele歌手的歌(play someone like adele)和播放Adele的歌(play some adele),虽然关键词(英文)很相似。通过正反馈系统,人工智能系统可以学习这些差异。上下文越多,人工智能系统对开放式指令就能执行得更好。

视觉和人脸识别

人类大脑工作精力的三分之一都是与视觉有关,因此人工智能系统需要知道在图片和视频上发生了什么。例如,跟踪(Max醒了并在婴儿床里晃动),对象识别(宠物Beast和地毯)和人脸识别(谁在门口)。人脸识别是对象识别里特别难的一部分,因为与分清两个随机对象比较,很多人看起来很相似。例如三明治和房子,人工智能系统很容易分清。Facebook在人脸识别上已经做得非常好了,能快速地识别出照片里哪些是你熟悉的朋友。当有人站在门口,人工智能系统需要识别来决定是否开门。 人工智能系统目前不能从头部的后面识别人,所以需要从多个角度观察来确保我们看到人的脸。鉴于以上情况,小扎安装了多个摄像头并建立了一个简单的服务器来连续观察摄像机。这里有两个步骤:首先,它要进行面部检测来查看是否有人进入视野,其次,如果面部检测通过,还要进行人脸识别来确定是谁。一旦它识别了那个人,它还需要检查那个人是否是你的朋友,一旦确定了就会开门。

Jarvis:小扎的一小步,人工智能的一大步_第3张图片
图片发自App

语音识别

小扎认为借助人工智能系统的短信通信比人们预想的重要得多,而语音通信的作用也不可忽视。语音通信最大的亮点就是快。你都不用拿出手机,打开app然后打字,直接说就搞定了。为了实现语音通信功能,小扎建立了一个Jarvis的应用程序。小扎可以将安装了Jarvis应用程序的手机放在桌子上,它只负责听。也可以在家中放多个安装了Jarvis应用程序的手机以便可以在任何地方和Jarvis对话。

Jarvis:小扎的一小步,人工智能的一大步_第4张图片
图片发自App


万物互联的局限性

在建立Jarvis的过程中,小扎提出了目前人工智能家居系统的局限性和自己的一些设想。局限性主要有两点:一是大多数电器甚至没有连接到互联网;二是没有通用的API和标准使设备“互联互通”。从Messenger和WhatsApp总体上可以看出,与语音通信相比,人们更偏好短信通信,因为全球的短信通信总量比语音通信总量增长得更快。而且,小扎是在电脑上编程的Jarvis。要想随时随地与Jarvis通信,就意味着实现与Jarvis通信的功能就必须通过手机而不是家里放置的电脑。这表明,未来的人工智能产品不仅仅专注于语音,并且还需要私人讯息接口。 启用私人讯息功能后,使用像Messenger这样的平台比从头开始建立新应用程式更好,因此小扎想建立一个Messenger Bot与Jarvis沟通。 Messenger有一个简单的框架用于构建bot,它会自动处理很多事情 - 在iOS和Android上工作,支持文本,图像和音频内容,可靠地提供推送通知,管理不同人的身份和权限等等。

小扎的看法

语音识别系统已经改进,但是还没有哪一个人工智能系统好到可以理解对话。语音识别不仅听你的说话还要预测你接下来会说什么。所以框架化的对话仍然比非框架化的对话更容易理解。

语音识别系统有一个限制,在机器学习系统上更为普遍。而这个限制有趣的是,为解决特定问题,那些系统可以不断优化。例如,理解人与电脑对话和理解人与人对话是不同的。例如,如果你用从Google处采集人与搜索引擎对话的数据来训练一个机器学习系统,那这套系统应用在Facebook上来理解人与人对话的表现就会相对较差,理解人们与真实的人说话。近距离对话来训练Jarvis也不同于在房间的不同位置来训练Amazon Echo。以上情况意味着语音识别系统和机器学习系统比我们想象的要更特定化。小扎表示, 人工智能技术是基础,未来只会越来越好。小扎构建的第一个版本是iOS版的Jarvis应用程序,计划很快构建出Android版本。

人工智能虽然很有前景,但仍要去突破很多技术性的障碍。小扎的Jarvis只是Facebook人工智能项目里的一小步,却是整个人类为实现人工智能的一大步。

你可能感兴趣的:(Jarvis:小扎的一小步,人工智能的一大步)