短短4.166天,扎克伯格将<钢铁侠>贾维斯变成现实,并分享开发日志


Facebook马克·扎克伯格智能家居Jarvis宣传片【中文字幕】

日前,Facebook CEO 马克·扎克伯格(Mark Zuckerberg)完成了2016年给自己制定的一大挑战——开发一款钢铁侠电影中Jarvis(贾维斯)一样的家庭人工智能助手。并在其脸书账号更新这段时间的开发心得。

短短4.166天,扎克伯格将<钢铁侠>贾维斯变成现实,并分享开发日志_第1张图片

网址:https://www.facebook.com/notes/mark-zuckerberg/building-jarvis/10103347273888091/?pnref=story

他也提到,初期的目的,更多的是希望借此了解人工智能现阶段发展程度以及这条路还有多长的距离要走。然而,这段时间的挑战令我得到了比我预期更多的收获,同时让我对Facebook内部工程师技术及对智能家居有更为全面的了解。

今年我已经完成了一个简单的人工智能,我能够在手机和电脑上和它交流,甚至它能控制我家的大部分,包括灯光、温度、电器、音乐和安全,让它摸索出我的偏好和行为模式,学习新的词汇和观念,甚至能逗我的女儿Max开心并和她玩耍。(备注:翻译来自全球智能制造体验馆)它的核心主要由自然语言处理、语音识别、人脸识别、强化学习。主要由Python、PHP和Objective C三种语言编写,接下来将详细说明Jarvis开发核心。

短短4.166天,扎克伯格将<钢铁侠>贾维斯变成现实,并分享开发日志_第2张图片

Jarvis的连接系统图

起步:互联互通

某些方面而言,这个挑战比我初期设想反而更加容易。事实上,我今年365英里的跑步计划反而花了更多的时间。最难的一环,应该是让我家不同的系统进行互联互通。

我在搭建人工智慧之前,会编写语言实现这些系统能够连接在一起,它们的系统和协议都不尽相同。我们的灯、恒温控制器和门采用了Crestron系统,Spotify的Sonos掌管音乐系统,三星电视,还给我女儿Max安装了Nest摄像机,当然把我的工作连接到Facebook系统也是必须的。为了实现这些,我不得不把工程师API修改到一个程度,才实现用电脑发号施令,开启灯或播放一首歌曲。

此外,绝大多数的电器没能连接上网。我可以用网络连接开关来控制其中一些电器,但这远远不够。比如很难找到一个不用开电源就把面包向下推的烤面包片机,如果可以这样的话,我便可以在电源开启时自动烤面包了。结果,我找到了一台1950年的老机器,给他安装了开关。同样,我发现连接我家狗Beast喂食机或T恤发射大炮,都要进行一定程度的硬件改装才能实现。

对于像Jarvis这样的助手帮家里控制更多的东西,我们就需要更多的连接设备,业界要开发通用的API标准,才能另设备间互联互通。

短短4.166天,扎克伯格将<钢铁侠>贾维斯变成现实,并分享开发日志_第3张图片

来自指令发出的自然语言请求

自然语言

一旦我编辑好语言代码,下一步就是让它实现在现实控制一切,我能跟我的电脑和家里的一切进行互动和交流,如同我和任何人说话一样。这里有两个步骤,第一步我实现了用信息对其发号施令,后来我添加上说话能力,让它把我的话翻译成文字让它读。

初期它只是找关键字,诸如卧室、灯、打开,来判断我是让它开卧室的灯。它很快就学习了同义词,像是家庭房和客厅的意思其实是同一个地方,这表示我要建立一套方法教会它新词语和新概念。

对于AI而言,融会贯通上下情景尤为的重要。例如,当我告诉它打开“我的办公室”空调,这与我妻子Priscilla和它说同样的话的意思完全不同,这造成了一些问题。或是,当你让它把灯管调暗或播放歌曲,却没有在准确的房间执行,很可能会在Max的房间播放音乐,然而我们却希望孩子能睡个安稳的午觉。

AI系统拥有的情景越多,它就能更好的处理开放性的需求。我几乎只要对Jarvis说“帮我放一些音乐”,它根据我之前听歌的喜好,几乎能播出我喜欢类型的曲目。它要是搞错当时的气氛,我主要告诉它一下就可以。例如,这首歌不够轻快,播些舒缓的歌曲,然后它便可以即刻做出调整。它还能分辨出我是在和它说话,还是我妻子Priscilla在和它说话。总而言之,比起具体的要求,我发现我们更常用开放性的指令,就我所知,目前还没有哪款产品这样做,看起来是个潜力巨大的机会。

短短4.166天,扎克伯格将<钢铁侠>贾维斯变成现实,并分享开发日志_第4张图片

Jarvis面部识别,自动让我朋友进来且让我知道

视觉&脸部识别

人类大脑1/3负责视觉,很多重要的人工智能问题都与理解图像和影片息息相关。这些问题包括追踪(像Max翻来覆去是不是表示她已经醒来了?),目标识别(像房间里的是我家狗Beast还是一块地毯)和脸部识别(像谁在门口?)。

短短4.166天,扎克伯格将<钢铁侠>贾维斯变成现实,并分享开发日志_第5张图片

马克和自己的狗Beast(地毯狗)

为了实现脸部识别,我在家门口安装了几个多角度捕捉画面的摄像机,为了解决人工智能系统目前还无法识别人的头背面。我做了一个简单的服务器,能不断查看摄像头,并让它执行两个步骤。首先通过脸部识别,看看是否有人进入视线范围。之后一旦确定是那个人,便检查一个清单来确定是否是我在等待的人,如果确认了,它就会通知我并让他们进来。

这种视觉人工智能系统能运用在很多地方,包括我女儿Max什么时候醒来,然后开始放音乐或者中文课程,或是处理我们在家里哪个房间,这样就可以在不提供位置的情况下,就能把灯打开。和人工智能大多是情况一样,如果你让它连接其他能力,能实现更广泛的用途。比如知道你的朋友有哪些人,以及朋友到达你家之后如何把门打开等。系统拥有的信息和情景模式越多,它就会越来越聪明。

声音和语音识别

语音识别系统的一个有趣的限制(机器学习系统更是如此),是它比人想的更适合用来解决具体的特定问题。例如,了解人和计算机说话,以及了解人和另一个人说话,这两者之间是有细微差异的。如果你用人们在 Google 搜寻引擎上说的话当做资料来训练一台机器,它的表现相对来说会比学习人们在Facebook和真人说话的逊色。以Jarvis而言,训练一个你会靠近它才说话的人工智能,也和训练一个你会离它一个房间那么远的系统说话(像亚马逊Echo那样)不一样的。这些系统能做的事比它们看起来的更有限,这表示要做出一般化的系统,这个距离其实比我们想的还要远。

Jarvis利用我的iOS APP进行声音和语音识别

语音的部份还有很多可以挖掘。人工智能技术已经可以让这些成为伟大的产品的基础,接下来几年还会变得更好。同时,我觉得在这些类似的产品里,最好的产品可以让你带着走,可以进行私密性沟通。

我们能把代码结构组织的这么好,无论是脸部识别或语音识别Messenger机器人架构(messenger.com/platform)或iOS开发轻易找到你要找的。让开发更简单。我们做了Buck(buckbuild.com)系统,让大型的项目做得更快,这极大地节省了时间。我们的开源资源FastText(github.com/facebookresearch/fastTex)人工智能文字分类工具,也很值得看看。如果你对人工智能AI开发有兴趣,整个Facebook研发(github.com/facebookre

search)也很值得一看。

总结

我曾经预测过在未来的五年到十年间,人工智能会做出比人类各别感官(视觉、听觉、触觉以及语言等)更准确的系统。这些最先进工具的威慑力让人震惊,今年的这项挑战让我对这个预测怀有十足的信心。

同时,我们对于学习的核心了解则相差甚远。我今年做的一切,包括自然语言、脸部识别、语音识别等,都是根据相同的基础模式识别技术而来的不同变体。我们知道要给计算机看很多例子,为了令它就能学会精准辨认,但我们仍然不知道该怎么把某个领域的某个想法用在完全不同领域上。

为了了解这部份,今年我花了100小时智造了Jarvis。如今我有了一个相当不错了解我的系统,它还能做很多事。但即便我再花1000小时,我可能也不能做出一个能完全自己学习新技术的系统,除非我在人工智能技术取得基础性突破性。

通过这段时间,就某个角度而言,人工智能比我想象的近,也离我们很远。人工智能可以做到更多人类先进无法想象的事情,例如无人驾驶、治疗疾病、发现星球、了解媒体等。每一点都能对整个世界造成重大影响,然而我们仍然需要理清头脑,真正的智慧到底是什么。

总之,这真是极富有挑战性的。教会我超出预期的东西。今年我学习了人工智能,还学了家居自动化以及Facebook内部技术。这也是挑战真的很有趣的魅力所在。几周后我将发布我的来年挑战计划~敬请期待!

花边新闻

短短4.166天,扎克伯格将<钢铁侠>贾维斯变成现实,并分享开发日志_第6张图片

Jarvis名字取自美国漫威宇宙《钢铁侠》,Tony Stark的AI管家。而在Mark Zuckerberg家的管家配音是由出演过《为黛茜小姐开车》、《不可饶恕》、《肖申克的救赎》、《七宗罪》、《百万美元宝贝》等经典影片的美国知名老戏骨Morgan Freeman。在其过往塑造的多为犀利,正直、勇敢、坚韧、睿智的荧幕形象,如此看来的确是管家的不二之选。

中关村智能制造创新中心

3000平米场地中发智能制造生态体验馆,用于成果展示,定期挑选近百件产品,炫酷成品展示区、智能硬件解决方案展示区、智能家居展示区、用作主题沙龙等活动的会议区、单独的创客空间特区等,吸引众多创客、极客以及工程师的到来。

短短4.166天,扎克伯格将<钢铁侠>贾维斯变成现实,并分享开发日志_第7张图片

                                                                           全球智能制造生态馆

你可能感兴趣的:(短短4.166天,扎克伯格将<钢铁侠>贾维斯变成现实,并分享开发日志)