全文共4301字,预计学习时长13分钟
来源:xiaoxue.tuxi
科技的进步往往建筑在不断“试错”的基础之上,而“试错”的过程倾注的不仅是心血、汗水,甚至还包含了生命。
2018年的一个深夜,在亚利桑那州一条荒凉的双车道高速公路上,伊莱恩·赫茨伯格(Elaine Herzberg)发生了意外。她成为首位被无人驾驶汽车撞死的行人。
100多年前一辆汽车价值290到520美元
122年前,一位名为布里奇特·德里斯科尔(Bridget Driscoll)的女性与她有着相似的悲惨命运。1896年,德里斯科尔死于一项更早的实验技术:一辆汽车,当时她正在伦敦街头漫步。
公众喜欢将人工智能视作超人,或者说在某种程度上它们的确是超人般的存在。人工智能可以击败世界围棋游戏中最好的玩家或DOTA 2这款极其复杂的实时策略游戏中99%的玩家。
但这并不是说它们完美无瑕,因为即使是目前世界上最先进的人工智能也会犯严重错误,其中甚至包括大多数人认为很容易就能克服的错误。
当将人工智能从棋盘游戏和电子游戏的狭窄领域中带出来,并投入到现实世界,那么将迎来无数的极端案例和意想不到的情况。这一点在高风险的自动驾驶汽车领域表现得尤为明显,在这个领域,每一次失误都可能意味着生与死的较量。
Lyft无人驾驶汽车部门研发主管吕克•文森特(Luc Vincent)表示,无人驾驶汽车可能出现的问题“几乎数不胜数”。
Lyft公司发现,当无人驾驶汽车被其他司机拦截,刹车时会发出砰的一声。另一家无人驾驶汽车公司Zoox发现,他们的汽车无法识别黄色左手转信号灯,因为大多数转向信号灯为绿色,因此他们不得不请艺术家来画黄色转向灯,然后将其装入模拟软件。不久后,Zoox的汽车在现实世界中能更精确地识别黄色信号灯,但无论怎么努力,总有极端情况出现。
来源:Pexels
根据CNN有关此种“世代型技术挑战”所面临的无止境难题的一篇精彩文章,应用直觉公司总裁卡萨尔·尤尼斯(Qasar Younis)表示,“这种情况有点像“打地鼠”游戏,解决一个问题之后,可能又会出现另外一个。”
著名的机器人专家、麻省理工学院(MIT)名誉教授罗德尼•布鲁克斯(Rodney Brooks)写了一篇精彩的长文,详尽阐述了他认为无人驾驶汽车比几乎所有人想的要遥远得多的原因。文中列举了几十个极端案例:
· 如果无人驾驶汽车行驶在一条被建筑物封锁的单行道上,那么可以违反法律,在该单行道上掉头吗?
· 这种汽车能够处理青少年恶作剧和其大喊大叫的冲突指令吗?
· 这种汽车能理解警察或路边工作人员的手势信号吗?
· 这种汽车能识别有人竖起的虚假或损坏路标吗?
对于当今世界的人工智能而言,所有这些情境都极为困难,因为它们没有较深层次的情境意识或通用抽象推理功能。情境人工智能是人工智能领域研究的前沿,也是其能够从像
DARPA这样未来主义者组织获得资助的原因。
DARPA可解释人工智能架构
人类之所以伟大正是因为擅长从问题中寻找解决方案,并将其应用到从未遇到的全新问题上。我们学习物理、运动和惯性法则,就可以建造从未出现过的火箭,并首次将其发射到月球上。
卷积神经网络(CNN)能够研究火箭样本,但倘若没有现成造火箭的方法,人类也发明不出火箭,就像没有见过鸭子的卷积神经网络对鸭子的存在一无所知。
无人驾驶汽车突破了可能的局限。我们让无人驾驶汽车自信地行驶在纽约狭窄的街道上,这些过于大胆乐观的预测如今正在接受现实的检验,但事实表明,这一检验花费的时间可能要比我们想象的更久。
在某种程度上,我们正在面临着深度学习和强化学习的局限性。NeurIps是人工智能最大的会议之一,在最新的一次大会上,一些业内最有名的泰斗(包括蒙特利尔人工智能研究所Mila主任Yoshua Bengio),就当今世界人工智能的现状提出了发人深思的想法:
Bengio表示,“机器学习的范围有限,它们需要比人类更多的数据来学习一项任务,而且仍会犯愚蠢错误。”
机器人专家罗德尼甚至更进一步地表示,要拥有一辆真正的4级或5级无人驾驶汽车,即不需要轮子且除了恶劣天气外可以在任何情况下驾驶并自行决策的汽车,需要某种接近通用人工智能(AGI)的东西,仅仅将一堆不相连的神经网络缝合,并期望它们神奇地对现实状况有更高形式的理解,这远远不够。
在混乱的现实世界里,路上司机鸣笛、超车、道路坑坑洼洼、交通信号灯损坏或路面标识模糊不清,人工智能技术出现之初我们很有可能做不到让无人驾驶汽车在这样的环境中行驶。现在是否能让无人驾驶汽车与神奇的神经网络协同工作,或者是否需要新的算法,这将由全球顶级研发团队的实验室决定,因为他们会竞相寻找解决方案。
但如果仔细观察,会发现无人驾驶汽车领域甚至展现出一个更为基本的问题,这个问题正在摧毁数据科学团队,但现在已能得到解决。
原因之一是87%的数据科学项目从未投入生产。
如今,大多数数据科学团队都不知如何处理模型在现实生活中遇到的多个类似于野兔的极端情况。
从女修道院看左边的图像为一个时速45英里的标志!
能进行自我学习的算法会遇到各种各样的场景,这些场景我们预料不到,除非亲身经历。如果视觉检测系统能达到97%的准确率,但检测的涂鸦覆盖的站牌标志为45英里每小时,那么准确率可能为零,因为有人会因此受伤或死亡。
即便是世界上最准确成功的卷积神经网络也经常在混乱的现实世界中苦苦挣扎,麻省理工学院(MIT)和IBM刚刚发布了ObjectNet数据集,以显示这些算法在面对损坏、部分隐藏、或位于奇怪角度的物品时的执行情况。该数据集花费三年时间才完成,一些最先进的对象检测模型的准确率从ImageNet的97%下降到ObjectNet数据集的50%到55%。
提供图像识别的ObjectNet图像
仅仅测试准确性就结束工作远远不够,准确性分数标志着模型能力的最低限度,这些分数就像简历上为你新工作作担保的两个人,表示你不是没有能力,而是找不到人为你作推荐,仅此而已。
但要让像无人驾驶汽车这样复杂的事物成为现实,需要一种方法来解决快速增长的极端案例——“打地鼠”问题。要做到这一点,需要超越总体精确度,借助极端情况下准确性的自动化测试,传统的软件编程可以做到这一点。
人工智能的发展也面临独特的挑战,但如何在一些最优秀的编程团队里开发软件和数据科学团队如何在当下和未来开发人工智能之间有许多相似之处。(但如何在一些最优秀的编程团队上开发软件,以及数据科学团队如何在现在和将来开发人工智能,这两者之间有很多共同之处。
若要理解其中缘由只需要对编程历史略知一二。
DevOps是一个大问题的解决之道,这个问题一直没有出现,直到应用程序开始变得又大又复杂,以至于旧编程方法无法熟练处理它。早期的计算机应用程序比今天的多面应用程序简单,它们主要是由公司开发团队为有限使用的案例所构建的。有了这些隐藏在公司防火墙背后的应用程序,瀑布模型运行良好。只有几千名用户接触该应用程序,这样就可以将极端情况降到最低。
但互联网改变了一切。由于该程序的用户成千上万,出现了越来越多的漏洞,但只有几千名用户受网络环境的严格管控。这时,开发运营开始起作用,使互联网大规模应用成为可能。
来源:Pexels
人工智能的出现让人类在未知领域的突破硕果累累。
修补漏洞的关键是单元测试。
将每一次极端案例视为需要自动进行单元测试的漏洞。
Agile和 DevOps风格编程的兴起让我们学会,当复杂软件在广泛分布的编程团队中经历无数变化时,如何将测试自动化。软件团队经常发现,一个已经解决的网络漏洞在一百次修改后再次出现,这是因为程序员检入的是依赖于破损库的代码,或是因为程序员复制粘贴了旧代码,却没有意识到旧代码有缺陷。人工智能团队需要开发自己的自动极端案例处理器,以处理诈骗检测系统,该系统在每次有人去法国旅行或在阿尔伯克基使用自动取款机时就会出现错误反馈。
当对算法参数进行调整或对新数据进行再编辑,而它突然开始出错时,人工智能团队将不得不构建特殊测试,以确保那些“漏洞”不会再次突然出现。无人驾驶汽车团队可能会创建擅长应对拦截这些汽车愤怒的人类司机的卷积神经网络,但如果贴有贴纸的路牌又突然消失不见,那也无关紧要。
为构建更好的单元测试,工程团队需要掌握MLOps,并学会构建运行良好的MLOps管道,以便快速发现和消除新的漏洞。
在笔者与Red HatOpenShift Commons团队的交流中,笔者谈到如何为人工智能团队(笔者现称其为人工智能红队)构建质量保证。这是一个由反应敏捷的编码人员、工程师和数据科学家组成的团队,为人工智能异常寻找短期分类解决方案和长期解决方案。该团队非常精锐,很像白帽黑客小队,工作职责是侵入网络,让网络比黑帽更安全。
人工智能红队的工作就是墨菲定律的答案。该团队擅长破解人工智能并对其进行重新修复,也负责发掘未知领域,并在这些未知伤到人或触及伤害底线之前发现并解决。
在不远的未来,我们将需要数以百万的红色团队在世界各地建立ObjectNets,并分享真正的开源精神,创造出能够安全在单行道上行驶或扛得住雨雪道路的无人驾驶汽车。
可以把这视为人工智能的凤凰计划。
如果不了解这本书,那就找个时间读读吧。
这是一本关于软件和业务转换的很棒的读物。任何能将软件开发和业务流程变成在现实世界中广为人知的充满趣味性和娱乐性的交通工具角色,都不失为一本绝佳的读物。这本书有助于普及DevOps软件开发模型,但更重要的是,它向我们展示了该如何用不同的思考方式来看待组织的每个层面,进而解决以前的问题。
在人工智能时代,必须再次转换理解和方法。
当手动编码所有软件,并亲自教授人工智能交通规则时,人工智能带来了前所未有的挑战。如今的软件可以自学交通规则,当需要在红灯处右转,最先进的人工智能团队已经能够做到这一点。
来源:naic.org
当下是人工智能的凤凰计划时刻。
为构建未来,有时需要回顾过去。
推荐阅读专题
留言点赞发个朋友圈
我们一起分享AI学习与发展的干货
编译组:齐鑫濛、廖琴
相关链接:
https://towardsdatascience.com/ais-phoenix-project-moment-b51f581711d8
如转载,请后台留言,遵守转载规范
推荐文章阅读
ACL2018论文集50篇解读
EMNLP2017论文集28篇论文解读
2018年AI三大顶会中国学术成果全链接
ACL2017论文集:34篇解读干货全在这里
10篇AAAI2017经典论文回顾
长按识别二维码可添加关注
读芯君爱你