AI Edge: AI安全,当哲学遇到工程学:为什么计算才是AI的重点;MNIST for Fashion已到货;伸手、触碰2号:来自Google X的新抓握研究;医疗与机器学习交叉点;Microsoft用一个更简单的系统将IBM的语音识别准确率记录打破;终极监视:AI只需要通过你的走路方式就能认出你;综述论文:深度强化学习发生了什么?;有礼貌的机器人;微软拥有专门为AI设计的基于FPGA的Brainwave 芯片;软件霸权万岁?
AI安全,当哲学遇到工程学:
... AI安全是一个尚很模糊但在不断成长的重要领域,实际上在这个领域的人可能都对其所知甚少。目前,圈子内还没有一个满意答案的问题是:为了确保安全,什么才是正确的抽象层?
是通过将一堆哲学和逻辑规则编码到一台机器中,然后再依次提高真实性来实现呢?还是通过训练系统来对人类自己的行为进行模拟,以一种人类喜欢的行为模式进行行动来实现呢?
...由Open Philanthropy的丹尼尔·杜威撰写的文章解答这个问题的一半,这是机器智能研究所(MIRI)在“高可靠性智能系统设计”方面所做的工作,试图解决AI安全所固有的一些棘手问题(例如 - 如何保证一个自我完善的智能系统,不会对什么是良好行为与我们有很大的不同看法?智能系统在介入我们生活时应采用什么样的推理系统?智能系统如何来模拟他人的行为?)
...更多:‘My currentthoughts on MIRI’s ‘highly reliable agent design’ work.
为什么计算才是AI的重点:
... 虽然数据对于AI算法至关重要,但我认为AI开发计算机更具战略性,尤其是对复杂环境的问题进行研究时(如增强强化学习算法或多代理仿真等等)。
... 投资人比尔·乔伊说:“拥有真正真正的超级计算机就像是时间扭曲一样,你可以做一些现在看起来不划算,但在未来看很划算的事情(可能在十年之后)。
...更多 Q&A with Joyabout technology and a (potentially) better battery.。
MNIST for Fashion已到货:
...德国电子商务公司Zalando发布了时尚MNIST的数据集,包含6万种不同类型服装的28X28像素的图像,如裤子或T恤等。 这是一个相当了不起的事 - 每个研究人员都倾向于在测试新的AI分类系统时,先用MNIST测试一下,但由于MINIST只是由不同写法的数字0-9组成,所以它也非常无聊。(而且我们也很容易过拟合)。
... 他们写道:“时尚MNIST旨在作为直接替代原始MNIST的数据集,用于基准机器学习算法。” 我们希望,如果人们要在MNIST上进行测试,那么现在也会在时尚MNIST进行测试(或者更好的是,直接将CIFAR或ImageNet作为新的“测试基准”)。
...更多关于数据集。
...查看基准 benchmarks on thedataset published by Zalando here
伸手、触碰2号:来自Google X的新抓握研究:
...当你拿起你以前从未见过的咖啡杯,你做什么?就个人而言,我会先看着它,然后会根据它的形状还有我之前无数的拿咖啡杯的经验来推断出我大概该怎么拿,然后再把它拿起来。如果我把它捏碎了(我希望我可以),那么我就知道我用的力是错误的,下一次调整之后再尝试。
...现在,Google的研究人员已经尝试通过创建他们所谓的“几何感知”智能系统,来模仿这样的心理过程了。让他们可以教自己的机器人来拾取101个日常物品中的任何一个,成功率在70%到80%(对于完全没见过的物体,大概60%)。
...该系统代表了正在建造的新型架构的特点 - 高度专业化和高度模块化。在这里,智能系统通过大约三到四个不同的相机视图来研究它面前的对象,然后使用这种2D图像的扩展来推断出对象的3D表示。之后将其投影到用于操纵视图和获得潜在抓握方式的OpenGL图层中。通过对这些行为进行大约15万次有效的抓握示范之后,它就能推断出适当的内部抓握表示,然后根据这个调整自己的抓握使其像成功的示范抓握。这个系统成功实现了上述功能,而且展示了比其他系统都要好的性能。然而在它的准确率达到99%+之前,它是不太可能在工业界得到大量运用的。 (但另一方面,深度学习的快速发展,一定程度上也能加速这方面的发展)
...值得注意的是,Google只需要大约1500个人类演示(通过HTC Vive在Google的开源PyBullet 3D虚拟现实虚拟现实)中创建了15万个不同的抓握预测数据集。它能够通过一系列定向随机化系统来增强人类的演示,以帮助它产生其他合成的,成功的抓握示范。
...阅读更多: Learning GraspingInteraction with Geometry-Aware 3D Representations.
医疗与机器学习交叉点:
...基于深度学习的姿态评估技术,可以用于更好地发现和诊断像帕金森氏症一样的病痛;来自社交媒体的嵌入时间轴可以帮助提供关于心理健康方面的持续诊断;美国食品及药物管理局(FDA)需要批准一个新的深度学习系统,其将在不需要人们填写大量的表单情况下,对现有系统进行调整。
... 在这篇文章中阅读更多内容:read about thesepoints and more in this post: 30 Things I Learned at MLHC 2017.
Microsoft用一个更简单的系统将IBM的语音识别准确率记录打破:
...微软研究团队的一个团队透露了他们最新的语音识别系统,其中错误率约为5.1%。
阅读更多关于这个系统(PDF)。
...现在,语音识别的进展飞速,IBM和微软进行激烈竞争,来各自制定新的标准,大概是因为他们都想向大客户卖语音识别系统吧。而(只是纯粹的假设)亚马逊和Google只想通过API销售他们的系统,而不太关心公关宣传方面。也就是闷声发大财。
...快速刷新的错误率。
... 2017年8月:微软:5.1%*
... 2017年3月:IBM:5.5%
... 2016年10月:微软:5.9%**
... 2016年9月:微软:6.3%
... 2016年4月:IBM:6.9%。
... *微软声称该系统堪比人类誊写员,尽管需要外部验证。
... **微软声称该系统堪比人类誊写员,原来只是不正确的评估。
终极监视:AI只需要通过你的走路方式就能认出你:
...我们正在慢慢地适应各国政府,在其社会中广泛使用面部识别技术 - 近年来,技术使用从警察和监视系统慢慢扩展到边境管制检查站,现在中国有些地方,就连十字路口都有一些系统监控人们横穿马路这样的小违规
...有些抗议者已通过戴口罩或在脸上绑绷带来试图阻止这个过程。一些艺术家甚至提出用某种特别化妆技术来欺骗识别系统(一个有趣的现实世界般的对抗样本)。
...现在,捷克共和国马萨里克大学的研究人员建议使用视频监控系统来识别一个人,推断他的步态,然后在其他摄像机上搜索这一步态。
... “你的身份识别就是你的走路模式。比起将行人分类为难以获得的名称或数字,侦查员是直接要求有关监视系统捕获的外观信息 - 以及相应的时间戳和地理位置。在展示的应用程序中,给行人进行聚类而不是分类。鉴定是以查询为例进行的,“研究人员写道。
...如何工作:该系统从标准RGB-D摄像机(与Kinect中广泛应用的摄像机相同)获得输入,然后使用运动捕捉技术来导出人运动的基本结构。通过Fisher’s Linear Discriminant Analysis 和Maximum Margin Critereon(MMC)的组合来学习不同人的步态的个人模型。
...工作效果如何:不是很好,所以先不用紧张。但随着许多研究小组正在开展步态分析和识别的工作,作为大型视频理解项目的一部分,我预测这种项目的这样的基本组件会随着时间推移而得到改善。
...阅读更多: You Are How YouWalk: Uncooperative MoCap Gait Identification for Video Surveillance withIncomplete and Noisy Data.
综述论文:深度强化学习发生了什么?
...几位研究人员写了一篇综述文章,分析了深度强化学习的进展。深度强化学习是一系列的技术基础,从使AI系统能够只从像素输入,就能学会控制和掌握电脑游戏;到使得机器人学习有用的动作,以及一些其他应用程序。
...如果刚才写的这些让你有些不明白的话,那么可以试着读读这篇论文:A Brief Survey ofDeep Reinforcement Learning
... 每个人都应该读读这篇文章的结论:“虽然在寻求理解复杂和不断变化的世界方面有许多挑战,但是强化学习允许我们选择如何去探索它们。实际上,强化学习使智能系统有能力进行实验,以更好地了解其周围环境,使其能够学习更高级的因果关系。现在,高质量的视觉渲染器和物理引擎的可用性使我们能够在这个方向上进行很多探索,如尝试在视觉环境中学习直观的物理模型。虽然在现实世界中仍存在有挑战,但是通过观察和行动来学习世界基本原则的智能系统正在取得稳步进展。“
有礼貌的机器人:
...在英格兰北部的一些地方,很高兴地向某人打招呼时,即使是一个陌生人,只要走上前,拍拍肩,说道“way-eye”就行了。而在伦敦,如果你这样做,人们往往会以一种英式惊恐表情看着你,或直接打电话报警了。
...我们如何确保我们的机器人不会产生这样的社交误解呢?一个名为CARESSES的EU-JAPAN项目正在努力解决这个问题,通过建立一个能注意所在地区的文化规范的机器人。
...迄今为止,该项目包括一些发现,如考虑到文化转变情况下,机器人如何整合它的行为。还有包括通过咨询跨文化护士而创建的三套不同的激励方案,其中包括使机器人在与来自日本的某人谈话时减少不确定性,或与希族塞人交谈时应该表示恭敬。
...使用的组件:系统运行在universeAAL平台上,一个欧盟AI框架项目,并与日本的家庭自动化标准“ECHONET”集成。
...(在这个阶段)主要是列举出可能的方法。几年来,目前的深度强化学习的各种研究方法很可能被集成到如下所述的机器人系统中:
... The CARESSESEU-Japan project: making assistive robots culturally competent.
微软拥有专门为AI设计的基于FPGA的Brainwave 芯片:
...摩尔定律是一个过于夸张的结论,现在像Amdahl的晶体管缩放定律,或是硅的材料科学性质,都正在制约传统芯片架构的发展。那么一个期望主宰AI领域的公司会怎么做呢?如果您是谷歌,答案是试图创建具有特定功能的专用集成电路(ASIC),直接将AI功能放入芯片的逻辑电路中 - 这就是谷歌的张量处理单元(TPU)。
...而微软正在用Project Brainwave进行不同的探索,该计划是使用现场可编程门阵列(FPGA)进行AI处理,每个FPGA上都有一个小的ASIC类型组件。这里的赌注是,虽然FPGA的效率低于ASIC,但其先天的灵活性(现场可编程,可以在将芯片制作并部署在数据中心之后修改芯片的逻辑电路)意味着微软能够随着新的AI组件发明,快速适应新的工作。
..赌注:谷歌公司认为应该值得为了当前的AI运算专门设计芯片,但这样会牺牲灵活性,而微软则将赌注押在了灵活性上。人工智能研究的发展及其相对的发生率将使其中一个战略成功,另一个是陷入困境。
...更多 about the chipshere, and check out the technical slide presentation.
软件霸权万岁?:
... Saku P,一个具有独特观点的VR程序员,他说几乎所有的一切 - 有一个理论,说亚马逊代表大多数未来公司的形态 - 大型软件实体,会通过雇用承包商来处理其边缘业务(即,用真人来快递),同时利用其核心业务构建基础设施,实现二、三级业务。
... 按这样把时间向前推,你所得到的是一个由几家巨大科技公司所主导的经济体,可能花费大量的资金来构建技术虚荣项目,这些项目的投资额是战略性商业投资的两倍多(比如:Facebook的各种无人机计划,Google的“ 杰夫·贝佐斯将他的亚马逊获得的财富投入太空公司Blue Origin,等等。)
...阅读更多:How big willcompanies be in the 21st Century?