点击左上方蓝字关注我们
01
领先神经网络,超越人类:朱松纯团队提出首个基于符号推理的几何数学题求解器
实现高级别的数学逻辑推理能力一直是通用人工智能追求的目标之一。近日,UCLA 联合浙江大学和中山大学的研究者提出了首个基于符号推理的几何数学题求解器 Inter-GPS。Inter-GPS 将几何题的图片和文字解析为统一的形式语言,运用相关的几何定理,逐步进行符号推理直至预测出最终的答案。Inter-GPS 实现了 57.5% 的准确率,远超神经网络方法的 33.0% 的准确率。
几十年来,如何让人工智能算法具备复杂的数学推理能力,像人类一样求解各种数学题,一直是科学家们追求的目标。其中,求解几何数学题就是一项非常具有挑战的任务。求解几何题,算法需要理解题目的文字和图形信息,识别丰富的几何元素和关系,运用相关的几何定理,完成一系列的数值计算,直至求解出最终的问题答案。
一道典型的几何数学题。
心理学家和教育家的研究表明,求解几何问题需要符号抽象和逻辑推理的高级思维能力。人类在求解几何题的时候,会抽象出题目的结构化语义,从而完成后续的逻辑推理。形式语言是由基于一套符合特定规则的语句组成,通常用于语言学和数学领域。研究团队认为将几何题目输入解析为形式语言的描述是非常重要的。
来自 UCLA、浙江大学和中山大学等机构的联合研究团队提出了一种基于形式语言和符号推理的、具有很强可解释性的几何解题方法:Inter-GPS。
论文链接:https://arxiv.org/pdf/2105.04165.pdf
代码链接:https://github.com/lupantech/InterGPS
项目主页:https://lupantech.github.io/inter-gps
信息来源:机器之心
02
最快圈速,算法控制无人机首次战胜专家级驾驶员,登上Science Robotics
苏黎世大学研究人员开发了一种新算法,让自主飞行的四旋翼飞行器计算出充分考虑无人机局限性的时间最优轨迹,并首次在无人机竞赛中胜过两名人类驾驶员。
对于工业用途的无人机来说,由于电池续航有限,它们必须在尽可能短的时间内完成任务,比如在灾难现场寻找幸存者、检查建筑物、运送货物。在此类任务中,无人机必须通过一系列航点(如窗户、房间或特定位置)进行检查,在每个路段采用最佳轨迹和正确的加速或减速。顶尖的人类无人机驾驶员在这一方面有着丰富的经验,并在以往的无人机竞赛中表现均优于自主飞行系统。
来自苏黎世大学 (UZH) 的研究团队创建了一种算法,以找到最快的轨迹来引导四旋翼飞行器(带有四个螺旋桨的无人机)通过路线上的各个航点。这项研究近日发表在《Science Robotics》。
论文链接:http://rpg.ifi.uzh.ch/docs/ScienceRobotics21_Foehn.pdf
「我们的无人机在实验赛道上超越了两名专家级人类驾驶员的最快圈速,」Davide Scaramuzza 说道,他是 UZH 机器人与感知小组和 NCCR Robotics 救援机器人挑战赛的负责人,也是这个挑战赛项目资助了这项研究。
信息来源:机器之心
03
“2021智能经济高峰论坛”举行 百度智能云四大升级 加速产业智能化
7月29日,“2021智能经济高峰论坛”在北京举行。会议聚焦产业智能化的战略、实践与发展前景。百度智能云宣布战略升级,发布“云智一体”架构2.0、云智新产品和重要升级。来自制造、能源、金融、城市等领域的实践者,分享了在产业转型升级中的宝贵经验与丰硕成果。下午,“智能产业”、“智能技术”、“智慧城市”、“智能生态与服务”四场“云智峰会”专题论坛同期举行,产业智能化迎来新浪潮。
人民日报社副总编辑赵嘉鸣,中国国际经济交流中心副理事长王一鸣,科学技术部副秘书长贺德方,工业和信息化部信息技术发展司司长谢少锋,中国信息通信研究院院长余晓晖,贵州省政协副主席、贵阳市市长、贵安新区管委会主任陈晏,济南市副市长孙斌,丽江市委常委、常务副市长木崇根,中国远洋海运集团有限公司董事、总经理、党组副书记付刚峰,中国交通建设集团有限公司党委常委、副总经理孙子宇,中国电力建设集团有限公司党委常委、副总经理刘源,百度创始人、董事长兼 CEO 李彦宏,百度 CTO 王海峰及各界嘉宾400多人出席上午的“智能经济高峰论坛”。
李彦宏在致辞中表示,在未来十年,人工智能领域将有八项关键技术,会实现从量变到质变,从而深刻地改变我们的社会,分别是自动驾驶、数字城市运营、机器翻译、生物计算、深度学习框架、知识管理、AI 芯片和个人智能助手。这八项技术是 AI 时代决胜未来的关键,要提前布局,并长期、持续地投入。
▲ 百度创始人、董事长兼 CEO 李彦宏:
智能经济时代:八项关键技术将决胜未来
王海峰结合百度的实践,分享了助力智能经济发展的体会。他表示,我们正处在科技创新和产业发展最好的时代。随着新一代信息技术的发展,以及数据的爆发式增长,产业开始应用智能技术,从海量数据中发现规律、提炼知识,促进产出增加和效率提升,实现企业生产经营的智能化,再到整个产业的智能化。百度“云智一体”支撑数字化转型和智能化升级,加速产业智能化。
▲ 百度 CTO 王海峰:云智一体,加速产业智能化
在“智能经济高峰论坛”上,百度智能云宣布了战略、架构、产品、生态四个方面的全面升级。
信息来源:百度AI
04
CV十年发展之观察:1.5万篇论文透视「业界」与「学界」,到底谁更胜一筹?
为了调查计算机视觉领域业界赞助的研究所占的比例,以及它们对该领域产生的影响,加拿大约克大学的一位博士生分析了 2010 至 2019 十年间 Top-5 计算机视觉会议上发表的近 15000 篇论文,展示了业界研究的变化趋势以及这些研究对社区的影响。
在很多领域,由业界赞助的科学研究与学界研究通常共存并相互影响,从研究方式上看,二者存在着显著差异。企业开展的研究往往受到与自身业务需求和特定产品功能相一致的短期目标驱动,而非纯粹的学术探究。此外,工作流程也不相同:比如在机器学习研究中,学界研究者旨在开发新模型或改进现有模型以建立新的 SOTA,业界研究者正好相反,他们有着固定的性能需求,想要的只是能够满足自己并且方便扩展的特定模型或方法。
由于研究目标不同,一些业界人士承认,下一个伟大的 idea 更有可能出自学界。不过也要承认,业界具有较学界多得多的可用资源和数据。
近日,加拿大约克大学的博士生 Iuliia Kotseruba 对 2010 至 2019 年计算机视觉在业界和学界的进展进行了详尽的调研。这十年来,该领域的研究活动一直在增长。计算机视觉研究不断增长很大程度上要归功于深度学习技术的成功,而深度学习技术又得益于巨量可用的计算资源和数据。考虑到计算机视觉应用的巨大价值,很多企业都向该领域的研发工作投资。因此业界赞助的研究者成为计算机视觉社区的重要组成部分,并向该领域主要的学术会议和期刊杂志积极投稿。此外,所有计算机视觉顶会具备了工业博览会的特征,提供了交流和招聘机会。
论文地址:https://arxiv.org/pdf/2107.04902.pdf
尽管业界研究不断增长的现状很难忽视,但由于缺乏相关数据和正式研究,其对计算机视觉研究的影响在很大程度上还是未知的。因此,本文主要有两个目的,一是量化业界赞助的研究在计算机视觉领域的比重,二是探究业界的参与是否对该领域的发展方式具有可度量的影响。
信息来源:机器之心
05
在CUDA的天下,OpenAI开源GPU编程语言Triton,将同时支持N卡和A卡
OpenAI 开源了全新的 GPU 编程语言 Triton,它能成为 CUDA 的替代品吗?
过去十年中,深度神经网络 (DNN) 已成为最重要的机器学习模型之一,创造了从自然语言处理到计算机视觉、计算神经科学等许多领域的 SOTA 实现。DNN 模型的优势来自于它的层次结构,这一特征导致其计算量巨大,但也会产生大量高度并行化的工作,特别适合多核和众核处理器。
深度学习领域的新研究思路往往是结合原生框架 operator 来实现的,这种方法虽然方便,但需要创建或移动许多临时张量,因此可能会造成神经网络的性能损失。编写专门的 GPU 内核或许可以解决这个问题,但 GPU 编程的确是一件相当复杂的事。
DNN 计算潜力与 GPU 编程困难之间的矛盾由来已久。英伟达在 2007 年发布了 CUDA 的初始版本,CUDA 平台是一个软件层,使用者可以直接访问 GPU 的虚拟指令集和并行计算单元,用于执行计算内核。近年来,主流深度学习框架几乎都是基于 CUDA 进行加速,英伟达也一直在完善 CUDA 工具包,但对于一般的开发者来说,CUDA 还是「不那么容易上手」。
今天,OpenAI 正式推出 Triton 1.0,这是一种类 Python 的开源编程语言。即使没有 CUDA 经验的研究人员,也能够高效编写 GPU 代码。例如,它可以用不到 25 行代码写出与 cuBLAS 性能相匹配的 FP16 矩阵乘法内核,后者是许多专业的 GPU 编程者尚且无法做到的。此外,OpenAI 的研究者已经使用 Triton 成功生成了比 PyTorch 同类实现效率高 2 倍的内核。
代码地址:https://github.com/openai/triton
Triton 的最初想法来源于现任 OpenAI 科学家的 Philippe Tillet 2019 年在哈佛大学攻读研究生学位时发表的一篇论文,当时他的导师是 H. T. Kung 和 David Cox。
论文链接:http://www.eecs.harvard.edu/~htk/publication/2019-mapl-tillet-kung-cox.pdf
Tillet 希望解决的问题是打造一种比英伟达的 CUDA 等特定供应商库更好用的库,能够处理神经网络中涉及矩阵的各种操作,具备可移植性,且性能可与 cuDNN 或类似的供应商库相媲美。团队表示:「直接用 CUDA 进行 GPU 编程太难了,比如为 GPU 编写原生内核或函数这件事,会因为 GPU 编程的复杂性而出奇困难。」
Facebook AI 研究中心科学家 Soumith Chintala 也在推特上表达了自己对 Triton 的期待:
新发布的 Triton 可以为一些核心的神经网络任务(例如矩阵乘法)提供显著的易用性优势。「我们的目标是使其成为深度学习 CUDA 的可行替代方案,」Philippe Tillet 作为 Triton 项目负责人如此表示。
信息来源:机器之心
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。飞桨企业版针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。
END