AI行业态势感知(第五期)

 

AI行业态势感知(第五期)_第1张图片

 

 

导读

 

为了帮助飞桨同学更好地了解人工智能领域的最新资讯,每周二更新《AI行业态势感知》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况)、数据(数据集),工具(新工具和应用推荐)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。

 

 过去一周(2020/10/19~2020/10/25),值得关注的内容有以下3方面:

 

1.       PyTorch Lightning 1.0版发布。Pytorch Lightning提出了一个原则是硬件和科学代码必须分开。Lightning 可以利用大规模的计算,而不需要向用户显示任何抽象概念。Pytorch Lightning提供了抽象出所有工程细节,从而方便的使用复杂模型进行交互的一种用户体验。例如在笔记本电脑上使用CPU调试 GPU 而不需要更改代码。(详情参见本周报“直接竞品动态”栏目)

 

2.       TTPLA开源输电铁塔和输电线路检测与分割的航拍图像数据集。从航拍图像中准确检测出具有长而细的输电线路和在图像中形状结构多变的输电塔是一项比较大的挑战,为此南加州大学创建了一个新的TT/PL航拍图像数据集(TTPLA)。TTPLA与以往只包含TT(输电塔)的数据集和只包含PL(线缆)的数据集相比,结合了二者中输电塔和输电线的图像,同时将图像中的背景噪声问题进行了优化,变成更加关注输电塔和输电线的图像区域;此外还采用不同相机和焦距在多种环境下拍取24小时的输电塔和输电线图像。(详情参见本周报“数据”栏目)

 

3.     10月22日,由中国科学技术发展战略研究院、科技部新一代人工智能发展研究中心主要编写的《中国新一代人工智能发展报告2020》在2020浦江创新论坛发布。中国科学技术发展战略研究院科技预测与评价研究所研究员李修全进行了报告演讲。他介绍,全球人工智能发展方面表现出了两个特点。第一点是2019年,英国、日本、美国、德国这些国家布局很早的国家根据国际形势、新的发展形势和本国产业社会需求不断地进行人工智能战略和更新。第二点是人工智能对产业变革、社会变革等的巨大潜力得到了更多国家更广泛的共识。(详情参见本周报“行业与政策”栏目)

 

 

直接竞品动态:

 

PyTorch

PyTorch Lightning 1.0版发布,终于可以抛弃Keras

Pytorch Lightning提出了一个原则是硬件和科学代码必须分开。Lightning 可以利用大规模的计算,而不需要向用户显示任何抽象概念。Pytorch Lightning提供了抽象出所有工程细节,从而方便的使用复杂模型进行交互的一种用户体验。例如在笔记本电脑上使用CPU调试 GPU 而不需要更改代码。

可借鉴之处:在2.0发版的时候可以对外做一些高层次的宣传: 飞桨的设计理念以及围绕设计里面做了哪些功能和改进,对外输出设计理念是可以占领舆论制高点的方式之一。

 

 

Mindspore

 

开源界首个小剧场上线!投票来赢喝咖啡+追MindSpore原创剧的机会吧!

 

Mindspore等国内开源框架正在参评2020 年度 OSC 中国开源项目评选,Mindspore在此期间推广了一些活动进行拉票,截止10月27日已获得943票,飞桨为78票。

 

Mindspore对外拉票方式为:用户为投票后可抽奖获得自制小剧与星巴克咖啡券。产品侧看一下是否有必要对此评选做一些刺激用户投票的活动。

 

10.25,MindSpore在1024程序员节、开源黑客松、中国开源年会三大活动同日出击!

 

Mindspore 10月下旬陆续在北京、长沙、澳门举办线下MSG活动。1024期间在长沙依靠电子四院参与中国开源黑客松活动,并举办程序员节分论坛、COSCon'20年会路演,做MindSpore整体框架、自动并行技术、PyNative模式的介绍。

 

 

TensorFlow

Android Studio 4.1发布:支持TensorFlow Lite模型

由于越来越多的Android 开发人员使用机器学习来创造创新和有用的应用。而TensorFlow Lite 是一个用于编写移动机器学习模型的库,Android Studio希望让TensorFlow的模型更容易导入 Android 应用。与视图绑定类似,Android Studio 生成类可以用更少的代码和更好的类型安全性来运行模型。目前TensorFlow的模型绑定当前支持图像分类和风格迁移模型。

可借鉴之处:由于Lite模型与硬件部署结合比较紧密,我们的Lite是否可以和上下游的软件厂商做一些合作。例如像本例子中与IDE厂商结合,将Lite的模型集成到一些上下游软件的原生模块中,或者针对流行的IDE(例如VScode)开源方便开发者使用飞桨的的第三方插件。

 

TensorFlow入门实操课程来了

 

近日,《TensorFlow入门实操课程》在中国大学 MOOC 平台上全新上线。《 TensorFlow 入门实操课程 》是基于 TensorFlow 技术推广工程师Laurence Moroney 制作的新手入门课程内容,由复旦大学,上海师范大学,湖南师范大学等高校老师们以及 Google 认证开发专家ML GDE联合设计制作的中文课程。课程内容共12周,TensorFlow 官方微信号每周二会推送该课程内容。

 

 

对飞桨有竞争压力的项目:

 

 

“DeepFaceLab”项目登顶本周GitHub trending榜

 

DeepFaceLab 是由TensorFlow编写的DeepFake生成程序,该项目创建于2018年,在YouTube上超过95%的DeepFake视频都是由该项目生成的。DeepFakes中文网、YouTube上最流行的换脸教程都是基于该项目:https://www.youtube.com/watch?v=1smpMsfC3ls

项目链接:Github

 

EssayKiller(作文杀手)

 

EssayKiller是基于OCR、NLP领域的最新模型所构建的生成式文本创作AI框架。该项目使用Google Drive将训练好的AI核心功能Language Network写作模块迁移到Colab完成训练。目前第一版finetune模型针对高考作文(主要是议论文),可以有效生成符合人类认知的文章,多数文章经过测试可以达到正常高中生及格作文水平。提供端到端生成,从试卷识别到答题卡输出一条龙服务。点击下方链接查看视频介绍:爆肝100天,我开发了一个会写作文的人工智能【17亿参数、2亿数据、1万行代码】

 

应对措施:联系该作者,通过各种手段吸引他将此项目迁移到AI Studio中

 

项目链接:Github

 

论文推荐

 

 

缩小会话推理与互动推荐之间的差距

Bridging the Gap between Conversational Reasoning and Interactive Recommendation

 

在现有的对话式推荐系统研究中,推荐和对话通常被视为两个单独的模块,信息交换有限,这阻碍了这两个系统的功能:

(1)对话仅包含推荐实体,而没有明确的面向推荐的策略指导;

(2)推荐仅将对话用作互动形式,而没有有效地改进推荐。

为了解决上述问题,作者提出了一种新颖的对话式推荐模型:CR-Walker。为了在一个统一的框架内实现两个独立的系统,作者建立了层次化对话行为和多跳知识图谱推理之间的高级映射。该模型在大型知识图谱上游走,每轮形成一个推理树,然后映射到对话行为以指导回复生成。通过这样的映射机制(在推荐和对话之间建立联系),本文的框架最大程度地提高了两个系统之间的互惠性:对话是对推荐质量和可解释性的增强,推荐是目标也是针对对话语义的丰富。

论文下载 

 

基于解耦多模态对比学习的无监督自然语言推理

Unsupervised Natural Language Inference via Decoupled Multimodal Contrastive Learning

 

虽然最近多模态自监督学习的研究能够对视觉和文本进行联合编码学习,但它们对不同模式的编码是耦合的。因此,当单独编码纯文本时,它们不能包含视觉信息。基于此,文章提出了多模态对齐对比解耦学习(MACD)网络。MACD通过对比学习,强制解耦后的文本编码器来表示视觉信息。因此,即使对于纯文本推理,它也嵌入了视觉知识。

论文下载 

 

基于贝叶斯时空图卷积网络的交通预测

Bayesian Spatio-Temporal Graph Convolutional Network for Traffic Forecasting

 

在交通预测中,将交通流建模为时空图的图卷积网络(GCN)取得了卓越的性能。然而,现有的基于GCN的方法启发式地将图结构定义为路网的物理拓扑而忽略了图结构对交通数据的潜在依赖性,但这些方法所定义的图结构是确定性的,缺乏对不确定性的图结构的研究。基于此,本文提出了一种贝叶斯时空图卷积网络(BSTGCN)方法来进行交通流预测。该网络的图结构是通过对路网和交通数据的物理拓扑结构进行端到端的学习,以更准确地描述对交通流之间的关系。此外,本文还提出了一种参数生成模型来表示图结构以增强GCNs的泛化能力。在两个真实数据集上验证了该方法的有效性,实验结果表明BSTGCN方法与现有方法相比具有更好的性能。

论文下载 

 

数据

 

TTPLA:输电铁塔和输电线路检测与分割的航拍图像数据集

 

从航拍图像中准确检测出具有长而细的输电线路和在图像中形状结构多变的输电塔是一项比较大的挑战,为此,本文创建了一个新的TT/PL航拍图像数据集(TTPLA)。TTPLA与以往只包含TT(输电塔)的数据集和只包含PL(线缆)的数据集相比,结合了二者中输电塔和输电线的图像,同时将图像中的背景噪声问题进行了优化,变成更加关注输电塔和输电线的图像区域;此外还采用不同相机和焦距在多种环境下拍取24小时的输电塔和输电线图像。

南加州大学

 

 

行业与政策

 

科技部:中国新一代人工智能发展报告2020

 

10月22日,由中国科学技术发展战略研究院、科技部新一代人工智能发展研究中心主要编写的《中国新一代人工智能发展报告2020》在2020浦江创新论坛发布。中国科学技术发展战略研究院科技预测与评价研究所研究员李修全进行了报告演讲。他介绍,全球人工智能发展方面表现出了两个特点。第一点是2019年,英国、日本、美国、德国这些国家布局很早的国家根据国际形势、新的发展形势和本国产业社会需求不断地进行人工智能战略和更新。第二点是人工智能对产业变革、社会变革等的巨大潜力得到了更多国家更广泛的共识。2019年葡萄牙、西班牙等16个国家发布了他们的人工智能发展战略,同时至少还有18个国家正在研究和制定国家层面的人工智能战略。

澎湃 

 

安永报告:中国AI普及率领先,企业对未来持谨慎保守态度

 

10月22日,由微软赞助的安永《大中华区人工智能成熟度调研:解码2020,展望数字未来》报告发布。报告指出,中国大陆企业对人工智能的未来发展持有相对谨慎和保守的态度,68%的受访企业预计人工智能将在未来五年内对行业产生较大甚至重大的影响;在政府的政策扶持和产业加快升级的背景下,企业的人工智能成熟度较高,但在网络安全、数据管理、创新管理等方面尚存在不足。

澎湃 

  

新工具

 

Neural Filters:基于Adobe Sensei的机器学习工具包

 

Neural Filters是一款基于Adobe Sensei的机器学习工具包,通过生成原始图像中不存在的上下文像素来调整图像。Sensei利用了Adobe长期积累下来的大量数据和内容,从图片到影像,能够帮助人们解决在媒体素材创意过程中面临的一系列问题,例如如何在互联网上的海量图库里找到想要的图片,让软件明白某张照片、某张照片的一部分、某段视频以及某段文本描述的真实含义,帮助人们把一些固定、重复性的操作变得自动化和简单化。

机器之心 

 

Aim:记录、搜索和比较AI实验的利器

 

这个开源项目自称能够在几分钟内记录、搜索和比较100多个AI实验,而在TensorBoard/MLFlow上要几小时。

Github

 

ivadomed:医学影像深度学习工具箱

 

ivadomed可以被用于基于医学影像数据设计深度学习模型,并进行端到端的训练和模型评估。该程序包包括应用程序接口(API)、命令行工具、程序文档以及使用教程。此外,该程序包还预置了一些预训练模型(例如,脊柱肿瘤分割、脊椎标记)。为了导入数据,ivadomed自带一个数据加载器,它可以解析元数据(例如,获取参数、图像对比度、分辨率)和元数据(例如,病理数据、年龄、性别),从而在训练和评估阶段进行数据划分或引入额外的信息。任何遵循了BIDS数据标准的数据集都可以和与ivadomed兼容,无需再手动地组织数据。除了传统的深度学习方法,ivadomed还实现了一些前沿的深度学习架构(例如,FiLM和HeMis),以及各种不确定性估计方法(基于概率、知识的方法)。在损失函数方面,ivadomed提供了一些适用于不平衡类别以及非二分类预测的损失函数。在使用ivadomed时,每个步骤后可以通过一个文件方便地进行配置。为了实现高内聚低耦合,ivadomed的代码是高度模块化的,用户可以添加、修改架构或预处理、后处理步骤。

NeuroPoly 实验室&Quebec AI 研究院 

 

 

观点

 

张亚勤:在未来的五到十年,自动驾驶、工业互联网、智慧医疗这三个产业会遇到大的机遇

 

10月22日上午,清华大学智能产业研究院院长、清华大学“智能科学”讲席教授张亚勤博士在中国计算机大会(CNCC 2020)上作了主题为《智能产业新浪潮》的特邀报告。他表示,智能产业的发展不仅提供了传统行业产业升级的机会,还能创造更多新需求、新岗位。在未来的五到十年,自动驾驶、工业互联网、智慧医疗这三个产业会遇到大的机遇。

智源社区

 

 

应用

 

Kite用AI为开发人员提供代码片段自动补全功能

 

近年来,辅助开发人员编程的AI工具越来越受欢迎,像“DeepCode”这样的初创公司提供基于人工智能的代码审查,而微软这样的科技巨头也试图将人工智能应用于整个应用程序开发周期。而Kite为开发人员提供代码片段自动补全功能,近期又新增了对11种编程语言的支持,使其支持的总数达到了13种。在Kite的帮助下,活跃开发者甚至每天只需编写由大约175个单词组成的代码。

新智元

 

Maxine分解Nvidia的AI视频会议技术

 

Maxine演示中最有趣的部分之一是AI视频压缩功能。有些夸张的展示是在Nvidia的YouTube上发布的视频显示,使用神经网络压缩视频流将带宽从97KB/帧减少到0.12KB/帧。Nvidia的网站指出,开发人员可以将带宽使用降低到“H.264视频压缩标准所需带宽的十分之一”,这是一个更加合理且仍然令人印象深刻的数字。

TechTalks

 

谷歌利用众包老照片还原儿时3D街景

为了研究和娱乐目的创造一个有益的「时间旅行」体验,谷歌AI研究院推出了一个基于浏览器的工具集名为。这是一个运行在Google Cloud和Kubernetes上的开源、可扩展的系统,可以根据历史地图和照片重建城市,这是谷歌今年早些时候推出的开源工具套件的一个实现。

Google AI 

 

代码及开源项目

 

用于大规模图像识别的Transformer

 

本文来自Google Brain团队,将NLP领域的transformer不作修改地搬到CV领域中。Transformer架构早已在自然语言处理任务中得到广泛应用,但在计算机视觉领域中仍然受到限制。在计算机视觉领域,注意力要么与卷积网络结合使用,要么用来代替卷积网络的某些组件,同时保持其整体架构不变。本文不同于以往工作的地方,就是尽可能地将NLP领域的transformer不作修改地搬到计算机视觉领域来。本文研究表明,对 CNN 的依赖不是必需的,当直接应用于图像块序列时,transformer也能很好地执行图像分类任务。在实验中,本文作者发现,在中等规模的数据集上(例如ImageNet),transformer模型的表现不如ResNets;而当数据集的规模扩大,transformer模型的效果接近或者超过了目前的一些SOTA结果。

Google Brain

 

 

具有自适应阈值和局部上下文池化的文档级关系提取

 

本文来自南加州大学,针对文档级关系提取的新挑战提出了两种新颖的技术,在DocRED的关系提取中排名第一。与句子级RE对应项相比,文档级关系提取(RE)提出了新的挑战。一个文档通常包含多个实体对,并且一个实体对在与多个可能关系相关联的文档中多次出现。 在本文中,作者提出了两种新颖的技术,自适应阈值和局部上下文池,以解决多标签和多实体问题。自适应阈值替换为先前学习中用于多标签分类的全局阈值,该阈值为可学习的依赖实体的阈值。本地上下文池化将注意力直接转移到预先训练的语言模型上,从而找到有助于确定关系的相关上下文。论文在三个文档级RE基准数据集进行了实验:DocRED,一个最近发布的大规模RE数据集,以及生物医学领域中的两个数据集CDR和GDA。论文的ATLOP(自适应阈值处理和本地化context池)模型的F1得分为63.4;并且在CDR和GDA上也大大优于现有模型。

南加州大学

 

通过对比均衡学习进行语音识别的无监督表示学习

 

本文以无监督学习来进行语音实别,并提出对比均衡学习(CEL)达到了最优的结果。文中提出了一种简单而强大的无监督语音识别学习方法,即对比均衡学习(CEL),该方法通过利用均匀性损失来增加潜在干扰因素的不确定性。为了保持语音的可辨别性,将对比相似度损失函数一起使用。实验结果表明,所提出的CEL明显优于最新的无监督语音识别系统,并且在VoxCeleb1和VOiCES上,性能最佳的模型分别实现了8.01%和4.01%的EER。最重要的是,使用通过CEL预训练的初始参数训练的监督语音嵌入网络的性能要比使用随机初始化的参数训练的监督者更好。

Github

 

 

教程

 

清华大学刘知远:知识指导的自然语言处理

 

在由中国科协主办,清华大学计算机科学与技术系、AI TIME论道承办的《2020 中国科技峰会系列活动青年科学家沙龙——人工智能学术生态与产业创新》上,清华大学副教授、智源青年科学家刘知远所作的学术报告《知识指导的自然语言处理》,于深度学习时代另辟蹊径,阐释了语言知识和世界知识对于自然语言处理的重要价值。本次报告主要从义原知识和世界知识两个方面,阐述了知识指导的自然语言处理相关的工作。

大数据文摘

 

人物

 

CCF王选奖、CCF海外杰出贡献奖、CCF-ACM人工智能奖、CCF-IEEE CS青年科学家奖、CCF科学技术奖颁发

 

在CNCC召开期间,CCF王选奖、CCF海外杰出贡献奖、CCF-ACM人工智能奖、CCF-IEEE CS青年科学家奖、CCF科学技术奖颁发。2020年CCF王选奖授予华中科技大学金海教授。2020年CCF海外杰出贡献奖授予爱丁堡大学信息学院主任教授樊文飞、纽约州立大学石溪分校电气与计算机工程系SUNY杰出教授杨元元。2020年CCF-ACM人工智能奖授予南京大学周志华教授。2020年CCF-IEEE CS青年科学家奖分别授予国防科技大学郭得科教授、北京大学梁云副教授、中国科学院软件研究所吴志林研究员、南京大学俞扬教授、清华大学翟季冬副教授。2020年共有23个项目分别获得CCF科学技术奖的自然科学奖、技术发明奖、科技进步奖。

中国计算机学会 

 

 

 

你可能感兴趣的:(AI行业态势感知)