AI行业态势感知(第四期)

 

 

 

导读

 

为了帮助飞桨同学更好地了解人工智能领域的最新资讯,每周二更新《AI行业态势感知》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况)、数据(数据集),工具(新工具和应用推荐)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。

 

 过去一周(2020/10/12~2020/10/18),值得关注的内容有以下3方面:

 

1.       Forrester机器学习报告发布,腾讯云跃居第一阵营:国际权威分析机构Forrester发布Now Tech: Predictive Analytics And Machine Learning In China, Q3 2020报告,该报告选取了国内市场中主流的预测分析和机器学习领域厂商进行评估。这份预测分析和机器学习领域报告显示,腾讯基于人工智能领域的优势,腾讯云从2018年的第三阵营上升到第一阵营。(详情参见本周报“行业与政策”栏目)

 

2.      全球最大最干净的人脸识别数据集Glint360K开源:格灵深瞳开源了全球最大最干净的人脸识别数据集Glint360K。Glint360K具有36w类别,和1700w张图片,不论在类别数还是图片数目,相比起MS1MV2都是大幅度的提升。(详情参见本周报“数据”栏目)

 

3.     Google推出 TensorFlow Recommenders (TFRS),这款开源 TensorFlow 软件包可简化构建、评估和应用复杂的推荐模型。TFRS 基于TensorFlow 2.x 和 Keras,易于上手,在采用模块化设计的同时(可以自定义每个层和评价指标),各个组件可以良好协作。有助于:构建和评估灵活的 Candidate Nomination Model;将条目、用户和上下文信息自由整合到推荐模型;训练可联合优化多个推荐目标的多任务模型;用 TensorFlow Serving 高效利用生成的模型。(详情参见本周报“直接竞品动态”栏目)

 

 

直接竞品动态:

 

Mindspore

MSG | 10.17,北京场终终终于来了!

 

自2020年5月开始,MSG组织在海内外举办了数十场活动。国内已经在深圳、杭州、上海、苏州根据地,海外有俄罗斯、新加坡、印尼大本营。

MSG一般会做什么?1技术研讨: MindSpore技术专家讲解最新版本技术亮点、邀请技术大咖分享关于AI、深度学习最新动态  2. 极客分享:开发者分享MindSpore真实场景的应用案例、极客们分享前沿技术进展与软硬件最新技术。3. 社区贡献:引导开发者从零参与MindSpore社区贡献、培养开发者成为开源社区的contributor

 

业界首个全场景AI实战营来袭!从小白到大牛只需21天

 

MindSpore深度学习实战营,时长为21天,内容有:基于MindSpore Lite开发目标检测的安卓APP、基于ResNet50实现毒蘑菇识别实战、基于YOLOv3实现篮球检测模型实战、基于BERT实现新闻分类实战、基于Wide&Deep实现CTR预估实战。全程挺作业跟踪批改,并给予开发者结业激励和日常学业激励

 

TensorFlow

TensorFlow Recommenders 现已开源,让推荐系统更上一层楼!

 

Google推出 TensorFlow Recommenders (TFRS),这款开源 TensorFlow 软件包可简化构建、评估和应用复杂的推荐模型。TFRS 基于TensorFlow 2.x 和 Keras,易于上手,在采用模块化设计的同时(可以自定义每个层和评价指标),各个组件可以良好协作。有助于:构建和评估灵活的 Candidate Nomination Model;将条目、用户和上下文信息自由整合到推荐模型;训练可联合优化多个推荐目标的多任务模型;用TensorFlow Serving 高效利用生成的模型。

https://tensorflow.google.cn/recommenders

对飞桨有竞争压力的信息:

 

微软NNI登顶本周GitHub trending榜

 

NNI是一个开源的AutoML套件,包含特征工程,神经网络结构搜索、模型压缩与自动化超参调整功能。NNI提供命令行工具以及WebUI来管理实验。通过可扩展的API,可定制自动机器学习算法和训练平台。NNI内置了最新的自动机器学习算法,并为流行的训练平台提供了开箱即用的支持。目前支持:Keras、TensorFlow、MXNet、Caffe2

Github

 

“spring boot demo”项目登上本周GitHub trending榜

 

spring boot demo 是一个用来深度学习并实战 spring boot 的项目,目前总共包含 65 个集成demo。 该项目已成功集成 actuator(监控)、admin(可视化监控)、logback(日志)、aopLog(通过AOP记录web请求日志)、统一异常处理(json级别和页面级别)、freemarker(模板引擎)、thymeleaf(模板引擎)、Beetl(模板引擎)、Enjoy(模板引擎)、JdbcTemplate(通用JDBC操作数据库)、JPA(强大的ORM框架)、mybatis(强大的ORM框架)、通用Mapper(快速操作Mybatis)、PageHelper(通用的Mybatis分页插件)等工程实例 

Github

 

论文推荐

 

基于预训练语言模型的多语言事实知识检索

Multilingual Factual Knowledge Retrieval from Pretrained Language Models

 

目前,语言模型通过完成完形填空风格的空白问题,成功地捕获了事实知识。但是,尽管知识是用多种语言编写和查询的,但关于LM的事实表示能力的研究几乎总是以英语进行的。为了评估LM中不同语言的事实知识检索,作者为类型多样的语言创建了完形填空样式的多语言基准。为了正确处理语言变化,作者将探测方法从单字实体扩展到多字实体,并开发了几种解码算法以生成多令牌预测。广泛的实验结果提供了有关当前最新的LM在使用或多或少可用资源的语言中执行此任务的性能(或较差)的见解。作者进一步提出了一种基于代码切换的方法,以提高多语言LM访问知识的能力,并验证其在几种基准语言上的有效性。

 

论文下载

 

《自然》重磅:清华团队提出神经形态计算系统新架构

A system hierarchy for brain-inspired computing

 

来自清华大学、北京信息科学与技术国家研究中心、美国特拉华大学(University of Delaware)科研团队的一项突破性研究,或将加速类脑计算和通用人工智能(Artificial General Intelligence,AGI)的到来。研究人员在类脑计算通用系统层次结构方向取得突破性进展,并提出了“神经形态完备性”(neuromorphic completenes)的最新概念。相关论文A system hierarchy for brain-inspired computing发表在《自然》(Nature)10月第三期(Volume 586 Issue 7829)上,清华大学计算机系研究员、智源学者张悠慧(第一作者)和清华大学教授、清华大学类脑计算中心主任施路平为该论文的共同通讯作者。作者里还有好几位智源学者:李国齐、陈文光和宋森老师。

 

论文下载 

 

数据

 

全球最大最干净的人脸识别数据集Glint360K开源

 

格灵深瞳开源了全球最大最干净的人脸识别数据集Glint360K。Glint360K具有36w类别,和1700w张图片,不论在类别数还是图片数目,相比起MS1MV2都是大幅度的提升。

 

格灵深瞳

 

 

行业与政策

 

Forrester机器学习报告发布,腾讯云跃居第一阵营

 

国际权威分析机构Forrester发布Now Tech: Predictive Analytics And Machine Learning In China, Q3 2020报告,该报告选取了国内市场中主流的预测分析和机器学习领域厂商进行评估。这份预测分析和机器学习领域报告,从市场表现角度,将受评估厂商划分为Large(大型,年收入大于2亿人民币)、Midsize(中型,年收入5000万到2亿人民币)、Small(小型,年收入小于5000万人民币)三个等级。基于人工智能领域的优势,腾讯云从2018年的第三阵营上升到第一阵营。

 

AI科技评论

 

 

罗氏达成18亿美元合作,利用人工智能设计新一代AAV载体

 

Dyno Therapeutics今天宣布与罗氏(Roche)达成一项合作和许可协议,将利用该公司的CapsidMap平台开发新一代腺相关病毒(AAV)载体,用于为罗氏和旗下Spark Therapeutics公司的研发管线开发治疗中枢神经系统(CNS)疾病的基因疗法和肝脏定向递送的疗法。

 

药明康德 

  

新工具

 

OpenCV发布4.5版本

 

OpenCV 4.5版本已于近日发布了,作为2020秋季常规版本,本次的更新内容主要如下。1. 从4.5版本开始,OpenCV将正式使用Apache 2授权协议,对开发者更加友好,避免专利算法进入OpenCV带来的潜在纠纷;2. 因为SIFT专利到期,成为公有技术,代码被移到主库(实际上4.4版本已经进了);3. OpenCV中的RANSAC 算法进行了改进,相信做过图像匹配的同学都不陌生;4. 新增了实时单目标跟踪算法SiamRPN++;5. 改进了数字识别和文本识别的例程;6. 针对RISC-V指令集进行了优化;7. 增加Julia语言OpenCV绑定。

 

OpenCV

 

情景智能平台:多模态一体化人工智能开源框架

 

如何构建能够实时感知、理解并在人类世界中行动的人工智能系统?事实上,要建立这样的系统需要组合和协调不同的人工智能技术,将多种人工智能技术(如机器学习、计算机视觉、语音识别、自然语言处理和对话管理等)结合在一起。最近,微软研究院推出的情景智能平台(Platform for Situated Intelligence)致力于提供完整的开发套件,能大大提高应用开发及相关研究的效率,或许在一定程度上推动了该问题的解决。

 

微软亚洲研究院

 

欧洲发布最强AI超级计算机LEONARDO

 

本周在意大利CINCA研究中心揭幕的Leonardo(莱昂纳多)超算是用了14000个Nvidia GPU,Nvidia称其为“世界上最强大的AI系统”,这个系统在某些半精度浮点(FP16)应用中提供10 exaflops的AI性能,在以Top500为基准进行测试时,可以提供大约200 petaflops算力。这一系统的推出,也将从今年底开始改变欧洲超算系统的格局。

 

雷锋网 

 

 

观点

 

加州大学伯克利分校教授Michael Jordan:人工智能研究的目标变了,不再是构建单个智能

 

近期,加州大学伯克利分校的机器学习专家Michael I. Jordan在“北大人工智能开学第一课”中,分享了《机器学习与微观经济学的融合》。在本次演讲中,Michael Jordan提出一个新的观点,即人工智能正逐步由原理性研究走向人工智能工程。伴随这个过程,人工智能的目标也发生了本质性变化,不再只是去研究如何“在单个计算机上复现人类智能”,更重要的是如何“构建现实世界中的系统,从而解决现实世界中的超大规模问题”。

 

智源社区

 

 

应用

 

伯克利AI预测自动驾驶汽车何时将“脱离”

 

“脱离”,在自动驾驶系统中是一个重要的指标。是指当自动驾驶汽车遇到故障,脱离自动驾驶模式,改为人类驾驶员接管车辆的情况。很多人认为“脱离”次数越少,就能说明一个自动驾驶系统能力越强。因此,以往的研究都会把“脱离”当作是故障来排除掉。但最近,UC伯克利的研究人员却“以毒攻毒”,直接用这样的数据来训练机器人,预测未来何时将发生脱离事件。研究人员称它为LaND——从“脱离”中学会导航。研究人员表示,通过这样的方法得到的结果,要比传统的强化学习、模仿学习都要强。

 

量子位  

 

Facebook AI联手CMU宣布Open Catalyst项目,利用AI寻找存储可再生能源的新方法

 

Facebook AI 和卡内基梅隆大学(CMU)化学工程系今天宣布启动Open Catalyst Project,该合作项目旨在利用AI将量子力学模拟加速1000倍,以便发现存储可再生能源所需的更高效和可扩展的新型电催化剂。

 

Facebook AI

 

代码及开源项目

 

PlugNet:一种基于可插拔的超分辨学习单元的文本识别方法

 

此前,解决模糊问题往往需要依赖于串联一个大型的超分辨网络来进行图像级的超分辨学习,以此改善输入图像的质量。这种方案往往需要依赖有力的数据集划分以及大量的计算资源,在实际应用中显得并不具有性价比。因此,作者提出了一个含有可插拔超分辨单元的端到端学习的文本识别方法(PlugNet)。通过在训练时增加超分辨支路来改善特征表达的方式提升低质量文本的识别结果,这也就意味着相对于原始的文本识别方案,PlugNet在应用时(前向计算)没有增加任何额外的计算量。

 

ECCV 2020 

 

pSp:用于图到图转换的StyleGAN编码器

 

该pSp框架提出一种编码器网络,可以生成一系列样式向量,这些向量被馈入预训练的StyleGAN生成器中,从而形成扩展的W+潜在空间。该编码器可以直接将真实图像转换到W+中,无需进行其他优化。本文引入一种设计精巧的identity loss,能够提高图像的重建性能。pSp是一种简单的体系结构,通过利用训练好的的固定生成器网络,可以将其轻松应用于各种图像到图像的翻译转化任务。通过style表示来解决这些图像转换任务,可以不只依赖于局部像素间的相关性,而进一步支持多模态信息合成。pSp可以在没有标签数据的情况下将侧脸图像转为正脸,也可以产生多模态结果以利用骨架或者语义分割信息进行条件人脸生成。

 

ICLR 2020 open review

 

 

教程

 

机器学习实战:基于Scikit-Learn、Keras和TensorFlow

 

这本机器学习畅销书基于TensorFlow 2和Scikit-Learn的新版本进行了全面更新,通过具体的示例、非常少的理论和可用于生产环境的Python框架,从零帮助你直观地理解并掌握构建智能系统所需要的概念和工具。全书分为两部分。第一部分介绍机器学习基础,涵盖以下主题:什么是机器学习,它试图解决什么问题,以及系统的主要类别和基本概念;第二部分介绍神经网络和深度学习,涵盖以下主题:什么是神经网络以及它们有什么用,使用TensorFlow和Keras构建和训练神经网络的技术,以及如何使用强化学习构建可以通过反复试错,学习好的策略的代理程序。第一部分主要基于Scikit-Learn,而第二部分则使用TensorFlow和Keras。

 

专知

 

UC伯克利:深度强化学习最新课程

 

当地时间10月11日,UC伯克利电气工程与计算机科学系(EECS)助理教授Sergey Levine在推特上宣布,他讲授的CS285深度强化学习(RL)课程已经放出了部分视频,并表示之后每周会实时更新后续课程。主题涵盖深度强化学习领域的方方面面,UC伯克利 CS 285 2020秋季课程视频放出。

 

UC伯克利

 

【ISOLABS】最新《图神经网络实用指南》

 

图神经网络最近在人工智能领域变得越来越受欢迎,这是因为它们具有提取相对非结构化数据类型作为输入数据的独特能力。尽管GNN体系结构的一些元素在操作上与传统神经网络(以及神经网络变体)的概念相似,但其他元素则不同于传统的深度学习技术。本教程通过整理和呈现最常见类型的GNNs的动机、概念、数学和应用的详细信息,向一般深度学习爱好者展示了GNNs的强大功能和新颖之处。

 

ISOLABS

 

人物

 

南大周志华教授获首届CCF-ACM人工智能奖

 

“CCF-ACM人工智能奖”授予在人工智能理论、技术或应用做出杰出贡献,且获奖时在中国工作的专业人士。该奖由CCF和ACM共同评选和颁发,于2020年设立。CCF奖励委员会决定授予南京大学周志华教授2020年“CCF-ACM人工智能奖”,以表彰他在机器学习的多个领域做出的杰出贡献。周志华,南京大学教授、计算机系主任、人工智能学院院长、欧洲科学院外籍院士、ACM/AAAS/AAAI/IEEE/IAPR Fellow、CCF会士。主要研究方向为人工智能、机器学习、数据挖掘。

 

AI科技评论

 

 

 

你可能感兴趣的:(AI行业态势感知)