01
国家最高认可!中央文件:数据成为生产要素之一,政府数据将开放共享
大数据时代,数据是重要的——那么,数据到底有多么重要呢?答曰:跟土地一样重要。
其实,关于这个问题,有一种比较形象的说法是——数据是新的石油。然而,4 月 9 日,伴随着中央决策层下发的一个重要文件,这个问题有了来自官方的权威答案:它与土地、劳动力、资本、技术等一样,都是可市场化配置的生产要素。数据,已经成为国家所定义的 "生产要素",这是史无前例的。
首先,要素,其实是生产要素的简称。生产要素,是经济学中的一个基本范畴,主要指的是进行社会生产经营活动时所需要的各种社会资源,是维系国民经济运行及市场主体生产经营过程中所必须具备的基本因素。这些生产要素往往可以进行市场交换,从而形成各种各样的生产要素价格及其体系,并由此形成要素市场,但目前也同时存在着一些不完全合理的配置因素。
4 月 9 日,新华社正式刊发了中共中央、国务院《关于构建更加完善的要素市场化配置体制机制的意见》(以下简称《意见》),意见形成于 2020 年 3 月 30 日。这是中央发布的第一份关于要素市场化配置的文件,具有重大意义。
在国家层面,数据的重要性终于得到最高认可。
正如国家发改委相关负责人的说法,数据生产要素属性的提升,关系着经济增长长期动力,关系着我们国家发展的未来。尽管此前中央和国家层面多次谈到 "大数据" 的重要性,但在这次的《意见》中,数据作为当前社会经济发展的基础性要素的地位,才得到了前所未有的重视。
信息来源:雷锋网
02
百度Apollo正式对外发布“ACE 交通引擎”
百度积累了多年的自动驾驶技术,正式进入了落地高级阶段。
今天,百度Apollo正式推出了ACE交通引擎,这是一套整体的解决方案,把百度的人工智能、自动驾驶、车路协同业务打包在了一起。
名字看上去有点唬人,实质上,就是把百度2013年起为自动驾驶所准备的一切——包括但不限于自动驾驶软件系统、人工智能技术、车路协同技术、飞桨、上下游积累的产业合作伙伴资源、高精地图、车联网智能生态等等——组团出道,正式向全国各地推广落地。
现在,除了已经开始落地的北京、长沙、保定,百度也在3月份拿下了重庆、阳泉、合肥三座城市的车路协同基建项目。
ACE交通引擎是一套智能交通全套解决方案,也是一个庞大的生态系统。当然,为了完成这庞大的工作量,百度还发布了《Apollo智能交通白皮书》,具体描绘了这一系列工作落地的蓝图。
《Apollo智能交通白皮书》中的介绍,A是Autonomous Driving,也就是自动驾驶;C是Connected Road,指的是车路协同;E是Efficient Mobility,意味高效出行。百度在人工智能、自动驾驶、车路协同、智能交通方面的所作所为,都被打包在了ACE这个大框架之下。
整个ACE交通引擎的构成,包括一大数字底座、两大智能引擎和N大应用生态。
一大数字底座是指包括车、路、云、图在内的交通基础设施,小度车载OS、飞桨深度学习平台、百度智能云、百度地图都是基础设施的一部分。
两大智能引擎则是Apollo自动驾驶引擎和车路协同引擎。而N大应用生态则包罗万象,覆盖了需要自动驾驶、智能交通的各个场景。
根据这份蓝图来预测,这样看来,如果你在大城市,尤其是大城市的高新区、开发区,那么2025年,就可以把自动驾驶车当成一个新鲜事物来体验,要是你的日常活动区域不太大,那么摇不到号也不是什么大问题。
信息来源:量子位
03
一行命令启动,十分钟内完成部署,Paddle Serving开放模型即服务功能
百度飞桨的 Paddle Serving 能够实现服务器端快速部署,最近,随着飞桨更新到 1.7 版本,Paddle Serving 也有了新变化。Paddle Serving 是飞桨的服务化部署框架,长期目标就是为人工智能落地的最后一公里提供越来越专业、可靠、易用的服务。随着飞桨开源框架推出最新的 1.7 版本,Paddle Serving 的最新版本也闪亮登场。
Paddle Serving 秉承模型即服务(Model As A Service,MAAS)的理念,全面打通并自动化飞桨训练框架与 Paddle Serving 的衔接流程,让用户在使用飞桨成功完成模型训练的那一刻,收获的不再只是模型,而是同时拥有了该模型的推理服务,使用户能够在几分钟内将模型转化为一个可以在服务器端部署的远程服务。总的来说,Paddle Serving 具有如下四大特点:
简单易用:为了让使用飞桨的用户能够以极低的成本部署模型,Paddle Serving 设计了一套与飞桨开源框架无缝打通的预测部署 API。对于不需要较为复杂的数据预处理过程的普通模型来说,每一位模型算法工程师仅使用一行命令就可以轻松部署自己的模型服务。
工业可用:为了达到工业级深度学习模型在线部署的要求,Paddle Serving 提供很多大规模场景需要的部署功能:
分布式稀疏参数索引功能。
高并发底层通信能力。
模型管理、在线 A/B 流量测试、模型热加载。
功能扩展:当前 Paddle Serving 支持 C++、Python、Golang 的客户端,未来也会面向不同类型的客户新增多种语言的客户端。在 Paddle Serving 的框架设计方面,尽管当前版本以支持飞桨模型的部署为核心功能,但是用户也可以很容易嵌入其它的机器学习库部署在线预测服务。
高性能引擎支持:飞桨的 Paddle Inference 原生推理库作为当前 Paddle Serving 唯一支持的后端推理引擎,具备诸多高性能的特性,例如内存/显存复用、算子自动融合、TensorRT 子图以及 Paddle Lite 子图自动调用等功能。Paddle Serving 从客户端请求到服务端计算的整体流程如图 1 所示,整个底层通信都采用了高并发、低延时的 Baidu-RPC 服务,支撑深度学习模型在线部署的整个流程,使其性能进一步提高。
Paddle Serving 工作流程示意图
04
英国全能数学家John Conway因新冠去世,他曾发明生命游戏
当代最有趣的数学家John Horton Conway,因为新冠肺炎逝世了,享年82岁。
虽然他所在的普林斯顿大学未发出公告,但是他的同事David Spergel在Twitter上证实了这一消息。
有人评价他,世界上可能有比他更厉害的数学家,但是在顶尖的数学家里,没有人能比他科普做得更好。
他在数学领域多点开花,是一个在组合博弈论、几何、数论、群论、算法甚至量子力学理论等多个方面都做出贡献的天才数学家。
他发明的一款生命游戏,在上世纪70年代占据了1/4的计算机,成为那时极客的最爱。
他还算出在24维空间的球迷密堆积中,每个球体都和196560个球体接触。
这款游戏的规则如下:
1、每个细胞有两种状态,存活或死亡。每个细胞与以自身为中心的周围八格细胞产生互动。
2、当前细胞为存活状态时,如果它周围的存活细胞低于2个时(不包含2个),该细胞变成死亡状态。(模拟生命数量过少)
3、当前细胞为存活状态时,如果它周围有2个或3个存活细胞时,该细胞保持原样。
4、当前细胞为存活状态时,如果它周围有超过3个存活细胞时,该细胞变成死亡状态。(模拟生命数量过多)
5、当前细胞为死亡状态时,当周围有3个存活细胞时,该细胞变成存活状态。(模拟繁殖)
科学家可以用它来模拟生命过程,虽然早在1940年代冯诺依曼就提出了这一概念,但是直到康威把他设计成游戏才引起足够重视。
在这个规则下,可以衍生处稳定状态:
振荡状态:
和移动状态:
生命游戏背后可能隐藏着自然界的某种特殊规律。
史蒂芬·霍金在他的《大设计》一书中说:
“我们可以想象,像生命游戏这样的东西,只有一些基本规律,可能会产生高度复杂的功能,甚至是智能。它可能需要包含数十亿个正方形的网格,但这并不奇怪。我们的大脑中有数千亿个细胞。”
信息来源:量子位
05
AI无间道!清华AI团队推出AI安全平台
随着人工智能技术的发展,人工智能在很多场景里正逐渐替代或协作着人类的各种劳动,它们可以成为人类的眼睛、耳朵、手臂甚至大脑。其中,机器视觉作为AI时代的基础技术,其背后的AI算法一直是各科技巨头和创业公司共同追逐的热点。然而,这些主流应用场景的背后,往往也藏着由技术性缺陷导致的算法安全风险。
例如,在一些训练数据无法覆盖到的极端场景中,自动驾驶汽车可能出现匪夷所思的决策,导致乘车人安全风险。从2016年至今,Tesla、Uber等企业的辅助驾驶和自动驾驶系统就都曾出现过类似致人死亡的严重事故。并且这类极端情形也可能被恶意制造并利用,发起“对抗样本攻击”,去年7月,百度等研究机构就曾经通过3D打印,能让自动驾驶“无视”的障碍物,使车辆有发生撞击的风险,同样威胁行驶安全。
之所以能攻击成功,主要是机器视觉和人类视觉有着很大的差异。因此可以通过在图像、物体等输入信息上添加微小的扰动改变(即上述故意干扰的“对抗样本”),就能导致很大的算法误差。此外,随着AI的进一步发展,将算法模型运用于更多类似金融决策、医疗诊断等关键核心场景,这类AI“漏洞”的威胁将愈发凸显出来。
近日,清华大学AI研究院孵化企业RealAI(瑞莱智慧)正式推出首个针对AI在极端和对抗环境下的算法安全性检测与加固的工具平台——RealSafe人工智能安全平台。
对于国内几家科技巨头的人脸识别模型,对抗样本的「伪装」效果均比较明显。瑞莱智慧的研发人员说:这种对抗样本同样也可以使亚马逊、微软等人脸识别平台的服务出现严重的识别错误。
除了人脸比对外,对抗样本攻击还可能出现在目标检测的应用场景中,延伸来看,这可能会危害到工业、安防等领域的安全风险检测。比如某电网的输电塔的监控系统,由于输电塔的高安全性防护要求,防止吊车、塔吊、烟火破坏输电线路,需要对输电塔内外进行全天候的实时监控,而这实时监控系统背后就是基于目标检测的AI算法来提供保障。
而RealAI研究团队发现,只要通过RealSafe对其中的目标检测算法进行一定的对抗样本攻击,就会造成监控系统失效,导致其无法识别非常明显的烟火情形,类似情形如果真实发生,将可能带来难以估计的损失。
信息来源:量子位
05
本周论文推荐
【CVPR2020-清华大学】渐进对抗网络的细粒度域适应,Progressive Adversarial Networks
作者:Sinan Wang, Xinyang Chen, Yunbo Wang, Mingsheng Long (B), and Jianmin Wang
论文介绍:
细粒度的视觉分类一直被视为一个重要的问题,然而,其实际应用仍受限制,因为精确的注解大量细粒度图像数据集是一项艰苦的任务,需要人类的专家级知识。解决这个问题的一个方法是将域适应方法应用于细粒度场景,其中的关键思想是发现现有的细粒度图像数据集和大量未标记数据之间的共性。主要的技术瓶颈是在域对齐过程中,大的域间变异会使小的类间变异的细微边界变差。本文提出了一种基于课程的对抗学习框架的渐进式对抗网络(PAN),该网络可将跨领域的细粒度分类进行对齐。特别是,在整个学习过程中,通过所有的多粒度特性进行域适应,逐步地从粗到细利用标签层次结构。该方法既适用于类别分类,又适用于域对齐,提高了细粒度特征的可识别性和可移植性。这里的方法是在三个基准上评估的,其中两个是文本提出的,它比最先进的领域适应方法表现更好。
论文地址:
http://ise.thss.tsinghua.edu.cn/~mlong/doc/progressive-adversarial-networks-cvpr20.pdf
END