01
中国开源项目wuhan2020登上Github热榜,开发者加入支援大军!
近日,Github上一个名叫“wuhan2020”的项目登上了热榜,这是一个武汉新型冠状病毒防疫信息收集平台。项目前端网页:https://wuhan2020.github.io/
地址:https://github.com/wuhan2020/wuhan2020
针对 2020 年初在武汉爆发的新型冠状病毒疫情,该项目旨在收集各医院、酒店、工厂、物流、捐赠、捐款、预防、治疗、动态等信息,统一收集,统一发布,以便各方之间进行信息互通,有效调配社会资源。
例如医院信息的石墨文档,如果我们加入志愿者,就可能需要将不同官方数据源中的信息填入下表。
当然作为开发者,我们也可以构建更好的使用体验,例如优化 Web 前端、可视化展示数据、爬虫自动化采集数据等等。如果读者想要加入志愿开发者,也可以查阅 GitHub 项目。目前志愿开发者可以从 ISSUE 中挑选任务,并将其分配给自己。
信息来源:机器之心
02
五分之一参会者将缺席AAAI 2020,中国作者可远程演讲
在疫情影响下,大家不仅开始在线办公、在线上课,甚至连学术会议也要在线参与了。
在疫情肆虐的时候,美国禁止中国人入境,受此影响,本来今天要在纽约举办的AAAI 2020会议,不少中国作者无法出席。本来,杨强教授要在AAAI 2020上介绍他的一篇论文,但鉴于疫情四散的紧张状况,他决定放弃去美国。而国内AI大厂百度,也被AAAI 2020接收了28篇论文,百度的作者们也无赴美介绍论文了。
根据预估,中国大陆大约有800名参会者无法线下出席AAAI 2020。而正常会议本来有4000人左右参会,相当于五分之一的参会者都被迫缺席。面临这样严重的情况,AAAI也被动加入了“线上办公”的行列。
AAAI 2020程序主席、杜克大学教授Vincent Conitzer宣布,受疫情影响的中国参会者可以远程参会,远程参会的具体事项会有中国的同事帮忙。对于因新冠病毒而无法线下参会的所有论文作者,AAAI官方说,最好能找个可以参会的同事来介绍论文,在找不到的情况下,AAAI可以提供以下帮助:
提交演讲PPT,AAAI会给到演讲者会议主席的邮箱,以方便演讲者进行提交。
需要进行演讲的作者,会议期间会接入电话会议来远程演讲。
需要展示Poster的作者,可以找方便到会场的同事来打印张贴,实在找不到人的话AAAI可以安排在纽约印刷张贴,不过要收96美元(669人民币)的服务费。
信息来源:量子位
03
英伟达DALI加速技巧:让数据预处理速度比原生PyTorch快4倍
深度学习的加速上,除了对训练和推理过程的加速之外,还有对数据加载和预处理阶段的加速。这一阶段也尤为关键,因为数据处理 pipeline 的处理速度也影响着整体的流程效率。英伟达数据加载库 DALI 是一个便捷式开源库,用于图像或视频的解码及增强,从而加速深度学习应用。通过并行训练和预处理过程,减少了延迟及训练时间,并为当下流行的深度学习框架中的内置数据加载器及数据迭代器提供了一个嵌入式替代器,便于集成或重定向至不同框架。
近日,有开发者介绍了如何使用 NVIDIA Data Loading Library(DALI),以及使用这个库进行数据预处理加速的方法。DALI 和 TensorFlow 自带的 DataLoader 类似,是一个专门用于加速数据预处理过程的库。
在一篇博客中,开发者表示,该库不仅可以进行 GPU 加速,也可以在 CPU 上构建一个完整的数据预处理流程。如果在 Tesla V100 上做测试,PyTorch+DALI 的处理速度能达到 4000 images/s,比原版 PyTorch 要快近 4 倍。开发人员可以在 GPU 上运行他们的数据处理通道,从而减少训练神经网络的时间。
DALI 设计之初就是用来帮助用户突破数据预处理的瓶颈,使得模型的训练和推理能够达到最高的效率。其主要设计是用于在 GPU 上的预处理,但大多数操作也可在 CPU 上实现。
DALI主要特征
易于使用的 Python API
在多个 GPU 之间显式地缩放
加快图像分类(ResNet-50)和目标检测分类(SSD)工作流
灵活的计算图使得开发人员可创建自定义的数据处理 pipeline
支持多种格式 - LMDB、RecordIO、TFRecord、COCO、JPEG、H.264 以及 HEVC
开发人员可添加自定义的图像或视频处理 operator
信息来源:机器之心
04
李飞飞、邓中翰当选美国国家工程院院士
美国国家工程院院长约翰·安德森今天宣布,美国国家工程院(NAE)选举出了87名新院士和18名国际院士。这样一来,美国的总院士数达到了2309,国际院士数达到了281。
入选美国国家工程院院士是授予工程师的最高专业荣誉之一。其目的是表彰那些对“工程研究、实践或教育,包括在适当的情况下对工程文献的重大贡献”和“开拓新的和发展中的技术领域,在传统工程领域取得重大进步,或开发/实施工程教育的创新方法”做出突出贡献的人。
在10月4日于华盛顿举行的NAE年度会议上,新当选的院士将正式入职。
今年入选的共有6名华人院士,和一名中国籍的国际院士。知名华人学者李飞飞和中星微电子董事邓中翰入选。
李飞飞:斯坦福大学计算机科学教授。为建立大型机器学习和视觉理解知识库做出了贡献。
邓中翰:中星微电子有限公司中星微电子集团首席执行官/董事长,中国北京。开发世界上第一台CMOS单芯片网络摄像头和中国的监视视频和音频编码(SVAC)国家视频标准。
05
本周论文推荐
A guide to deep learning in healthcare(医疗深度学习技术指南)
作者:Andre Esteva, Alexandre Robicquet, Bharath Ramsundar, Volodymyr Kuleshov, Mark DePristo, Katherine Chou, Claire Cui, Greg Corrado, Sebastian Thrun & Jeff Dean
论文概要:我们介绍了医疗保健的深度学习技术,重点讨论了计算机视觉、自然语言处理、强化学习和广义方法的深度学习。我们将描述这些计算技术如何影响医学的几个关键领域,并探讨如何构建端到端系统。我们对计算机视觉的讨论主要集中在医学成像上,我们描述了自然语言处理在电子健康记录数据等领域的应用。同样,在机器人辅助手术的背景下讨论了强化学习,并综述了基因组学的广义深度学习方法。
论文地址:
https://www.nature.com/articles/s41591-018-0316-z