导读:本期为 AI 简报 20201018期,将为您带来过去一周关于 AI 新闻 9 条,其他互联网圈内新闻 8 条,希望对您有所帮助~
有更好的建议或者意见请在下方留言~
YouTube 地址:
https://www.youtube.com/channel/UC_YPrqpiEqkeGOG1TCt0giQ/playlists
B 站地址:
https://www.bilibili.com/video/av457264185/
关于图神经网络(GNN)的在线课程已上线,讲师为宾夕法尼亚大学电气与系统工程系教授 Alejandro Ribeiro,部分视频以及文字讲稿已放出。
图神经网络(GNN)是对图形支持的信号进行信息处理的体系架构。这种架构已经被开发出来,并在一门在线课程中作为卷积神经网络(CNN)的泛化,用于处理时间和空间中的信号。
就课程内容而言,本课程主要探讨了图卷积滤波器和图滤波器组,研究了单特征和多特征图 GNN。此外,课程介绍了循环 GNN 等相关网络架构,并重点强调了 GNN 的置换等变性和图变形的稳定性。这些特性提供了一种可以从实证角度观察到 GNN 良好性能的解释方法。该课程还将研究大量节点中的 GNN,以解释 GNN 在不同节点数的网络中的可迁移性。
目前,该课程 Lecture 1 至 Lecture 5 的视频资源已经在 YouTube 和 B 站同时上线,对该主题感兴趣的读者可前往观看。
本周,arXiv上线了提交源代码功能,从此看机器学习论文不怕找不到官方代码了。
但是,如果作者自己没有提交代码,却有第三方实现怎么办?去Google找吗?
大可不必!现在告诉你一个浏览器插件神器,能帮你快速找到论文对应代码,无论官方还是第三方,不必在搜索引擎上找半天了。
这款插件叫做Find Code for Research Papers,现在已经支持Chrome和Firefox两款浏览器,可以直接应用商店搜到。
而且它不仅支持arXiv,还支持Google Scholar甚至Twitter,只要链接对应论文有开源代码,右侧统统会显示出[CODE]按钮。
今年共有9454篇论文提交,1900篇总接收,录取率仅为20.09%,其中105篇被接收为oral,280篇被接收为spotlight。
而在昨日,NeurIPS 2020论文接收列表终于在官网放出:
(https://neurips.cc/Conferences/2020/AcceptedPapersInitial)
据Criteo AI Lab机器学习研究科学家Sergey Ivanov统计,
本次NeurIPS 2020论文接收量全球机构排名Top 10依次为:
NeurIPS 2020的论文主题分布
今年NeurIPS 2020的论文主题分布也有所变化,算法占比29%,深度学习占比19%,应用占比18%,强化学习和规划(planning)占比9%,理论占比7%,概率方法占比5%,机器学习社会方面( Social aspects of machine learning)占比5%,优化占比5%,神经科学和认知科学占比3%。与2019年相比,深度学习和应用领域的论文略有下降(均下降了2%),而机器学习社会方面有所增加(增加了3%)
卡耐基梅隆大学(Carnegie Mellon University)的研究人员开发了一种新的衡量自动驾驶汽车对不断变化的交通状况的反应能力的标准,这使比较感知系统的准确性和反应时间首次成为可能。
在自动驾驶领域,存在这样一个典型的矛盾问题——学术研究人员往往更倾向于开发复杂的算法,以准确地识别危险,但这往往需要大量的计算时间。相比之下,工程师往往更喜欢简单、不那么精确的算法,这种算法速度快,需要的计算量少,这样自动驾驶车辆就能更快地对危险做出反应。
这个问题不仅仅存在自动驾驶领域,这也是任何需要对动态世界进行实时感知的系统的问题。到目前为止,还没有系统的方法来平衡准确性和反应时间。缺乏恰当的度量标准使得业内人士很难评价比较竞争系统。
这种新的测量方法被称为“流感知精确度”,该论文Towards Streaming Perception在计算机视觉虚拟欧洲会议(ECCV2020)上获得了最佳论文荣誉奖。
Github:
https://github.com/argusswift/YOLOv4-PyTorch
从今年 4 月 YOLOv4 发布后,对于这个目标检测框架,问的最多的问题或许就是:「有没有同学复现 YOLOv4 的, 可以交流一下么」。由于原版 YOLO 使用 C 语言进行编程,光凭这一点就让不少同学望而却步。网上有很多基于 TF/Keras 和 Caffe 等的复现版本,但不少项目只给了代码,并没有给出模型在 COCO、PASCAL VOC 数据集上的训练结果。
近日,有研究者在 GitHub 上开源了一个项目:基于 PyTorch 深度学习框架的 YOLOv4 复现版本,该版本基于 YOLOv4 作者给出的实现 AlexeyAB/darknet,并在 PASCAL VOC、COCO 和自定义数据集上运行。
除此以外,该项目还向主干网络添加了一些有用的注意力方法,并实现了 mobilenetv2-YOLOV4 和 mobilenetv3-YOLOV4。
Github:
https://github.com/NVlabs/imaginaire
图像 / 视频合成领域的集大成者,就在这一篇了。
图像和视频等视觉数据的生成是机器学习和计算机视觉领域重要的研究问题之一。近几年,英伟达提出了 SPADE、MUNIT 等多个图像及视频合成模型。
近日,英伟达又开源了一个新的 PyTorch 库「Imaginaire」,共包含 9 种英伟达开发的图像及视频合成方法。
这九种方法分别为:
有监督的图像到图像转换
1、pix2pixHD
2、SPADE/GauGAN
无监督的图像到图像转换
1、UNIT
2、MUNIT
3、FUNIT
4、COCO-FUNIT
视频到视频转换
1、vid2vid
2、fs-vid2vid
3、wc-vid2vid
论文链接:
https://arxiv.org/abs/2009.10874
场景文本识别中很多模型都使用了笨重的模型,这些模型很难在移动端设备上部署。这也是最近大火的Paddle OCR使用CRNN实现其超轻量级识别模型的原因。PaddleOCR采用的策略就是暴力削减特征通道来减小模型,但是这样使得性能大幅度下降。最近在arXiv上公开的Hamming OCR提出了Hamming Embedding和LSH局部敏感哈希分类的算法,大幅度削减模型大小,同时保留模型能力。
Github:
https://github.com/deepinsight/insightface/tree/master/recognition/partial_fc#glint360k
Paper:
https://arxiv.org/abs/2010.05222
学术界的测评比如IJB-C和megaface,利用该数据集很容易刷到SOTA,大家具体可以看论文,这里展示一下IFRT的结果,IFRT又称国产FRVT, IFRT测试集主要有不同肤色的素人构成,相比起IJB-C和megaface更具有模型的区分度。
相比起目前最好的训练集MS1MV3,Glint360K有十个点的提升
CVer 陆续分享了GitHub上优质的AI/CV资料集锦,如图像分类、目标检测等,之前的分享详见文末。很多同学反映这个系列很棒,因此系列将继续更新
本文将分享的内容是:数据增广(Data Augmentation)。该方向的研究一直都很热门,特别是现在仍十分依赖于数据,而且数据增广对各个应用方向的涨点都是简单粗暴的!
数据扩充可以简单地描述为使我们的数据集更大的任何方法。例如,要创建更多图像,我们可以放大并保存结果,我们可以更改图像的亮度或旋转它。为了获得更大的声音数据集,我们可以尝试提高或降低音频样本的音调或放慢/加快速度。下图提供了示例数据增强技术。
本文要分享的就是目前最全,最新的数据增广开源项目、论文等合集。主要涉及图像、音频、自然语言处理和时序的数据增广。详细请戳链接
iPhone 12到底有多香,可能要超过你的想象。
iPhone 12系列开启预购一天多时间里,已有超160万人预约购买。这一数据已经超过去年iPhone 11系列的三天预购总和。
10月15日,京东、苏宁开启了苹果新机的预约购买。京东、苏宁两大电商平台的数据显示,截至10月16日早间11时许,在平台上的苹果产品的自营旗舰店,已合计有160万人预约购买iPhone 12系列手机,其中京东平台有超150万人预购。
截至发稿,在京东平台,iPhone 12的预约量最高,有超75.3万人;在苏宁平台,iPhone 12 Pro预购更为火热,预购人数为3.8万人,其次是iPhone 12,预购人数为3.5万人。
从预约购买热度来看,iPhone 12系列已经远远超过苹果上一个爆款iPhone 11系列。京东数据显示,iPhone11系列在2019年9月13日开始预购后近三天的时间,其预约量才超过130万。
淘宝台湾昨日(15日)发布公告,称今日11时起,陆续关闭淘宝台湾平台下单等前台功能,年底停止运营。对此,阿里巴巴15日下午在回应环球时报-环球网相关问询时表示:我们尊重克雷达投资有限公司的决定,没有评论。阿里巴巴集团在台湾市场的业务运营一切如常,我们将会一如既往地继续通过手机淘宝服务台湾市场的消费者,购买优质商品。(环球网)
据外媒LetsGoDigital报道,继三星推出 Galaxy Z Fold 2 后,华为也将推出一款经过完全地重新设计的可折叠智能手机。上个月,华为新款可折叠智能手机专利公布,它与 Galaxy Z Fold 2 有大量相似之处,例如放弃此前的外翻式折叠屏设计,转而采用书本式的内折柔性屏方案,四周边框较窄且等宽。而在手机背面,该机则采用了类似华为 P40 系列的后置矩阵式摄像头模组,外部(背面)装有一块额外的屏幕。(36氪微博)
36氪获悉,一加发布一加8T,3399元起售。一加8T搭载高通骁龙865 Plus芯片,4500毫安电池,支持65W超级闪充;机身采用了玻璃背板设计;配备四摄。
36氪获悉,苹果官方今天凌晨在演示iPhone 12性能表现时,使用了全新的《英雄联盟》手游版作为演示。苹果宣称A14 Bionic可带来主机般的体验,今年晚些时候,《英雄联盟》手游将登陆 iPhone 。
一言不合就降价——被老用户骂“割韭菜”——继续一言不合就降价。这个套路在特斯拉国产之后,无限循环。
10月1日,特斯拉官方宣布,中国制造Model 3标准续航升级版补贴后售价调整为249900元,跌破25万元的同时,续航里程还从445公里提升至468公里;此外,中国制造Model 3长续航后轮驱动版补贴后售价也降至309900元。
不到25万元的价格,比前不久拼多多喊出的“万人团价¥251800”还要低,着实惹怒了不少车主。降价不是问题,问题是不少车主表示自己在不知情的情况下,被特斯拉的销售人员催促提车。
对此,特斯拉全球副总裁陶琳回应称,特斯拉的直营模式使价格体系变得公开透明,消费者会第一时间获知价格变化信息,“我们的初心确实是希望消费者能拥有性价比更高的产品,而不是自己的利润最大化”。
随着以三星、苹果为代表的手机巨头入局,智能手表产业的第二次转折到来了。巨头手机厂商一定程度上赋予了手表以真正智能的意义,它们的入局将智能手表从小众推向了大众。
“在我们所见之处,到处都是屏幕。一种新的传播和显示技术正把书本拱到一边,并将影像,尤其是运动的影像推向文化的中心,我们正在成为屏幕之民。”
这是世界互联网教父凯文·凯利,在四年前出版的《必然》中的一句话。
时至如今,书中描述的场景已经成为现实,而时间回溯,屏幕如此之深地渗透进人们的生活,距今也不过十年而已。
智能手机已经被称为人们的第二器官,而另一块屏幕的普及则近乎宣告屏幕时代个人私域的终结——智能手表,让屏幕可以24小时与皮肤亲密接触,然后持续不断地监控并向个体输出信息。
没有人能抵挡住这一诱惑:现在,推出智能手表/手环产品,几乎变成了手机厂商的标配。在它们的宏大规划中,智能手表是构建IoT生态的重要一环。近年来,三星、苹果,以及华为、OPPO、vivo、小米等国内大厂都陆续布局了智能手表领域。而在消费者端,智能手表也已经爬上了越来越多人的手腕。
https://www.zhihu.com/question/426233230
【上海野生动物园熊伤人致 1 人死亡】17 日下午,上海野生动物园发生一起动物意外伤人事件,园区工作人员在猛兽区(车入区)实施作业时,遭受熊攻击,致使一名工作人员不幸死亡。目前,园方正在积极配合有关部门进行事件调查。
饲养员被熊分而食之,究竟是道德的扭曲还是人性的沦丧?
据相关人士爆料,该动物园中的动物病殃殃的没有生机,猛兽几乎都骨瘦如柴,口粮很大一部分靠游客投喂。
而且曾有过十年养死6只熊猫的历史,国宝都是这个待遇,更惶恐是其他动物。
你可以添加微信17775982065为好友,注明:公司+姓名,拉进 RT-Thread 官方微信交流群!
RT-Thread
让物联网终端的开发变得简单、快速,芯片的价值得到最大化发挥。Apache2.0协议,可免费在商业产品中使用,不需要公布源码,无潜在商业风险。
长按二维码,关注我们
点击阅读原文进入RT-Thread官网
你点的每个“在看”,我都认真当成了喜欢