导读:本期为 AI 简报 2020930期,将为您带来过去一周关于 AI 新闻 9 条,其他互联网圈内新闻 5 条,希望对您有所帮助~
有更好的建议或者意见请在下方留言~
Everyone can AI的理想又近了。
席卷全国各地的猪瘟刚刚过去,为了加强防护,坐拥上数千头猪的河南养猪大户的猪场几乎开启了无人养殖的模式,这也为他带来了很多头疼的问题。
工作人员进出一次猪棚,需要消毒、检测,全副武装,对于大规模养殖来说,成本、耗时不说,更重要的风险很高,他清楚地记得一头猪感染猪瘟,导致猪棚内上百只猪死亡的画面。
在严格的控制人员进出的情况下,像“猪口普查”,“健康检查”等工作也变更难了。
现在的他可以通过AI技术,可以在家中实时监控猪棚内的状况、判断猪崽的健康状态。
不仅降低了管理的风险和成本,提高了效率,而且还避免了因其他工作人员经验不足,而对猪崽健康状况的判断失误,这也是大规模养殖普遍存在的一个痛点。
而这项AI技术就是百度的零门槛AI开发平台—EasyDL。
项目链接:https://github.com/ternaus/retinaface
那些被遗忘的竞赛项目代码、权重可能也是一笔宝藏。
很多人可能参加过许多比赛,做过许多项目,但比赛或项目结束之后,曾经写过的代码、用过的模型就被丢到了一边,甚至不久就被删掉。
这种情况并不只存在于比赛中,在学术领域同样存在。当学生训练完模型、写完论文并被学术会议接收后,该模型的 pipeline 就会被抛弃,训练数据也随之被删除。这是不是有点太可惜了?
长期参加 Kaggle 比赛的 Vladimir Iglovikov 在自己的博客中指出了这个问题,并提出了一些重新利用这些资源的建议。
为了解释这些资源资源的价值,他还专门创建了一个 GitHub 项目(retinaface)来讲述文本的建议。建议每个研究人员值得一读。
paper: https://arxiv.org/abs/2009.11528
这是一种通过直接模仿两阶段特征来训练一阶段检测器的新颖高效框架,旨在缩小一阶段和两阶段检测器之间的精度差距。在COCO上,基于ResNeXt-101可达46.1 mAP!
现代目标检测方法可分为一阶段方法和两阶段方法。由于采用简单的体系结构,一阶段检测器效率更高,但是二阶段检测器仍然在精度方面处于领先地位。尽管最近的工作试图通过模仿两阶段检测器的结构设计来改进一阶段检测器,但其精度差距仍然很大。
在本文中,我们提出了MimicDet,这是一种通过直接模仿两阶段特征来训练一阶段检测器的新颖高效框架,旨在弥合一级和两级检测器之间的精度差距。
与传统的模拟方法不同,MimicDet具有用于一阶段和两阶段检测器的共享主干,然后将其分支为两个头,这些头经过精心设计以具有兼容的模拟特征。因此,无需教师网络的预训练即可对MimicDet进行端到端训练。而且成本并没有增加太多,这使得采用大型网络作为backbone变得可行。
链接:https://github.com/NVIDIA/libcudacxx
NVIDIA 已将其 C++ 标准库 libcu++ 在 GitHub 上开源,libcu++ 去年作为 CUDA C++ 标准库被推出,属于 CUDA 10.2 的一部分。它不仅与支持 NVIDIA CUDA 的配置搭配使用,还支持与 CPU 搭配使用 。
NVIDIA 的 libcu++ fork 自 LLVM 的 libc++ 标准库。作为 CUDA C++ 标准库,libcu++ 在过去的一年里已经初具规模,并在此后不断改进,拥有了更多的功能。
作为 NVIDIA C++ 标准库,libcu++ 提供了 C++ 标准库的异构实现,可以在 CPU 和 GPU 代码之间使用。如果有使用 C++ 标准库的经验,相信很快就能上手 libcu++,首先需要在标准库 includes 的开头添加cuda/std/
,在使用 std::
之前添加cuda::
:
1#include
2cuda::std::atomic x;
以“数据驱动创新,赋能智慧城市”为主题的2020中国华录杯·数据湖算法大赛,围绕“华录数据湖+智慧城市”的核心理念,着力于智慧城市业务中的真实应用场景,结合交通、市政等行业领域数据,设置三个赛道:车道线识别赛道、吸烟打电话检测赛道、不定向算法征集赛,正火热进行中!
附上车道线检测方法:7 Papers & Radios | 华为诺亚端到端车道线检测新方法;网络表示学习综述
Google Colab 给广大的 AI 开发者提供了免费的 GPU,你可以在上面轻松地跑 Tensorflow、Pytorch 等深度学习框架。但关于 Colab 的使用技巧你又掌握了多少呢?这篇文章将介绍 20 种 Colab 使用技巧,帮你提高使用效率。
paper: https://www4.comp.polyu.edu.hk/~cslzhang/paper/PAMI_LUT.pdf
code: https://github.com/HuiZeng/Image-Adaptive-3DLUT(即将开源)
最近几年基于学习的方法已成为图像增强(增强图像的色调、对比度等)的主流方案,然而这些图像增强方法或者产生不好的效果或者需要大量的计算量以及内存占用,严重影响了这些方法在高分辨率图像方面的实际应用(比如12M像素)。
该文提出了一种图像自适应的3D查找表(3D LUT)方法用于图像增强,在具有超快速度的同时具有鲁棒的增强效果。3DLUT是传统图像编辑领域常用方案,但这些查找表往往需要人工调节并固化。该文首次提出采用成对/不成对学习的方式从标注数据集中学习3DLUT。更重要的是,所学习到的3DLUT具有图像自适应特性,可以灵活的进行图像增强。所提方法采用端到端的方式同时学习3DLUT以及一个小网络,小网络用于根据输入图像学习查找表的融合权值,将融合后的3DLUT作用于输入图像即可得到期望的输出。所提方法仅仅包含不到600K参数,能够以不超过2ms的速度处理4K分辨率图像(硬件平台:Titan RTX GPU)。在具有超快的推理速度同时,所提方法同样以极大的优势(PSNR,SSIM以及颜色差异度量指标)超越其他图像增强方法。
https://arxiv.org/abs/2009.05697
https://github.com/CoCoPIE-Pruning/CoCoPIE-ModelZoo/tree/master/YOLObile
YOLObile
比YOLOv3快7倍,同时准确率更高。在手机上实现19FPS实时高准确率目标检测,已开源。
他们的实验结果表明,当使用YOLOv4为基础模型进行优化时,他们的优化框架可以成功将原模型大小压缩小14倍,在未使用GPU-CPU协同计算优化时,将每秒检测帧数(FPS)提升至17,且达到49的准确率(mAP)。
计算机视觉Daily 正式系列整理 ECCV 2020的大盘点工作,本文为第三篇:实例分割和全景分割方向。
本文主要包含:实例分割、全景分割等方向
注意1:并不包含3D点云分割、视频目标分割,因为这些方向的论文也是超级多的,后续计算机视觉Daily会专门系统整理,还请关注后续内容。
注意2:全景分割的工作并不多
注意3:阿德莱德大学沈春华团队有两篇2D 实例分割工作
美国海关尴尬了。
2000 个一加蓝牙耳机进入美国时,美国海关误以为它们是山寨 AirPods ,立即扣押下这批货物,并公布了查获山寨 AirPods 的消息。
事情真相大白后,有媒体以「brag(吹嘘)」一词来形容这次美国海关急于表功的行为。
调侃美国海关工作不认真之余,我们也不得不反思,没能引领 TWS( True Wireless Stereo:真正无线立体声)蓝牙耳机产业风潮的中国制造业,却在高仿 AirPods 这件事上被打上了洗不掉的山寨烙印。
「把一副山寨 AirPods 放在 Apple CEO 库克面前,他未必能第一时间分辨出真伪。」一位山寨 AirPods 卖家这样「自豪」地说。
树莓派虽小,小到仅有信用卡大小,但功能却和普通电脑无异,可以将其连接电视、显示器、键盘鼠标等设备使用。也可以处理文字、电子表格、媒体甚至是游戏。那么这个神奇的小电脑,怎样用它来进行编程呢?下面介绍一篇利用树莓派进行裸机编程的教程,顺便学习一下接口、硬件等知识。
近日,有人在 GitHub 上开源了一个关于树莓派的教程。不同于以往的树莓派开发,这篇教程的核心内容是讨论如何在树莓派上进行裸机编程。
教程地址:https://github.com/bztsrc/raspi3-tutorial
9月26日,中国邮政发行《第40届全国最佳邮票评选纪念》邮票纪念张,这是中国首枚芯片邮票。《第40届全国最佳邮票评选纪念》邮票纪念张复合搭载了NFC芯片,可利用近场通信技术和手机NFC功能进行读取。(证券时报)
国际环境骤变给中国芯片业意料之外的机会,抢人战争刚刚开始。
进入2020年,许多行业在疫情活得艰难,加上移动互联网红利见顶,不少大公司已经停止了大规模招聘,甚至纷纷裁人。
形成鲜明对比的是,几乎一夜之间,芯片从冷板凳变成了热饽饽。
一片硅晶变成一颗芯片,需要经过芯片设计、芯片制造,测试封装几个环节。芯片设计环节轻资产,且在国内起步多时——华为的海思便是最著名的例子——而芯片制造国内则还处于追赶阶段。
一直以来,模拟芯片一直被来自美日欧的企业垄断,为了破冰,模拟芯片的尖端人才就显得特别贵,跳槽后工资翻数倍不足为奇。
初创公司需求更紧迫一些,“有时会为了挖到某个比较重要的职位,工资开到偏离市场的水平”,而人才的学历只是敲门砖,如果有匹配的项目经验,有的公司甚至会不惜重金“几十号人一起挖,差不多一个团队一个团队带走”。
Open AI 要变成 Closed AI 了吗?
近日,微软宣布获得了 OpenAI 开创性的 GPT-3 语言模型的独家授权。
GPT-3 是一种自动生成文本程序。Open AI 在 7 月份发布了 GPT-3,这是其不断发展的语言模型的第三次迭代,该程序及其之前的迭代已经帮助创建了一些备受关注的人工智能语言实验。GPT-3 现已成为业内同类程序中最复杂的程序,它目前还是全球最大、最先进的语言模型,其参数达到 1750 亿个。
马斯克对微软与 Open AI 的这笔交易似乎十分不满。
他在推特上批评道,“这(独家许可)看起来确实是开放的对立面。Open AI 基本上被微软‘控制’了。
报名参加请扫描图中二维码!
你可以添加微信17775982065为好友,注明:公司+姓名,拉进 RT-Thread 官方微信交流群!
RT-Thread
让物联网终端的开发变得简单、快速,芯片的价值得到最大化发挥。Apache2.0协议,可免费在商业产品中使用,不需要公布源码,无潜在商业风险。
长按二维码,关注我们
点击阅读原文进入RT-Thread官网
你点的每个“在看”,我都认真当成了喜欢