【20210115期AI简报】EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?...

导读:本期为 AI 简报 20210115期,将为您带来 9 条相关新闻,有趣有料多闻~

本文一共 3500 字,通篇阅读结束需要 7~12 分钟

1. EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?

【20210115期AI简报】EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?..._第1张图片

这个世界上有两种极具难度的工程:第一种是把很平常的东西做到最大,例如把语言模型扩大成能够写诗写文写代码的 GPT-3;而另一种恰恰相反,是把很平常的东西做到最小。对于 NLPer 来说,这种 “小工程” 最迫在眉睫的施展对象非 BERT 莫属。

从 18 年那个 109M 参数的 BERT,到 52M 参数的蒸馏后的 DistilBERT,再到 14.5M 参数的蒸馏更多层的 TinyBERT,最后到 12M 参数的层级共享的 ALBERT,曾经那个在集群上加载参数都费劲的 BERT 现在甚至已经可以跑在手机平台上了。当我们为 BERT 的轻量化欢呼雀跃之时,有这样一群人站了出来——只是手机端可不够!

他们的理想,是让 BERT 跑在物联网设备上,跑在低功耗芯片上,跑在我们能触及的每一个电子器件上!

这样一群来自哈佛 / 塔夫茨 / HuggingFace / 康奈尔的软件和硬件极客们,此刻已披上了法袍,化身为为 BERT 极限瘦身的炼金术士,向着这个看似不可能的目标添加着许多让人意想不到的配方…

  • 论文题目:EdgeBERT: Optimizing On-Chip Inference for Multi-Task NLP

  • 论文链接:

         https://arxiv.org/pdf/2011.14203.pdf

2. 用AI「驯服」人类幼崽:这个奶爸找到了硬核带娃的乐趣

为了能安心看几集 Netflix 剧,技术宅奶爸都做了些什么……

长期以来,「奶爸」+「萌娃」一直是一个不被看好的组合,甚至有人说,「父爱如山体滑坡」。

当然,并不是所有的奶爸都这么不靠谱,也有人带起娃来挺正常的,Agustinus Nalwan 就是其中之一。

Agustinus Nalwan 是 Medium 上的一位博主,曾经从事计算机视觉、3D / 动画、游戏开发等方面的工作,目前供职于澳洲最大的汽车交易平台 carsale.com.au。

他有一个两岁半的儿子,名叫 Dexie。Dexie 非常活泼,喜欢动物,尤其是老鹰,经常学老鹰在家里飞来飞去。

于是 Nalwan 决定基于 Jetson AGX Xavier 开发一套新玩具,实现他「展翅高飞」的梦想,最不重要的是有更多时间看 Netflix 了。

新玩具名叫 Griffin(神话中的狮鹫),最终实现效果是这样的

Griffin 的四大组件:

  • 3D 游戏引擎:借助一个用 OpenGL 写成的飞行模拟器生成带有山脉、天空和 Griffin 的 3D 魔幻世界。

  • 人体姿态估计:使用 OpenPose 姿态估计模型和 SSD 目标检测模型来持续检测玩家的身体姿态,作为系统的输入,以控制 Griffin。

  • 动作映射和手势识别:将身体姿态转化为有意义的动作和手势,如抬起左 / 右翅膀、左右翻滚身体、起飞等。

  • 通信系统:使用 socket 将姿态输入送进 3D 游戏引擎。

3. YOLOv5在最新OpenVINO 2021R02版本的部署与代码演示详解

【20210115期AI简报】EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?..._第2张图片

本文从原始的三个输出层解析实现了boxes, classes, nms等关键C++代码输出,实现了纯OpenVINO+OpenCV版本的YOLOv5s模型推理的代码演示。原文拥有详细的系统环境与各个部分解释,以及代码实现与演示图像。分为以下几个步骤:

  • YOLOv5下载与测试运行

  • 模型转换,ONNX 和 IR 格式

  • OpenVINO SDK

  • 读取模型

  • 设置输入与输出格式

  • 设置输入图像数据并实现推理预测

  • 解析输出结果,实现显示输出。

4. 只需要7nm芯片1.25%的能耗,就能运行这颗超导芯片,包含冷却开销在内

【20210115期AI简报】EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?..._第3张图片

一颗7nm制程的芯片,所需能量竟然能被用来运行80个超导芯片???

没错,全球首个绝热超导微芯片MANA,现在已经问世。MANA(MonolithicAdiabatic iNtegration Architecture)超导芯片,由一种名为 (Nb)的超导金属组成。当温度低于10开尔文(-263℃)时,就会出现超导现象。

这种芯片的关键构成部分,是一种名为AQFP (绝热量子通量参变器)的节能超导数字电子结构。

AQFP结构,能处理所有计算问题,包括数据处理数据存储。而它的能耗,仅为CMOS材料及计算的几万分之一。

这种超导芯片在处理数据时,运行效率可达2.5GHz,与目前所需的计算技术相匹配。

如果进一步研发的话,处理速度还能再进一步优化。

5. ICPR 2020|大规模商品图像识别挑战赛冠军技术干货分享

【20210115期AI简报】EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?..._第4张图片

近日,国际模式识别大会(ICPR 2020)拉开帷幕,各个workshop也公布了各项挑战赛的结果,来自中国的DeepBlueAI 团队斩获了由ICPR 2020、Kaggle和JDAI等联合举办大规模商品图像识别挑战赛冠军。

【赛题介绍】

随着互联网技术和电子商务的迅猛发展,人们的购物方式逐步由传统实体店购物变为网络购物。为了充分满足客户海量、多样化的网上购物需求,人工智能零售系统需要快速地从图像和视频中自动识别出产品的存货单元(Stock Keeping Unit,SKU)级别的类别,然而,许多SKU级别的产品都是细粒度的,可以看出它们在视觉上是相似的。

JDAI构建了一个名为Products-10K[1]的产品识别数据集,这是迄今为止最大的一个产品识别数据集,其中包含了约10000种经常被中国消费者购买的产品,涵盖了时尚、3C、食品、保健、家居用品等全品类。

该赛题由JDAI和ICPR 2020、Kaggle等联合举办,要求参数者开发算法基于提供的产品图片进行细粒度分类。

【团队成绩】

DeepBlueAI团队通过数据分析,网络结构设计以及loss改进等逐步优化算法,最好的单模在Public & Private上的分数分别是0.70918/0.73618,均超过了第2名最好的成绩,并且通过模型集成的方法,取得Public & Private第一名的成绩,领先第2名两个百分点。

DeepBlueAI团队针对大规模细粒度商品图像识别任务,通过数据分析、数据增强、网络结构设计以及loss改进等设计了一个简单的细粒度图像识别算法。详情请看原文

6. 您有一条来自2020年的「个人年度总结」留言,请注意查收

【20210115期AI简报】EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?..._第5张图片

如果不知道该怎么写年底总结的,请看这条

这是一个总结指南,教你回顾2020,分析经验教训,设定新一年目标。

在每年年底做个人年度总结,给我带来了一些令人惊喜的变化:

  • 这些总结使我较好理解自己的弱点。

  • 年度总结改善了我的自我反思方式,让我能看到自己过去一年的成长,并对此欣然接受。

  • 这些总结使我对自己想要的东西变得清晰,能够帮助我做计划,将梦想变为现实。

  • 在为来年设定切实可行的目标方面,这些总结扮演着重要的角色。

在这篇文章中,我将列出一系列循序渐进的步骤,教你做自己的年度总结,这样你就可以充分利用一年中发生的所有积极的变化,将其转化为下一年的动力和养料。虽然我是以书面日记的形式记录总结,但形式很灵活,你也可以将其写在电脑或者手机里。对于那些喜欢使用电子设备的人,可以参考我的概念模板链接,在那里你可以直接登录并开始编辑。我也想概述一下我的总结回顾步骤,并讨论一下结果,希望这对那些想要研究个人年度总结、并希望以此提升自己发展路径的人有所帮助。

7. 80GB医学影像数据集!OCTA-500公开发布

【20210115期AI简报】EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?..._第6张图片 OCTA-500数据集内容汇总及组织结构

OCTA-500数据集下载地址:

https://ieee-dataport.org/open-access/octa-500

数据驱动的人工智能技术正在飞速发展,许多国际知名的数据集、样本库都成为开展科学研究、实验检测、成果推广不可缺少的重要资源,并成为学术论文的重要组成部分。

光学相干断层扫描血管造影(OCTA)是建立在光学相干断层扫描(OCT)技术上的一种崭新的成像模态,它以微米级的分辨率显示视网膜血管的三维结构,弥补了OCT无法提供血流信息的不足。由于OCTA技术起步较晚尚未完全普及,目前缺少公开的数据集供研究人员使用。

为了推进OCTA图像的处理和分析技术发展,《中国图象图形学报》编委南京理工大学陈强教授及其团队发布了目前最大的OCTA图像数据集OCTA-500。它包含500只眼睛的OCT和OCTA两种模态的三维数据,六种投影图像,四种文本标签以及两种分割标签,同时基于该数据库他们还提出了一种三维到二维分割的图像投影网络

8. 如何入门线性代数?这里有一份Python线性代数讲义

【20210115期AI简报】EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?..._第7张图片

项目地址:

https://github.com/MacroAnalyst/Linear_Algebra_With_Python

这份讲义为初学者设计,涉及线性代数的基本概念、特殊矩阵及其应用,并提供了相应代码和图示。

人工智能的基础是数学,线性代数又是其中的重要部分。然而,对于数学基础不好的人来说,「线性代数」是一门非常抽象的课程。如何学习线性代数呢?这个 GitHub 项目介绍了一份入门级线性代数课程讲义,适合大学生、程序员、数据分析师、算法交易员等,使用的代码用 Python 语言写成。

该讲义为初学者设置,不过它对略有线性代数和微积分知识的人也有帮助。学习者应具备 Python、NumPy、Matplotlib、SymPy 的基础知识(3 天的训练足够了)。

为了使大家更容易地理解代码,讲义中涉及的所有代码均以直观的方式写成,而没有选择高效或专业的代码风格。

项目作者表示:这些讲义将为学习者提供数据学习、经济计量学、数学统计学、控制论等严重依赖线性代数的学科最需要的基础知识。耐心学习完之后,你将更好地掌握线性代数的基本概念,接下来就可以学习特殊矩阵及其应用。

9. LeetCode刷题实战1:在数组上遍历出花样

算法的重要性,我就不多说了吧,想去大厂,就必须要经过基础知识和业务逻辑面试+算法面试。所以,为了提高大家的算法能力,这个公众号后续每天带大家做一道算法题,题目就从LeetCode上面选 !

废话不多说,让我们一起来看看题目吧。

Given an array of integers, return indices of the two numbers such that they add up to a specific target.

You may assume that each input would have exactly one solution, and you may not use the same element twice.

https://leetcode.com/problems/two-sum/

简单点的就是暴力破解:

1# python
2for i in range(len(array)):
3    for j in range(len(array)):
4        if array[i] + array[j] == target:
5            return [i, j]

进阶版就是使用 map, 大家可以尝试一下,要工作人员出代码的话,请在评论区留言



ART-Pi扩展板设计大赛报名了!

1.主控板由RT-Thread官方提供赞助(意思就是参赛者免费拿主控板)!

2.扩展板元器件与PCB板由立创EDA提供,基础组合:50元器件券+20元打样券(如果Demo所需券面额超过基础组合,可额外申请多面额的券);

【20210115期AI简报】EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?..._第8张图片

识别二维码,立即报名


RT-Thread


让物联网终端的开发变得简单、快速,芯片的价值得到最大化发挥。Apache2.0协议,可免费在商业产品中使用,不需要公布源码,无潜在商业风险。

长按二维码,关注我们

???????????? 点击阅读原文进入RT-Thread官网

你可能感兴趣的:(图像识别,芯片,人工智能,大数据,python)