【20201225期AI简报】YolactEdge:边缘设备上的实时实例分割,已开源!

导读:本期为 AI 简报 20201225 期,将为您带来 6 条相关新闻,有趣有料无水文~

本文一共 1200 字,通篇阅读结束需要 3~5 分钟

1. 170 FPS!YolactEdge:边缘设备上的实时实例分割,已开源!

【20201225期AI简报】YolactEdge:边缘设备上的实时实例分割,已开源!_第1张图片

Paper: https://arxiv.org/abs/2012.12259
Github: https://github.com/haotian-liu/yolact_edge

本文提出了YolactEdge实时实例分割方法,可以在小型边缘设备上以实时速度运行。具体来说,在550x550分辨率的图像上,带有ResNet-101主干的YolactEdge在Jetson AGX Xavier上的运行速度高达30.8FPS(在RTX 2080Ti上的运行速度为172.7FPS)。为了实现这一目标,我们对基于图像的最新实时方法YOLACT进行了两项改进:

1)优化TensorRT,同时谨慎权衡速度和准确性;

2)利用视频中时间冗余的新型特征扭曲模块。

在YouTube VIS和MS COCO数据集上进行的实验表明,与现有的实时方法相比,YolactEdge的速度提高了3-5倍,同时具有极好的mask和box检测精度。

2. 谷歌发布 MediaPipe Holistic,实现移动端同时进行人脸、手部和人体关键点检测跟踪

Github:https://github.com/google/mediapipe

原文链接:

https://ai.googleblog.com/2020/12/mediapipe-holistic-simultaneous-face.html

谷歌MediaPipe Holistic为突破性的 540 多个关键点(33 个姿势、21 个手和468 个人脸关键点)提供了统一的拓扑结构,并在移动设备上实现了近乎实时的性能。

谷歌之前发布的 MediaPipe 就是一个专门为GPU或CPU而设计的开源框架,已经为这些单个任务提供了快速、准确而又独立的解决方案。

但将它们实时组合成一个语义一致的端到端解决方案,仍是一个难题,需要多个依赖性神经网络的同步推理。

不久前,谷歌发布了 MediaPipe Holistic,就是针对上述挑战而提出一个解决方案,提出一个最新最先进的人体姿势拓扑结构,可以解锁新的应用。

3. 树莓派与深度学习:目标检测

原文地址:https://zhuanlan.zhihu.com/p/110290326

作者之前已经是实现了树莓派4B上的深度学习环境搭建和测试,

https://zhuanlan.zhihu.com/p/110013867

这一篇是在树莓派上运行深度学习目标检测模型进行推理的效果,

主要是基于TensorFlow目标检测API,

并从该项目的一个子页面下载训练好的模型和权重,

直接进行目标检测的推理过程。

步骤如下:

  1. 下载安装TensorFlow目标检测API

  2. 配置环境

  3. 下载模型

  4. 运行

4. Docker 从入门到干活,看这一篇足矣

【20201225期AI简报】YolactEdge:边缘设备上的实时实例分割,已开源!_第2张图片

本文来自:cnblogs.com/clsn/p/8410309.html

Docker作为一个非常好的环境隔离神器,在机器学习圈也越来越火了。那么,Docker是什么,怎么用,相信大家看完本文,会对它有一个比较全面的认识

分别从以下几个方面来介绍:

  1. 容器简介

  2. 什么是 Docker

  3. 安装 Docker

  4. Docker镜像相关操作

  5. 容器的日常管理

5. 亚马逊李沐团队提出:(开源) 行为识别的全面调研 2014-2020

【20201225期AI简报】YolactEdge:边缘设备上的实时实例分割,已开源!_第3张图片

30页行为识别综述,共计283篇参考文献!Amusi 认为这是目前2020年看到的关于行为识别(视频理解)最好且最全面的综述。

本文对基于深度学习的视频行为识别(Video Action Recognition)论文进行了全面调研,按时间顺序详细介绍并盘点出重要工作,还统计出了17个视频行为识别数据集,最后还复现了大量优秀工作的代码,现已开源!

6. AWS与NVIDIA合作伙伴通过嵌入式AI简化构建应用程序

最近,NVIDIA与亚马逊网络服务(AWS)通过在AWS Marketplace中提供NVIDIA店面,宣布了一项合作伙伴关系,旨在简化将AI功能嵌入应用程序的过程。总计,NVIDIA将免费提供21种软件工具,以帮助使用AWS的开发人员构建GPU加速的AI应用程序。这将在医疗保健,金融,零售,智慧城市等多个领域引起广泛关注。

自2017年以来,NVIDIA一直通过其NVIDIA GPU优化云(NGC)目录以及AWS Marketplace上的一些单独组件提供了GPU加速软件。但是,这是Nvidia的整个产品组合首次进入AWS Marketplace。NGC目录将NVIDIA的GPU加速软件工具集中在一起。它包含数百个机器学习(ML)框架和行业特定的软件开发套件,数据科学家和开发人员可以使用它们来构建AI解决方案。

NVIDIA声称250,000名用户已经从NGC目录中下载了超过100万个AI容器,预训练的模型,应用程序框架,Helm图表和其他ML资源。

你可以添加微信17775982065为好友,注明:公司+姓名,拉进RT-Thread 官方微信交流群!

 点击阅读原文进入官网

你可能感兴趣的:(人工智能,深度学习,机器学习,计算机视觉,神经网络)