-
使用飞桨框架开发跌倒警报APP,Paddle Lite表现亮眼! ⭐️⭐️
- 主要内容:本文旨在介绍基于飞桨框架设计一种算法感知人体活动,并依托Paddle Lite和Android Studio开发跌倒监测报警手机客户端。
- GitHub:https://github.com/tyb311/HAR
- 代码说明:https://aistudio.baidu.com/aistudio/projectdetail/1286602
- 视频说明:https://www.bilibili.com/video/BV1hg4y1v7me/
- 核心要点:
- 主流人体活动的检测方法:
- 一种是基于传感器数据的方法,通过三轴加速度计、陀螺仪等传感器采集到的随人体运动而实时变化的运动数据,再以机器学习算法对数据进行分类,判断当前用户处于哪一种运动状态
- 另外一种则是基于摄像头采集人体图像,通过大量的训练样本做图像分类,该方法需要采集海量图片,以数据驱动训练分类模型,并且由于摄像头的固定性和经济价格,常用于公共场合如学校、车站,不适合单个用户的实时跟踪监护。
-
当GAN生成图像可以卡音效,这个Python包只需几行代码就能实现「音画同步」 ⭐️⭐️
- 主要内容:通过GAN生成与音乐相配的图片,实现音画同步
- GitHub:https://github.com/mikaelalafriz/lucid-sonic-dreams
- Colab教程:https://colab.research.google.com/drive/1Y5i50xSFIuN3V4Md8TB30_GOAtts7RQD?usp=sharing
-
【大赛优秀作品分享】第十四期 | 创业组二等奖:基于交通大数据的智慧出行服务平台(云智行) ⭐️
- 主要内容:2020年NCBDC大赛决赛结束后,大赛组委会收到了行业各方对参赛优秀作品的咨询和深入了解的意向,为进一步发挥大赛作用,推广优秀团队经验成果,近期大赛组委会将对2020大赛部分获奖作品进行分享。
-
【源头活水】旋转目标检测方法解读(DCL, CVPR2021) ⭐️⭐️
- 主要内容:Densely Coded Labels (DCL)是 Circular Smooth Label (CSL)的优化版本。DCL主要从两方面进行了优化:过于厚重的预测层以及对类正方形目标检测的不友好。
- 论文:Dense Label Encoding for Boundary Discontinuity Free Rotation Detection
- GitHub:https://github.com/yangxue0827/RotationDetection
-
北京 滴滴安全部算法研究组招聘人脸识别、活体检测方向算法实习生! ⭐️⭐️
-
2021 最新CV综述分类汇总(持续更新) ⭐️⭐️⭐️⭐️⭐️
- 主要内容:CV君总结了今年至今arxiv上出现的所有综述,并放到了Github上
- GitHub:https://github.com/52CV/2021-CV-Surveys/
-
大范围行人和车辆检测,天池PANDA比赛技术解析 ⭐️⭐️
- 主要内容:52CV邀请天池大赛Top选手sloan对目前正在进行的全球人工智能大赛赛道二: PANDA大场景多对象检测跟踪比赛进行了技术解析和baseline介绍,相关的录播视频。
- 关联阅读:https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&mid=2247560662&idx=2&sn=3e268e14396f178bb35d51562f2ca217&chksm=96f19f82a1861694fe70b0bb3a4730e4a646c38b7c4a73c771e245b0a439f1919236730dc224&scene=21#wechat_redirect
- baseline:https://tianchi.aliyun.com/forum/postDetail?postId=190555
-
细粒度图像处理再下城:华为诺亚提出TNT, 深入理解图像局域细节 ⭐️⭐️
- 主要内容:纯Transformer的视觉模型通常将图像视为一系列图像片序列,而忽略了每个图像片元内部的局域相关信息。为了解决这一问题,来自华为的研究人员提出了一种新颖的Transformer-iN-Transformer (TNT) 架构,使得模型可以更好地关注局域信息,实现了较大的性能提升。
- 论文:Transformer in Transformer
- GitHub:https://github.com/huawei-noah/noah-research/tree/master/TNT
- 核心要点:研究人员基于层次的思想提出了内外两个transformer联合进行学习的新架构TNT,使得模型可以同时学习patch级别的序列特征和内部的像素级的局域细节特征。
-
首个无需锚框(Anchor-Free)的行人搜索框架 | CVPR 2021 ⭐️⭐️⭐️
- 主要内容:该工作开创性地提出了一个简洁有效的无需锚框(Anchor-Free)的行人搜索框架,其搜索精度全面超越以往基于二阶段检测器的框架,并且在保证性能的前提下达到了更快的运行速度。
- 论文:Anchor-Free Person Search
- GitHub:https://github.com/daodaofr/AlignPS
-
一个简单方法识别毛玻璃、高斯模糊 ⭐️
- 主要内容:本文主要推荐一种简单的方法识别带有毛玻璃、高斯模糊等效果的图片。
-
深度图像修复的回顾和改进:使用生成对抗网络基于Patch的图像修复 ⭐️⭐️
-
无需人脸检测和关键点定位,Facebook等提出实时3D人脸姿态估计新方法 ⭐️
- 主要内容:来自 Facebook AI 和美国圣母大学的研究者提出了一种 6 自由度的实时 3D 人脸姿态估计技术,可以不依赖人脸检测和人脸关键点定位独立运行。
- 论文:img2pose: Face Alignment and Detection via 6DoF, Face Pose Estimation
- GitHub:https://github.com/vitoralbiero/img2pos
-
刷爆AI圈!基于Transformer的DALL-E代码刚刚开源了 ⭐️⭐️
- 主要内容:OpenAI在1月5日公布DALL-E模型以来,人们都惊艳于模型的语言想象力是如此丰富和细致,主要是一种文本-图像生成方法。
- 论文:Zero-Shot Text-to-Image Generation
- Blog :https://openai.com/blog/dall-e/
- GItHub:https://github.com/openai/DALL-E
-
CVPR 2021 论文/代码分类汇总!持续更新中! ⭐️⭐️⭐️⭐️
- 主要内容:CV君在Github建了一个仓库,对已经出来的论文(目前是340多篇)进行了按类别汇总。对于Oral或有公布代码的论文也链接了代码,方便大家查找。
- GitHub:https://github.com/52CV/CVPR-2021-Papers
-
太强了,头发丝完整保留!一个开源的 Python 实时视频抠图工具 ⭐️⭐️
- 主要内容:一种实时、高分辨率的背景替换技术,保留头发细节,效果惊人。
- GitHub:https://github.com/PeterL1n/BackgroundMattingV2
-
一图抵千言 | 神经网络绘图篇!涵盖NN-SVG、PlotNeuralNet、Netron等软件! ⭐️⭐️⭐️⭐️
- 主要内容:神经网络的可视化工具和绘图软件,写论文可以参考使用。