github链接。作者复现的SSD算法,该项目很容易上手,通过修改一些参数就可以很快获得一个性能优异的检测模型。
github链接。飞桨推出的PaddleDetection是端到端目标检测开发套件,旨在帮助开发者更快更好地完成检测模型的训练、精度速度优化到部署全流程。PaddleDetection以模块化的设计实现了多种主流目标检测算法,并且提供了丰富的数据增强、网络组件、损失函数等模块,集成了模型压缩和跨平台高性能部署能力。目前基于PaddleDetection已经完成落地的项目涉及工业质检、遥感图像检测、无人巡检等多个领域。
github链接。MMDetection是一个基于PyTorch的开源对象检测工具箱。
github链接。MediaPipe是研究人员和开发人员为移动、桌面/云、web和物联网设备构建世界级ML解决方案和应用程序的最简单方法。该项目具体包含多个性能优异的算法,具体包括人脸检测、人脸网格化、手部关键点检测和跟踪、头发分割、目标跟踪、3D目标检测和模板匹配等任务。
github链接。pytracking是一个基于PyTorch的视频对象跟踪和分割通用python框架。当前支持PrDiMP、DiMP、ATOM、ECO等多个性能优异的目标跟踪方法。
github链接。PySOT是由SenseTime视频智能研究团队设计的软件系统。它实现了最先进的单目标跟踪算法,包括SiamRPN和SiamMask。它是用Python编写的,由PyTorch深度学习框架提供支持。该项目还包含一个用于评估跟踪程序的工具箱的Python端口。pysot中已经包含了SiamRPN、DaSiamRPN、SiamRPN++和SiamMask等多个性能优异的跟踪算法。
github链接。SiamMask算法可以同时完成视频中目标的跟踪和分割任务,具有较好的效果。
github链接。该算法是在SiamMask算法的基础上增加了旋转矩形框,从而进一步提升了SiamMask算法的精度。
github链接。AlphaVideo是一个基于Pythorch的开源视频理解工具箱,涵盖多目标跟踪和动作检测。在AlphaVideo中,我们发布了第一个单级多目标跟踪(MOT)系统TubeTK,在MOT-16和MOT-17上分别达到66.9mota和63 MOTA。对于动作检测,我们发布了一个高效的模型AlphAction,这是第一个在AVA数据集上实现单模型30+mAP(32.4map)的开源项目。
github链接。 检测和跟踪算法汇总。
github链接。Faiss是一个高效的相似性搜索和密集向量聚类库。它包含的算法可以搜索任意大小的向量集,最多可以搜索不适合RAM的向量集。它还包含用于计算和参数调整的支持代码。Faiss用C++编写,带有Python/NuMPy的完整包装。一些最有用的算法是在GPU上实现的。它是由Facebook人工智能研究开发的。
github链接。Hierarchical Navigable Small World Graph for fast ANN search
github链接。PaddleSeg是基于PaddlePaddle开发的端到端图像分割开发套件,覆盖了DeepLabv3+, U-Net, ICNet, PSPNet, HRNet, Fast-SCNN等主流分割网络。通过模块化的设计,以配置化方式驱动模型组合,帮助开发者更便捷地完成从训练到部署的全流程图像分割应用。它的核心优势是使用起来特别简单,能够快速帮你完成模型的训练和部署,大力推荐。
github链接。PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。
github链接-论文。DB是一个性能优异的文本检测算法,该算法的核心优势是速度比较快,可以结合CRNN等多种文本识别算法使用。
github链接。tr是一款针对扫描文档的离线文本识别SDK,核心代码全部采用C++开发,并提供Python接口。
github链接。charnet是一个文本检测和识别算法,该算法可以同时完成文本的检测和文本的识别。比较遗憾的是只有测试代码。没有训练代码。另外,该算法的运行速度比较慢。
github链接。PortraitNet是一个人像抠图算法,它是一种在移动设备上高效运行的实时人像分割模型,称为人像网。肖像网是基于一个轻量级的U形架构,在训练阶段有两个辅助损失,而肖像推理在测试阶段不需要额外的成本。
github链接。 TVM是用于深度学习系统的编译器堆栈。它旨在缩小以生产率为中心的深度学习框架与以性能和效率为中心的硬件后端之间的差距。TVM与深度学习框架一起工作,为不同的后端提供端到端的编译。
github链接。Glow是一个用于硬件加速器的机器学习编译器和执行引擎。它被设计成用作高级机器学习框架的后端。编译器的设计允许最先进的编译器优化和神经网络图的代码生成。
github链接。Tengine由开放人工智能实验室开发,是开放人工智能实验室推出的面向人工智能场景的人工智能应用开发平台,致力于解决人工智能产业链的碎片化问题,加速人工智能产业化的落地。Tengine是专门为AIoT场景设计的,它具有跨平台、异构调度、芯片底层加速、超轻量化和独立性、完整的开发部署工具链等特点。Tengine兼容多种操作系统和深度学习算法框架,简化和加速了面向场景的人工智能算法在嵌入式边缘设备上的快速迁移,以及实际应用部署。
github链接。OpenPose代表了第一个在单个图像上联合检测人体、手、面部和脚关键点(总共135个关键点)的实时多人系统。该算法的优点是精度比较高,使用起来比较简单;缺点是速度比较慢,并不能直接应用到一些嵌入式设备中。
github链接-论文。PPN是一个快速、实时的人体位姿识别算法,该算法的核心优势是经过优化后可以实时的运行在嵌入式设备中,缺点是精度比较低,需要进行特定的优化。
github链接-论文。该算法是针对openpose算法的速度二提出来的改进算法,该算法使用MobileNet代替原始的ResNet基准网络,在Core i7-6850K CPU上面获得26fps的运行速度,接近实时。
github链接。openalpr是一个开源的C++自动识别板库,用C++语言编写,用C语言编写,javaNode.js节点,Go和Python。图书馆分析图像和视频流以识别车牌。输出是任何车牌字符的文本表示。
github链接。Mobile-LPR 是一个面向移动端的准商业级车牌识别库,以NCNN作为推理后端,使用DNN作为算法核心,支持多种车牌检测算法,支持车牌识别和车牌颜色识别。
github链接。飞桨图像分类套件PaddleClas是飞桨为工业界和学术界所准备的一个图像分类任务的工具集,助力使用者训练出更好的视觉模型和应用落地。
github链接。PRNet是一个基于位置图回归网络的三维人脸重建与密集对齐算法。
github链接。MediaPipe是研究人员和开发人员为移动、桌面/云、web和物联网设备构建世界级ML解决方案和应用程序的最简单方法。该项目具体包含多个性能优异的算法,具体包括人脸检测、人脸网格化、手部关键点检测和跟踪、头发分割、目标跟踪、3D目标检测和模板匹配等任务。
github链接。这个repo是联合检测和嵌入(JDE)模型的一个代码库。JDE是一种快速、高性能的多目标跟踪器,它在共享神经网络中同时学习目标检测任务和外观嵌入任务。技术细节在我们的arXiv预印本中有描述。通过使用此回购协议,您可以简单地在MOT-16 challenge的“私有”协议上实现MOTA 64%+,并以22~38 FPS的近乎实时速度(请注意,此速度适用于整个系统,包括检测步骤!)。
github链接。CenterTrack是一个多目标跟踪算法,该算法将目标跟踪转换为点跟踪问题,使用CenterNet作为目标检测器,使用贪婪匹配算法来进行目标关联,取得了较大的性能提升。
github链接-论文链接。FairMOT是一个简单的one-shot多目标跟踪算法,该算法使用一个网络同时完成了 目标检测和REID任务。论文使用Anchor-free的目标检测算法,重点解决了基于Anchor-based所带来的中心坐标点不对齐大的问题。
github链接。这是CVPR2020会议上提出的一个人像抠图算法,该算法具有很惊艳的分割效果,值得仔细研究和学习。
github链接。OpenPCDet是一个基于LiDAR的3D场景感知的开源项目。目前主要由OpenPCDet工具箱组成,用于点云三维目标检测。OpenPCDet是一个通用的基于PyTorch的点云三维物体检测代码库。它目前支持多种最先进的3D对象检测方法,单阶段和双阶段3D检测框架都有高度重构的代码。
[1] 该博客是本人原创博客,如果您对该博客感兴趣,想要转载该博客,请与我联系(qq邮箱:[email protected]),我会在第一时间回复大家,谢谢大家的关注.
[2] 由于个人能力有限,该博客可能存在很多的问题,希望大家能够提出改进意见。
[3] 如果您在阅读本博客时遇到不理解的地方,希望您可以联系我,我会及时的回复您,和您交流想法和意见,谢谢。
[4] 本人业余时间承接各种本科毕设设计和各种小项目,包括图像处理(数据挖掘、机器学习、深度学习等)、matlab仿真、python算法及仿真等,有需要的请加QQ:1575262785详聊,备注“项目”!!!