自动驾驶、泛电商、互联网金融认证等这些全球最火爆的产业成功背后的关键技术是什么?各大厂攻城狮们年薪百万的秘籍又是什么?而我们又如何能在”内卷洪流”中冲出重围,”不肝”、”不躺”,登上人生巅峰,甚至做出点改变世界的贡献?
这绝对不是一篇鸡汤水文,而是扎扎实实地为大家深入介绍当今智能视觉领域飞速发展背后的强大推手,是一项你绝对需要了解的关键技术---智能图像识别系统!!!
图1 PP-ShiTu效果示意图
你以为图像识别就是泛泛的人脸识别、物品检测吗?你以为图像识别就是目标检测、图像分类这些基础技术粗暴迭代海量数据的结果吗?大错特错!这背后是综合目标检测、图像分类、度量学习、图像检索等技术的【通用图像识别系统】!
除基础技术架构外,图像识别任务实际产业落地过程中又面临很多实际难点:
1.【算法迭代难】识别类别数以万计!像新零售这种行业,新品几乎都是按小时级别在更新!
2.【误识别误报率高】细分类差别极其细微,实际图像角度多变刁钻,亲妈都分辨不出!
3.【预测效率要求高】算法上线运行速度要求极高,在闸机前还得等3s才能过,根本不能接受嘛!!
然鹅,没有什么能够阻挡,我们聪明勤奋的开发者们对前进的向往!飞桨就推出了一个全开源、超轻量级图像识别系统PP-ShiTu!
不仅基于上述关键技术模块完整构建了”开箱即用”的图像识别系统,还完美的解决了产业落地中的重重难点!最新的版本相较于原版更是在推理速度上提升了八倍!
小编不禁发出感慨:要问图像识别哪家强,中国AI找飞桨!
那这个”看起来很厉害”的图像识别系统到底长啥样,具体咋用,是不是仅仅是”看起来很厉害”呢?下面我们就一起来看看吧!
图3 PP-ShiTu架构示意图
超轻量的主体检测
主体检测作为整个识别任务的第一步,其本身的精度、性能, 都直接影响整个识别系统的识别效果。PP-ShiTu中使用PP-PicoDet模型作为主体检测算法,PP-PicoDet模型性能和速度均达到业内SOTA的水平,为整个识别系统实现精准高效识别打下了坚实的基础。
高效的特征提取模块
图像识别的又一大问题就是如何让模型提取到更好的特征。在特征提取的训练阶段,PP-ShiTu通过使用度量学习,更好地解决高相似度物体的区分问题。不仅如此,PP-ShiTu所使用的骨干网络PP-LCNet作为业内SOTA模型,大幅度提升预测速度的同时,还提高了精度,并且可能直接支持多种应用方向和场景,真节省开发成本的一把好手!
图4 PP-ShiTu 特征提取原理示意图
快速向量检索支持
在实际应用中,海量的图像、视频特征不仅会消耗巨大的存储空间,而且检索时间极长,给图像识别的最后一公里设下路障。PP-ShiTu则是结合DeepHash和度量学习,甚至在检索库特征数量大于10万时,依然使得所需的存储空间减少32倍,检索速度提高5倍以上。除此以外PP-ShiTu使用的向量搜索模块Faiss,可以更好地适应多平台的需求(Linux, Windows, MacOs),为实际应用提供灵活选择。
这样一个高效系统使用起来却只需三步,绝对的 ”开箱即用”!
第一步通过目标检测模型,进行主体检测;
第二步对每个候选区域进行特征提取;
第三步将特征提取后的向量在检索库中进行检索,完成匹配,返回识别结果。
图5 PP-ShiTu使用流程示例
而且尤为实用的功能在于:实际上线使用的时候,遇到新的需要识别的类别,无需重新训练模型,只需要在检索库中增加该类别图像特征,就能够完成识别!
为了让开发者更深入的了解PaddleClas并手把手教大家完成图像识别系统的搭建,项目团队还精心准备了为期4天的直播课程。11月2日-5日百度高工将为我们讲解图像识别产业应用的方法和技巧,对各类痛难点解决方案进行详细拆解分析,现场还可以直接为大家进行答疑,还在等什么!赶紧扫码上车吧!
扫码报名直播课,加入技术交流群!
精彩内容抢先看!长按收藏海报~
如果您想详细了解更多飞桨的相关内容,请参阅以下文档。
官网地址:https://www.paddlepaddle.org.cnPaddleClas项目地址:GitHub: https://github.com/PaddlePaddle/PaddleClas/tree/release/2.3Gitee: https://gitee.com/paddlepaddle/PaddleClas
这么强大、用心的项目,还不赶紧给各位开发者一个的鼓励!
https://github.com/PaddlePaddle/PaddleCla
数据来源:部分图片来源于网络,侵权可删