小公司接触图像识别五个月的感想

接触图像识别五个月的感想

第一阶段

  • 熟练使用nvidia tx2(周期一个半月)
    1. 在这40多天里,首先对盒子进行了刷机以及安装必要的环境,记得大概刷了四五次机,各种问题层出不穷,也是因为自己对arm系统不是很熟悉导致。
    2. 在安装过程中,了解了dlib以及opencv视觉库,还有一些计算机视觉必须的库,包括qt,cmake等等。
    3. 玩nvidia tx2最主要的就是它有nvidia自带的一些demo。包括物体检测,图片识别等,需要使用cuda与cudnn进行gpu加速。

第二阶段

  • 人脸识别开发(8月20日–至今)
    1. 首先接触的是opencv库,写了一个人脸检测的demo,用的opencv自带的人脸检测分类器。
    2. 通过opencv了解了一下图像处理的一些基本方法。
    3. 接触python封装好的人脸识别库–face_recognition,人脸检测这块用的是dlib的landmark68还有一个五个特征点的分类器。人脸识别是用的欧式距离计算的,越低越严格。在实际的测试开发过程中,不符合实际商业场景的要求。
    4. 开始接触mtcnn+facenet,mtcnn作为人脸检测的模型来说性能很好,通过它的p-r-o三级筛选的出的人脸框可以商用。facenet提出的三元损失对后续许多深度学习模型的建立有很大的影响。
    5. 借助10w老人库来进行迁移训练,起初对2018年512D的模型进行训练和2017年的128D的预训练模型训练发现2017的模型更好,分析的原因在于老人的脸部特征区别不大以及真实环境噪声过大的导致的。最后专注2017模型迁移训练达到了可以供老人使用的商业的人脸识别模型。

第三阶段

  • 接下来的计划(后面半年)
    • tensorflow熟悉掌握。
    • 图像处理的一些基本算法的掌握,即对opencv库的熟练使用和算法概念的理解。
    • 吴恩达深度学习课程学完。
    • 李飞飞CS231n课程的学习。
    • 线代,高数,概率论的补强,一些常用的验证指标方法。

沉淀自己,未来可期

你可能感兴趣的:(图像处理)