百度手把手教你深度学习

使用飞桨快速搭建你的CV分类和检测模型

  • 免费高质量的百度深度学习课程
  • 模型库
  • 全流程开发框架 paddle X
    • 1 .分类项目
    • 2.目标检测
      • 第一步:准备好数据,导入数据
      • 第二步:参数配置
      • 第三步:训练
      • 第四步:评估
      • 第五步:模型发布
  • 感谢

免费高质量的百度深度学习课程

百度飞桨深度学习学院推出的《百度架构师手把手教深度学习》课程一共11节,内容涵盖内容如图1。无论对DL的新手或老手,感觉都能有所收获,大厂的大牛从学术及工业方面,深入浅出的讲解DL的理论知识,代码编写,paddle框架实操应用。跟随百度的两位大牛老师,孙老师和毕老师,从基础的机器学习(ML)和深度学习(DL)基础知识出发,学习Numpy数据处理、图像处理基础编程,从入门到进阶实操,老师讲得很仔细,一步一步引领,独特思考角度,对我而言,进一步理解和巩固了CV方面的基本理论知识和基础编程知识,又学习了一个DL框架,以后建模可以比较使用,增加很多模型工业部署方面的知识,觉得很有所获。
 在完成作业的时候,实操了相关的paddles相关模型及产品。AIstudio提供在线的训练算力,包括GPU和CPU(也免费的哦!),网络训练与自己电脑GPU可以同时训练不同的模型,工作学习两不误。
在实践中,进一步理清了模型的前沿研究方法,掌握使用paddle hub 工具快速、方便完成数据预处理、模型建立、模型训练、调优、模型评估的操作步骤,工业级需求及处理操作有了一个更清晰的认识。学习后,在研究中会更多的考虑一下工业级应用的特点。总体的感觉paddle 在工业级部署方面确实做得比较好,硬件的支持也很到位,后期研究会考虑一下全流程的研究(以前只做到了模型评估阶段,没有做过部署工作)。
课程链接:https://aistudio.baidu.com/aistudio/course,

百度手把手教你深度学习_第1张图片
图·1 课程界面
以下对学习的内容做一个简单的自我总结。

模型库

因为我感兴趣的是CV方向 ,对分类与目标检测方面更偏重,学习总结只谈这方面的。
以下介绍我觉得最棒的两个内容: 丰富的模型库和预训练权重文件,全流程开发框架paddle X 。
paddle提供了丰富的模型库,对于分类方面。如图2所示。详细了解:https://www.paddlepaddle.org.cn/modelbase,可以使用提供的预训练模型快速的进行项目ROC原型验证。官方开源了github的源码,可以灵活的进行使用。
百度手把手教你深度学习_第2张图片
图2 分类与检测模型库

全流程开发框架 paddle X

最喜欢的是全流程开发框架 paddle X飞桨开源深度学习框架和丰富的工具组件,PaddleX进行全流程的整合打通,为开发者提供飞桨全流程开发的最佳实践。它集飞桨核心框架、模型库、工具及组件等深度学习开发所需全部能力于一身,提供简明易懂的Python API,方便用户根据实际生产需求进行直接调用或二次开发,是提升深度学习项目开发效率的最佳辅助工具。
可以快速、方便的使用paddle X这个软件完成CV的建模、训练、评估。其中可以选用当前主流的一些模型进行训练,评估使用了当前研究主流的 precision,to1,top 5 ,mAP 技术 指标,并且绘制了训练的loss 及acc图,(感觉paper都可以直接使用了),最后还绘制了测试集的每个样本预测效果图,这个功能也非常好,能更直观的分析预测效果,进一步分析难例样本,改进模型设计。
模型官方说明文档:https://paddlex.readthedocs.io/zh_CN/latest/apis/models/index.html

图3 分类数据集格式

1 .分类项目

对于分类项目,只用准备如图3的数据结构文件夹。
百度手把手教你深度学习_第3张图片
图3 分类数据集格式
每个类的图片存放到一个子文件夹中,导入数据后,paddle X 会根据切分比例自动用子文件夹名创建一个标签文件labels.txt, 训练、验证、测试集分别创建train_list.txt,val_list.txt,test.txt文件。如图4所示。
百度手把手教你深度学习_第4张图片
图4 paddel x 自动生成数据文件

2.目标检测

目标检测通过五步可视化完成,如图5所示。
百度手把手教你深度学习_第5张图片
图5 paddle X 全流程开发五步骤

第一步:准备好数据,导入数据

如图6所示,创建一个文件夹,在里面分别创建两个子文件夹,存放图片的文件夹JPEGImages , 存放标注文件xml的文件夹Annotation( 准备好图片后,可以使用labelimg手工标注)。
百度手把手教你深度学习_第6张图片
图6 目标检测数据集格式
这里需要注意xml 文件格式。特别是difficult 值默认为0,千万不能使用unknow,这是个坑啊!
百度手把手教你深度学习_第7张图片
数据导入后,可以选择“显示标注”,可以预览所有数据图片上的标注框及类别信息,再一次直观的校验标注信息的准确性。

也可以一键方便的查看类别分布图,解检测类别是否均衡。个人觉得不写代码就可以直观分析数据太好了,DL中数据为王,数据上还是应该多花点时间分析的。
百度手把手教你深度学习_第8张图片
百度手把手教你深度学习_第9张图片

第二步:参数配置

设置学习率,选择预训练模型等。
百度手把手教你深度学习_第10张图片

第三步:训练

百度手把手教你深度学习_第11张图片

第四步:评估

百度手把手教你深度学习_第12张图片
评估时,一键可视化预测结果
百度手把手教你深度学习_第13张图片

第五步:模型发布

百度手把手教你深度学习_第14张图片
百度手把手教你深度学习_第15张图片

感谢

感谢老师和班班!谢谢您们的无私奉献和辛劳!感谢课程幕后的技术人员,我们知道,这门课程如此优秀,也有您们默默的付出,谢谢您们!
祝愿您们2020工作愉快!天天开心!心想事成!
感谢网络另一端,屏幕前的同学们,您们的支持与帮助,让我跨过了实操中的一道又一道坎,终于如期完成了作业!收获满满。
2020,fighting ,让我们一起期待更好的未来!

你可能感兴趣的:(百度手把手教你深度学习)