PaddlePaddle学习历程记录分享

1、遇见

21年3月份某天刷到夕小瑶的卖萌屋公众号,关于李宏毅老师机器学习课程的介绍,有百度飞桨教师的全程作业指导和带打比赛,然后进去详细看了课程相关的介绍,感觉发现了宝藏,里面课程应有尽有,首先学习李宏毅老师的课程,非常精彩,基本上每天都会登陆飞桨官网进行打卡学习李宏毅课程-机器学习

2、决定

后面也在3月份加入了一家新的单位,入职后,做NLP相关的工作,同组小伙伴交流,想统一大家的深度学习框架,方便组内交流,之前用的TensorFlow,小伙伴们调研后觉得PaddlePaddle不错,原因如下,1、对于中文的预料数据,百度有天然的优势,PaddlePaddle训练出来的模型能更好的适用于中文。2、学习资料丰富,第一手资料都是中文,使用起来非常友好。3、宣传和服务非常到位,有各种打卡训练营陪跑活动,有专属答疑QQ群和微信群,本土社区交流活跃,遇到问题反馈后,能及时解决。然后开始了深入学习和使用PaddlePaddle之旅。

3、具体学习

3.1、学习PaddeHub

PaddlePaddle学习历程记录分享_第1张图片

第一阶段主要学习PaddleHub,这里面的模型都是现成的,一键即可调用,当时把PaddleHub里面所有的模型,都在本地进行了运行调试,看模型的实际运行效果,做技术储备和积累,很多模型开箱即用,非常方便,这时候对PaddlePaddle框架的模型整体上有了感性的认识。
这期间遇到一个难题,就是用simnet_bow想做一个类似搜索引擎的方案,发现传入具体数据后非常慢,然后去技术QQ群吐槽了句,觉得PaddleHub这种方案,演示做些demo还行,具体落地还是不行的,然后这时候陈泽裕老师在群里回了句,可以参考我们的语义索引模型https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/semantic_indexing,这时候参考后,感觉发现了新大陆,尝试后发现,效果果然比之前的好很多,也引出了第二阶段的学习。

3.2、学习PaddeNLP的examples

PaddlePaddle学习历程记录分享_第2张图片

第二阶段主要学习PaddeNLP的examples,这里面涵盖了NLP邻域的所有基础任务和应用任务,能发现这个repo简直太赚了。
第一步,按照官方的文档介绍,把每个案例都放在Aistudio上运行起来,这时候只要能训练起来,心理就有底了,这个案例是没问题的,后面是可以直接用的。
第二步,把案例下载到本地,用pycharm运行代码,进入debug模型,一行代码一代码的分析和调试,把源码读懂,这时候心理的底气就很足了,可以改变数据集,变成自己的的本地数据集进行训练和调试,此时这个案例变成了自己的技术积累,对PaddleNLP的整体架构也有了深入的理解。
谈到上面的语义索引做搜索引擎,当时也搭起来了,但是数据索引和模型服务都是在本地,本质上还是个单机版,达不到真正的产业化落地,前期的演示是可以应付了,然后开始调研真正的产业化服务化的部署落地方案,这时候自然引出了下面的学习。

3.3、学习PaddeNLP的applications

PaddlePaddle学习历程记录分享_第3张图片

第三阶段主要学习PaddeNLP的applications,这里面涵盖了NLP真正产业化落地的场景方案,有产业化的第三方数据引擎的引入,有模型服务化部署的案例介绍,参考这里的案例后,引入了其他组件的深入学习,比如PaddleServing,Milvus,阅读相关的文档,搭建起来真正落地的分布式集群系统,在这过程,PaddleNLP的硕硕老师,组件了一个专属答疑群,对真正产业化的落地帮助非常大,在老师们的帮助下,我这边也顺利的用PaddleNLP的语义索引架构,搭建起了好几个应用场景的分布式集群服务。在此表示感谢,国产化科技自强的道路,他们功不可没。

3.4、产业化落地学习

第四阶段,不同领域的交互式学习,产业化落地学习。
1、各种产业化落地的直播课录播课全看
2、图像相关全学:OCR识别PaddleOCR、图像分类PaddleClas、目标检测PaddleDetection、图像分割/PaddleSeg、视频识别PaddleVideo
3、语音相关全学:PaddleSpeech
4、参加AICA课程学习,和投身于AI产业化落地的大佬们一同前行,经世致用、融会贯通。执桨破浪、创新者来。
PaddlePaddle学习历程记录分享_第4张图片

4、总结

能为国家的智能化建设贡献力量,能为国产科技的自强和产业化落地贡献力量,是非常激动人心也是非常有价值和意义的事情,对国产非常优秀的开源框架PaddlePaddle一如既往的支持下去,同时也需要熟练掌握目前走在前面的TensorFlow和PyTorch框架,借鉴和吸收他们的优势,融入到国产框架,博采众长!

你可能感兴趣的:(PaddlePaddle,笔记,阅读时光,paddlepaddle,学习,机器学习)