小小甜菜百度AI爬坑记

小小甜菜百度AI爬坑记

作为国内较好的深度学习平台,我是在2018百度开发者大会拉入坑的。其可分为语音识别,语音合成,文字识别,图像识别,人体分析,人脸识别,理解与互交技术,AR增强现实等多个方向。我主要研究了其下的人脸识别,人机交互,图像识别。百度AI平台有开发难度低,种类完善等优点,但受限较大,只适合于入门或开发周期短的项目。

  • 项目平台(只是接口调用,不涉及AI开发)
  • 人脸识别
    因离线模式实际效果一般,我选择了在线人脸识别。通过认证后百度提供了开发例程SDK,拥有一定java开发能力的人都能开发。附件中有我的单人人脸识别和多人人脸识别的安装包,我集成了语音合成,安装即可体验效果。工程文件需要授权验证,附件中的工程无法正常运行,只能作为参考,有需求的可以去官网认证开发者后申请授权,通过简单修改就能跑我的工程。
  • DourOS
    附件中有工程和APK安装包,可直接运行,主要有以下功能:
    语音识别:通过麦克风录音可以识别人说的话并转为文字,在线离线皆可
    语音合成:可以将文字转为可以播放的音频文件,在线离线皆可,可方便集成到其它项目中
    人机互交:通过语义分析和关键词提取,智能作出判断。目前只基于在线模式。
    关键词唤醒:通过训练关键词语音,可在低功耗待机状态下通过语音开机,离线模式
  • Easydl
    附件工程是离线版,用于识别黄色安全帽,由于绑定硬件,APK安装后是无法使用的,仅做参考。
    小小甜菜百度AI爬坑记_第1张图片
    如图所示,是我现场拍照的20张照片作为数据集生成的模型的实际效果,支持本地和在线两种模式。Easydl也有定制语音识别的内容,不过本地部署还没上线,目前只有在线识别。
    Easydl,是自己寻找数据集,打标签后生成SDK,优点在于开发简单,无需安装平台,模型训练免费使用百度服务器。缺点在于模型不开放,需申请激活码且与硬件,包名绑定,很难集合到实际项目中。
  • 百度AI studio
    中国人自己的深度学习平台,有大量学习视频,在线编程平台也非常方便。不过由于社区不是特别完善,全球影响力较低。对新手非常友好,强力推荐,高手可以无视。
    github开源代码
    基于paddle框架下的百度AI平台,不得不说在线式平台真心好评(想想之前苦哈哈装环境,训练时各种担心笔记本吃不消重启)。但是不得不吐槽优质项目真心太少了,AI studio教学介绍了平台的使用。

小结

百度AI入门门槛很低,功能种类丰富,但是由于开源不彻底,实际项目中受到很多制约。实际开发过程中并不涉及多少深度学习内容,只适合急需项目和入门初学者。AI studio非常适合初学者学习,提供大量教学视频和丰富案例,不过由于才建立不久,有一定不足之处,不太适合企业级开发。

你可能感兴趣的:(百度AI)