基于EasyDL搭建音频在线实时分类系统

文章目录

    • 搭建音频在线实时分类系统
      • 1. easydl 训练音频分类模型
        • 1.1 上传数据并训练音频分类模型
        • 1.2 发布训练好的模型
      • 2. 前端部署

搭建音频在线实时分类系统

本人基于自我学习目的搭建了生猪音频实时分类系统,使用百度 EasyDL 零门槛AI开发平台训练音频分类模型,然后发布为公有云在线服务;之后使用 javascript + axios + wavesurfer 搭建前端展示界面用来展示实时分类的效果。

1. easydl 训练音频分类模型

1.1 上传数据并训练音频分类模型

    1. 打开 easydl 官网:https://ai.baidu.com/easydl,点击立即使用,选择模型类型为声音分类。
      基于EasyDL搭建音频在线实时分类系统_第1张图片
    1. 进入声音分类界面后,点击模型中心的创建模型,填写需要创建的相关信息。

基于EasyDL搭建音频在线实时分类系统_第2张图片

    1. 在 EasyData 数据服务中的数据总览中点击创建数据集,并给定数据集名称。

基于EasyDL搭建音频在线实时分类系统_第3张图片

    1. 在数据总览中该数据集中点击导入按钮导入数据集,并按照要求导入有标注信息的压缩包数据。

基于EasyDL搭建音频在线实时分类系统_第4张图片

    1. 数据要求:以文件夹命名分类,一个文件夹下就是一类数据,文件夹名就是该类别名,其中单个音频文件时长需要超过1秒。
      例如:文件夹1命名为的 pig_eat 其中文件全为猪吃食叫声,文件夹2命名为的 pig_howl 其中文件全为猪嚎叫声。

基于EasyDL搭建音频在线实时分类系统_第5张图片

    1. 查看数据是否导入成功并识别出有标记信息,未标记成功的数据可以在线进行重新标注。

基于EasyDL搭建音频在线实时分类系统_第6张图片

    1. 点击模型中心的训练模型,选择刚刚创建的模型和数据集,训练方式选择公有云部署。然后点击开始训练进行模型训练。

基于EasyDL搭建音频在线实时分类系统_第7张图片

    1. 在模型中心的我的模型中可以看到训练的结果。

在这里插入图片描述

1.2 发布训练好的模型

    1. 点击公有云在线服务,选择发布新服务,填写api地址,将刚刚训练好的模型进行发布。
    1. 进入网址 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/app/list 中创建应用。
    1. 进入网址 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/overview/index 配置公有云部署相关参数。
    1. 参考文档 声音分类模型如何发布为API,声音分类API调用文档,token鉴权认证机制

2. 前端部署

  1. 下载代码 https://gitee.com/qiaoyukeji/pigAuido_reco_show

  2. 替换API Key等后浏览器访问以下链接
    注意:将 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/app/list 中的 API Key 和 Secret Key填入下面的client_id 和client_secret后面

https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=ABC&client_secret=ABC

基于EasyDL搭建音频在线实时分类系统_第8张图片

  1. 将上图 access_token 的一串数字填入替换 index.js 中第52行的access_token处即可。

  2. 前端界面展示

基于EasyDL搭建音频在线实时分类系统_第9张图片


本文首发于本人博客:https://blog.gitnote.cn/post/pigAuido_reco_show/

版权信息: CC BY-NC-SA 4.0 (自由转载-非商用-相同方式共享-保持署名)

你可能感兴趣的:(javascript,音视频,分类,算法)