离线语音茶吧机设计应用案例

1 概述¶

随着人们生活水平的提高,都追求舒适的体验感,特别是对操控性的要求越来越高。目前带功能的茶吧机产品的控制方式有以下几类:

  • 按键控制:传统控制方式,每次要走到茶吧机边才行,操作麻烦;
  • 遥控控制:采用红外遥控或者蓝牙遥控,方便远距离控制,但遥控器容易丢,放置也麻烦。且遥控器上按键较少,当茶吧机功能多的时候无法用单次按键控制全部的功能,组合按键不符合人们使用习惯;
  • 手机APP控制:每次控制需要打开手机APP,需要联网,同时需配网,操作繁琐;
  • 智能音箱控制:通过如天猫精灵等智能音箱直接控制,相对方便,但音箱需联网状态下才可使用,识别时有隐私安全问题,网络延时大时控制的实时性不好。

离线语音茶吧机设计应用案例_第1张图片

为了解决以上痛点,可以采用纯离线语音识别进行控制,在成本增加不大的情况下,为产品带来更多的亮点和竞争力。启英泰伦针对该产品领域,已开发了整套离线语音茶吧机方案,下面对该方案进行介绍。


2 方案优势¶

启英泰伦离线语音茶吧机相对传统茶吧机方案,可让用户通过语音控制茶吧机设备,替换传统遥控器或按钮控制的方式,该方案有以下优势:

  • 可以直接使用语音控制茶吧机,且无需联网,自然方便,识别率可达95%以上;
  • 语音控制响应快,一般在0.2~0.8s内完成;
  • 可远场识别,安静情况下可达10米;
  • 方案功耗低,工作功耗仅为0.2W左右;
  • 可靠性好,芯片方案已通过双85测试,满足格力、美的等家电巨头要求;
  • 整套产品技术已成熟,具有完整的软件、硬件、结构设计方案,节省开发周期,降低开发难度;
  • 配合我司语音AI平台开发,可灵活定制唤醒词和命令词,不需要再专门收集语料训练。

离线语音茶吧机设计应用案例_第2张图片


3 应用描述¶

启英泰伦离线语音茶吧机方案适用于各类需控制的茶吧机。 语音茶吧机产品的使用场景为普通家居环境,在安静和中低噪音下可以达到良好的识别率。其中安静环境的环境底噪在35dB ~ 45dB之间,属于中低噪音环境;开启茶吧机后环境噪音可达45dB ~ 65dB之间。该噪音环境下可以直接选用我司单麦克风语音模块,如CI-B0XGS01S或CI-B0XGS01S-H模块,以达到比较好的性价比。

特别注意,不同的茶吧机运行过程中,因为齿轮位置、进出水口等差异,运行产生的噪声大小也有不小的差异,为了达到最好的语音识别效果,在设计茶吧机整机结构时,因注意控制麦克风噪音小于65dB、具体参照下面结麦克风结构设计。


4 产品设计流程¶

一个基于我司芯片的标准语音产品设计流程如下图所示:

离线语音茶吧机设计应用案例_第3张图片

该流程主要针对我司新用户开发产品使用,包含了前期购买样品Demo进行验证,硬件选型,语音对话逻辑、软硬件方案和结构设计,设计完成后的测试,以及生产测试准备和后续批量采购等步骤。如果是已经熟悉我司方案的老用户,可以直接从中间步骤开始,不用再重复进行Demo测试等工作。

下面针对新用户的开发,对上述流程中的各个步骤逐一描述。

4.1 DEMO测试¶

针对新用户,可以先从我司授权的经销商或直接从我司官网 ☞样品购买 处购买对应的模块或开发板套件,进行识别效果测试,相关的软硬件技术文档可以从本文档中心处获取。用户测试满意后,可以进行硬件选型。

4.2 选型指南¶

用户硬件选型可以直接参考 ☞硬件选型 ,如果用户想快速产品化,推荐直接使用我司已设计好的标准模块;如果现有标准模块无法满足产品的结构需求,也可以选用合适的芯片进行硬件板的设计。

4.3 方案设计¶

选择好合适的芯片或模块后,可根据产品的功能进行下述设计:

  • 语音UI(唤醒词和命令词)设计:设计方法可参考 ☞语音UI设计参考;
  • 硬件设计:设计方法可参考 ☞硬件设计参考;
  • 结构设计:设计方法可参考 ☞产品结构设计;
  • 软件开发:设计方法可参考 ☞软件开发。

如用户为首次进行语音方案开发,建议到 ☞启英泰伦语音AI平台 上获取基于相关芯片的语音产品方案设计Checklist文档,进行逐一检查以确保设计效果。如有技术支持需求请联系我司技术支持人员。

4.4 测试验收¶

产品方案设计完成形成样品后,建议对该样品进行相关的识别测试,相关测试方法和标准可参考 ☞识别效果测试。同时,还建议根据产品质量的要求进行各类硬件测试,静电测试、防水测试等。为了保证最终的识别效果,还建议进行硬件底噪的测试及产品装机后的整机功能测试。

4.5 生产测试¶

样机测试完成后,会转入后续产线批量生产阶段。我司为产品的批量生产做了完善的解决方案,用户可以参考 ☞生产测试 获取更多信息。用户如需要生产测试的相关技术支持,请联系我司技术人员。

4.6 下单采购¶

用户如果要采购我司产品,请点击 ☞样品和批量采购 获取更多信息。


5 茶吧机设计方案介绍¶

5.1 方案特点¶

用户可以用我司的芯片设计语音控制板,和原产品的电控板通过串口进行通讯,可以实现语音茶吧机的产品设计。该方式开发相对简单,可以快速对接完成产品,但成本略高,适用于需快速出产品的的方案或者第一次接触语音识别的方案。

该方案的设计框图如下,语音模块与电控模块需要4根线的串口连接,语音模块进行语音识别及根据茶吧机的状态进行信息播放,控制由电控模块完成。

离线语音茶吧机设计应用案例_第4张图片

5.2 硬件设计参考¶

用户可以使用我司芯片设计需要要求的语音模块,但为快速开发,推荐直接使用我司的以下标准模块:

  • CI-B02GS03T:适合空间比较高,纵深长的结构,串口接口电平为3.3V;
  • CI-B02GS01S:适合空间比较矮的结构,串口接口电平为3.3V;
  • CI-B02GS01J:适合有空间放置固定语音模块的结构,原来的茶吧机硬件改动较小,串口接口电平为5V。

离线语音茶吧机设计应用案例_第5张图片

用户直接使用我司标准语音模块时,有以下注意事项:

  • 将语音模块板的串口跟电控串口对接,注意电控的供电需要大于500mA;
  • 注意串口的电平要匹配,CI-B02GS01J支持5V电平,其他的模块支持3.3V,如果电控板使用5V电平,CI-B02GS01J可以对接直接串口,其它模块需要增加电平转换电路,如下图所示:

离线语音茶吧机设计应用案例_第6张图片

5.3 串口通讯方式¶

语音模块与电控模块通过串口进行信息交互,主要有两种方式,一种为语音模块主动播放,同时将信息发电控模块;另一种为语音模块被动播放,其分别描述如下:

语音模块主动播放模式

离线语音茶吧机设计应用案例_第7张图片

主动播放方式主要执行以下动作:

  1. 识别到词条;
  2. 主动播放反馈声音;
  3. 将此条信息串口告知电控模块;
  4. 电控模块执行动作。

该方式的优点在于控制方式简单,由语音模块单线输出信息给电控模块。但缺点在于无法根据茶吧机的情况及按键情况进行语音反馈。

语音模块被动播放模式

离线语音茶吧机设计应用案例_第8张图片

被动播放方式主要执行以下动作:

  1. 语音模块识别到词条;
  2. 将词条信息串口告知电控模块;
  3. 电控模块执行相关动作;
  4. 告知语音模块需要播放的内容;
  5. 语音模块根据电控模块反馈进行播放。

该方式的优点在于语音模块根据电控模块的状态进行播放对应内容,可以进行最合适的反馈,体验感好;同时如果电控模块通过按键或者遥控进行控制,语音模块也可以进行状态播放。缺点在于会多一次串口通信的过程。

5.4 SDK包说明和模块串口通讯协议¶

我司为用户提供了串口通讯方案完整的SDK包,用户可以到 ☞启英泰伦语音AI平台 上获取相关SDK开发包。

模块的串口通讯建议使用我司标准协议,具体格式请参考 ☞串口协议 。

注意:

  1. ASR语言模型中文建议选择SE159,其他语种请使用对应语种的模型。茶吧机产品自带运行噪音,如果茶吧机本身噪音大于60db,建议打开降噪功能。
  2. 串口设置:
    • 波特率:9600
    • 停止位:1
    • 数据位:8
    • 奇偶校验:无
  3. 代码中通过判断 “命令+语音ID”获取是什么指令和功能。
  4. 发送的串口信息建议要检查完整性,可以用以下的checksum参考代码来实现。

6 产品结构相关注意事项¶

6.1 麦克风结构设计¶

茶吧机产品在设计结构时,针对麦克风应当注意以下事项:

  • 麦克风布局尽量远离茶吧机的电机,进出水管等噪音处;
  • 麦克风需要防水防尘处理,至少选择IP65规格的;
  • 麦克风放在茶吧机的正面的位置,避免遮挡,保证拾音最大范围;
  • 分贝仪测试运行时,麦克风处的稳态噪声需小于65dB;
  • 麦克风连线较长可选择带屏蔽的线;
  • 麦克风线扎捆远离电机或电控线。

下图以常用智能茶吧机为例,讲述麦克风结构开孔及位置的建议方式,固定麦克风的结构件也需要考虑麦克风线方便引出导线和避免干扰。

离线语音茶吧机设计应用案例_第9张图片

6.2 喇叭结构设计¶

茶吧机产品在设计结构时,针对喇叭应当注意以下事项:

  • 考虑到音质,喇叭功率不能太小,建议选用1W以上喇叭,带音腔的喇叭效果会更好一点,同时注意硬件板上的功放驱动能力要匹配喇叭型号;
  • 喇叭放置位置以美观及结构布局方便为主,但注意尽量避免和麦克风放在同一位置;
  • 不带音腔喇叭可以在结构上做一个音腔密封后能增大音量输出。

下图是一个喇叭规格及开孔的建议。

离线语音茶吧机设计应用案例_第10张图片

6.3 其它注意事项¶

  • 建议选择-32dB±3dB,信噪比大于70dB以上,性价比高的全向模拟麦克风;
  • 若茶吧机电机震动比较大,选择较厚的麦克风胶套减缓震动,可减小对识别效果的影响;
  • 茶吧机处理潮湿环境,最好板子刷三防漆,推荐选择IP65防水防尘的麦克风,;
  • 特别注意禁止直接点热溶胶用于固定麦克风头;
  • 将麦克风完全插入固定孔内部,避免歪斜,拾音孔中心孔对准麦克风的中心;
  • 茶吧机内部接线多容易扯松,插头配插座带卡扣会更牢固;
  • 选择符合环保RoHS要求的RTV硅胶,推荐常用的硅胶有703/704/737等,或其它有机材料、单组分室温固化硅胶等;
  • 多数硅橡胶灌胶厚度小于3mm以内实温完全固化时间为8 ~ 12小时,灌胶厚度 > 3mm以上完全固化时间更长,可分层多次浇灌,确保完全固化稳定密封;
  • 生产工艺可把固定麦克风工序提前,另外特别注意麦克风接线在重力拉扯下,未完全固化前容易导致麦克风扯歪,也需注意将麦克风插线固定好。

离线语音茶吧机设计应用案例_第11张图片


7 相关参考资料列表¶

编号 参考资料描述 获取方式
1 标准离线SDK
CI110X_SDK_ASR_Offline
请到 ☞启英泰伦语音AI平台 上获取
2 茶吧机SDK Demo:
串口通讯方案SDK
请到 ☞启英泰伦语音AI平台 上获取
3 测试固件 到 ☞启英泰伦语音AI平台 上获取
4 我司芯片和模块的选型指南 请点击 ☞硬件选型指南 查看
5 我司芯片硬件设计方法参考 请点击 ☞硬件设计参考 查看
6 麦克风和喇叭器件选型 请点击 ☞外围器件兼容列表 查看
7 产品结构设计 请点击 ☞产品结构设计 查看
8 软件开发方法和标准SDK说明 请点击 ☞软件开发 查看各部分内容
9 产品识别性能测试方法 请点击 ☞识别效果测试 查看
10 生产测试的方法 请点击 ☞生产测试 查看

用户如遇到使用问题,请到启英泰伦语音AI平台上提交技术工单,或直接联系我司技术人员获取协助。

你可能感兴趣的:(语音识别,人工智能)