对话bot语音输入交互竞品调研

《对话bot语音输入交互竞品调研》目录

    • 文章说明
    • 一、列举4个竞品的宏观的语音输入交互流程
      • 1.选择竞品
      • 2.选择竞品依据和原因
      • 3.逐个分析交互流程
    • 二、总结语音输入交互流程
    • 三、语音输入交互流程结合4个竞品的纵向拆分流程
      • 1. 机器唤醒后有反馈
      • 2. ASR过程中实时语音识别,边录音识别边转换成文字
      • 3.根据ASR结束的不同情况,选择是否告知用户如何结束录音
      • 4.根据处理结果反馈的速度,选择是否反馈给用户“正在处理”状态
      • 5.输出结果

文章说明

语音交互对一个对话助手来讲,交互的反馈是否流畅,影响最基础的体验。这里调研几个常见对话bot的语音输入交互模式,然后分解出交互需要的几个反馈流程。

一、列举4个竞品的宏观的语音输入交互流程

1.选择竞品

  • 百度地图语音助手
  • 支付宝语音助手
  • 小爱同学
  • Siri
    在这里插入图片描述

2.选择竞品依据和原因

  • 都是成熟产品,有探讨和借鉴意义
  • 它们的语音助手定位都是服务或工具类
  • 语音输入、识别、输出等交互均为Q&A对话bot,而非简单的语音输入(如微信语音输入或QQ语音输入等)

3.逐个分析交互流程

百度地图语音助手
对话bot语音输入交互竞品调研_第1张图片

支付宝语音助手
对话bot语音输入交互竞品调研_第2张图片

小爱同学
对话bot语音输入交互竞品调研_第3张图片

Siri
对话bot语音输入交互竞品调研_第4张图片

二、总结语音输入交互流程

对话bot语音输入交互竞品调研_第5张图片

  1. 按钮可见并示意:
  2. 机器唤醒后有反馈(动效或状态反馈、语音反馈);
  3. ASR过程中的实时语音识别(边录音边转换成文字);
  4. 结束录音方法的告知反馈(静音检测不告知,用户不说话即结束;用户手动松开按钮的会告知)
  5. 识别完成后的等待反馈

    处理速度慢,加入等待状态;
    处理速度快,不加入等待状态;
    最终目的是使用户实时获取到进度信息

  6. 输出结果(TTS、文本)。

三、语音输入交互流程结合4个竞品的纵向拆分流程

1. 机器唤醒后有反馈

  • 动效或状态反馈
  • 语音反馈
    对话bot语音输入交互竞品调研_第6张图片

2. ASR过程中实时语音识别,边录音识别边转换成文字

对话bot语音输入交互竞品调研_第7张图片

3.根据ASR结束的不同情况,选择是否告知用户如何结束录音

  • 若静音检测不告知,用户规定时间内不说话即结束
  • 若用户手动松开按钮的交互则告知
    对话bot语音输入交互竞品调研_第8张图片

4.根据处理结果反馈的速度,选择是否反馈给用户“正在处理”状态

  • 若处理速度慢,加入状态
  • 若处理速度快,则不加入状态,直接返回结果
    对话bot语音输入交互竞品调研_第9张图片

5.输出结果

  • 文本
  • TTS
    对话bot语音输入交互竞品调研_第10张图片

你可能感兴趣的:(对话bot语音输入交互竞品调研)