对话式AI操作系统架构(学习心得)

什么是对话式操作系统

  1. 以智能IoT设备(如智能音箱)为依托平台的操作系统
  2. 在这个操作系统上,开发者可以进行应用程序的开发

对话式操作系统的请求流程

对话式AI操作系统架构(学习心得)_第1张图片
以百度的DuerOS为例:

  1. 用户发出语音指令
  2. 智能音箱收集音频流
  3. 语音识别,将语音转化为文本
  4. 文本请求在系统内转化为请求指令,发送给对应的应用服务
  5. 应用服务处理请求,生成回复
  6. 语音合成,将应用服务的回复结果以音频形式输出

与传统web服务的区别


键盘和鼠标对浏览器进行输入操作,网站对输入的指令进行回复。

对话式操作系统中的技能服务,就类似于浏览器中的不同功能网站,也类似于手机操作系统上的各种APP。

对话式操作系统的相关思考

  1. 需要以AI技术为基础,理解人类的语言指令
  2. 交互形式和传统的屏幕交互差别很大
  3. 应用层技能服务的反馈形式也需要是语音形式,而不是传统的在屏幕画面上显示
  4. 在流程设计上,为了能让应用的步骤清晰,需要设计者做对应的安排(比如遇到网络延迟和处理中的情况,用户没有屏幕看在缓冲中,那怎么让客户知道应该等待下去)
  5. 人类是视觉动物,如何让对话式的交互可以更好的为人接受将是一个很大的挑战
  6. 应用服务的切换和并行处理也将是值得思考的方面

你可能感兴趣的:(语音识别,NLP)