用VUI提升用户体验

VUI简史


谈VUi前,得先说GUI。

图像用户界面GUI(Graphical User Interface)是60年代「人机交互」奇才道格·恩格尔巴特提出的概念,自从80年代苹果推出第一款应用GUI的电脑后,GUI一直是人机交互的典型代表。

随着越来越多的语音控制设备,VUI开始帮助改进各种不同的用户体验。VUI是用户通过语音与计算机进行人机交互来启动自动化服务或流程的工具,是直接面向用户的界面,所以是否能满足用户需求是判断其成功与否的决定性因素之一。


VUI的发展过程主要可以分为以下两个时期:


诞生——纯语音交互

语音交互界面VUI (Voice User Interface) 并不是全新的概念,它的前身是交互式语音应答IVR(Interractive Voice Response) 。二十世纪九十年代,交互模式的语音应答IVR正式诞生,代表了VUI发展的第一个重要时期。用户可直接通过电话进入服务中心,利用数字对内部系统进行命令操作。


IVR存在的主要缺点有:


通常用于单轮任务

交互方式较为单一

不能进行中途打断

在与系统的交互过程中,如果出现了失误,用户只能挂断重来,这使得整个交互过程极不流畅,而用户也一直处于相当拘谨的状态下,与如今语音交互轻松自然的氛围相去甚远。


普及——语音和屏幕结合交互

新一代的VUI更多指的是人通过自然语言与计算机进行交互,所以可认为VUI是人工智能时代下的人机交互代表。

各大公司都推出了自己的语音助手,例如微软的cortana,谷歌的Google OK和苹果的Siri。这些语音助手结合视觉和听觉,同时使用语音和屏幕进行人机交互。发展到这个阶段,就打破了原先IVR仅能用于单轮任务的局限性,使得语音交互有了多轮对话的可能性。


VUI是什么?

作为新一代的交互模式,通俗的说,VUI(语音用户界面)就是用人类最自然的语言(开口说话)给机器下达指令,达成自己的目的的过程,这一过程包括三个环节:

能听

会说

懂你


VUI是用户通过语音或者语音平台与计算机进行人机交互,来启动自动化服务或流程。VUI设计,即用户与语音应用系统的交互设计。VUI是直接面向用户的界面,所以是否能满足用户需求是系统成功与否的决定性因素之一。

最典型的应用就是语音助手,当下最热门的产品就是智能音箱了。


什么场景适合使用语音交互?

1.智能家居:在家庭“相对封闭与安全”(特指针对语音信号采集的干扰程度),通过语音交互指令控制家居开关是很好的切入点。相信在不久的将来,搭载了语音交互系统的智能家居,都可以听你的话,你说所说的每个指令,都会直接影响/控制到当前家居的运行状态。“你可能越来越惬意,也可能越来越懒......”


2.出行车载语音交互系统:释放了驾驶员的手和眼,让司机专注于前方的路况,如接听电话、开关车窗、播放广播音乐、路线导航等语音交互指令。


3.企业应用:未来会有各种各样专业的知识工作者会在或大或小的程度被简化或者被替代,比如文本、数据的录入工作,比如客服机器人。但,极不太可能的是直接对着一个设备吼两嗓子做一个PPT的方式。


4.医疗&教育:如语音记录病历,不管对医生来说还是患者来说,都是提高看病效率的很好的辅助手段之一。


语音用户界面(VUI)的设计原则

不要让用户有认知负荷

声音对于人类来说是短暂的记忆,人们不可能一下子记住很多新信息。所以不要挑战人类短暂的记忆能力。


准确、高效

抓住用户的主要需求,准确、快速的让用户达到自己的目标。


消除歧义

当系统问用户,你的主要症状是什么?而用户说的是发烧和感冒,系统就要理解用户说的是两个症状,针对这个事情,系统需要进行回复两种不同的症状解决方式。


对话唤起

信息和用户界面组件必须以可感知的方式呈现给用户。


无障碍设计

创建可用不同方式呈现的内容(例如简单的布局),而不会丢失信息或结构。


不要责怪用户

提供帮助用户导航、查找内容、并确定其位置的方法。


语音交互涉及那些技术


VUI(语音用户界面)所涉及的技术模块有 4 个部分,分别为:

自动语音识别:Automatic Speech Recognition, ASR

自然语言理解:Natural Language Understanding, NLU

自然语言生成:Natural Language Generation, NLG

文字转语音:Text to Speech, TTS

语音交互技术包括的识别、理解和对话三个部分。也就是通过麦克风让机器能听到用户说的话,然后听懂用户想要表达的意思,并把反馈的结果“说给用户听”。


VUI 设计师的工作内容


VUI 设计和普通的互联网的设计没有太多的不一样,如果非要说区别的话,我个人认为 VUI 设计所接触和涉及的范围更广。主要有下面几个工作内容:

进行用户研究,了解用户是谁,哪里的用户(环境),以及在系统和终端之间从开始到结束的整个对话过程;

负责产品的原型设计(原型设计工具Mockplus)和产品描述,描述系统与用户之间的交互行为。

描述系统与用户之间的交互行为并考虑需要处理的请求,通过分析数据来了解系统在什么地方发生了问题,最后进行系统问题的排查和改进。


如何更好的理解用户想做什么


动手设计之前,有经验的 VUI 设计师会先解构该预设行为。通常,用户的一个语音指令会包含三个关键因素:意图、表达方式、特殊要求。


意图

a. 明确意图:语音指令是一个具体的要求,如 “开/关灯,放音乐,查天气,等等。

b. 模糊意图:语音指令比较模糊,可能指向多结果。如用户直接说 “好妹妹”,结果可能导向1)好妹妹乐队的音乐 2)好妹妹电台 3)通讯录联系人 4)设备昵称(误)。在还没有用户使用习惯的数据时,就需要补问用户,从而更好地理解和反馈。


表达方式

比如用户想要播放音乐,他可能会说“Hey Cortana, Play chill music on Spotify" 也可能会说 “Hey Cortana, I wannahear chill music"

VUI设计需要考虑到指令的各种表达方式,这会帮助人工智能有效的反馈正确的结果。


特殊要求

“Hey Cortana, play (chill) music on (Spotify)"

“Uber me to home at (6 p.m)"

上边例句中,括号内均为该指令的特殊要求。(放松)或(激情)的音乐;

(Spotify)或(iHeatradio)作音乐提供商;(下午6点)或(下午7点)打车。

你可能感兴趣的:(用VUI提升用户体验)