一步一步教你做可用性测试

最好的输入就是输出,最近进行了一次可用性测试的分享。分享会上和大家交流,了解了一些实操过程中的重要点,大多是网上没有的资料,是一些宝贵的经验:

1、正式测试时,单个任务的时间怎么计算。一个测试者需要完成3-5个任务,一个任务一个卡片,一次发一张卡片。在测试前,主持人会介绍说“当我说开始的时候,你就可以开始读任务完成任务了”之类的话。所以从拿到任务卡片就可以开始计时。 

2、用户的行为是不可预期的。如在实际测试的过程中,就算用户完成了一个任务,他会继续点击查看其他的内容,原因可能是他不确定是否完成了任务。 

3、一些资料会推荐一个用户的时间大概是25-40分钟,时间长了可能不耐烦。但是,如果用户是通过层层筛选选来的,是有偿的,那么测试时间可能达到90分钟/人,因为要尽量不浪费资源。 

4、测试过程中,有的用户会表现出烦躁、敷衍等行为,主持人要及时的停止测试,因为测试数据可能不准确。

 5、对于“精品用户”,如第3点中提到的,每个用户需要测试90分钟,那么一般一下午只能安排3名左右的测试者。

 6、做了就比不做好。专业的可用性测试需要专门的设备、资源,但是也可以根据自己的实际预算、产品的阶段进行简单的可用性测试。


以下是分享会的内容,分可用性测试的介绍和步骤两部分,其中步骤又分为测试前的准备、正式测试、测试后数据的分析3个小部分。

一、介绍

1、定义

在特定场景中,通过观察用户完成特定任务时,所产生的一系列指标。常见的3个指标是:有效性、效率、用户满意度。

·有效性:用户完成任务的完成度,对应用户目标;

·效率:用户完成任务需要耗费的时长;

·用户满意度:用户对该系统的舒适度和认可度,偏主观。

2、可用性测试方法有哪些?

网上搜索“可用性测试”或“usability method”,会发现有很多的研究方法,比如原型测试、问卷调查等几十种。这是因为可用性测试并不是单一的方法,它是由多种方法组成的。

根据自己产品的性质、所处的不同阶段、经费等,采用不同的方法组合来做可用性测试。比如在产品初期,可能只有概念稿、纸质版原型,也是可以做可用性测试的;公司经费允许,想做的更专业,可以找第三方公司做可用性测试,比如眼动测试就需要专业的设备。

此外,可用性测试并不是专门给用研人员用的。产品经理可以验证原型、交互设计师可以发现可用性问题、视觉设计师有类似图标的可用性测试和内容的可用性测试等,所以掌握可用性测试,是一个非常基本的技能。

下图列出的是可用性测试中常见到的一些方法:

在这种图中,大部分的方法我们工作中都有接触。从最底部往上看:红色的是面向专家的方法,比如公司内部设计方案评审;绿色方法比如面对面测试,如我们平时找同事寻求意见等;卡片分类法常用在互联网行业中,规划和设计信息架构。……所以可用性测试的很多子方法,我们都或多或少接触过。

3、可用性测试分类

这么多的方法如何排列组合,怎么用呢?

一般情况,把可用性测试分为2大类:形成型可用性测试和总结型可用性测试。简单看来这两大类的区别是:前者适用于项目前期,后者适用于项目上线后期;前者简单快速,后者专业要求高;前者目的是快速发现问题,后者更倾向于看指标数据。

下图是这2大类的具体区别以及常用的方法:

4、为什么做可用性测试

所以可用性测试的本质就很好理解了,功能与流程含有不确定性,找到目标用户还原使用场景进行测试验证,以评测设计是否行得通、哪里需要改进,为功能上线减少风险加强容错,减少试错的成本。

5、可用性测试流程概况

如同餐厅推出一个新系列的菜品试吃一样,可用性测试可与试菜环节相类似。为了便于理解,我们以餐厅试菜做比喻。

二、步骤

以试菜为类比,接下来就讲一下可用性测试的流程是怎样的。

tips1

就像上新菜一样,试菜往往是针对一系列新品的研究,并不是面向整个菜品的,可用性测试很少用于研究用户对产品或服务的整体体验。

tips2

试菜流程根据餐厅实际情况,可以招募一波试吃路人,也可以小范围内不试吃。所以所,我们给出的可用性测试步骤,是通用的而非标准,根据实际情况取舍。

将可用性测试的整个过程分为:测前准备,测试,测后分析3大块。每一块的关键内容如下图:

测前准备

首先要确定目标,有了目标才能安排计划。试菜的目标可能是:推出新系列产品,并且借机宣传。那么它的计划中就要包含邀请媒体报道了。

1、确定测试目标

2、准备测试计划

计划中包括:目标、测试内容、方法、时间计划、用户招募方案

在规划测试过程之前,我们需要明确测试的方式,比如是远程测试还是与用户面对面的测试。注意为了不影响最终测试结果,需要保证样本用户的测试方式统一。

3、界定目标测试用户

用户招募方案,根据产品的不同,可能需要不同类型的方法。比如管理员类用户和普通员工,就是典型的两种类型的用户。这2类用户可能存在重叠,但是测试功能模块时候,要分开模块进行测试。

4、撰写大纲和脚本

5、招募&筛选用户

可以通过官方发布召集令,报名表信息含有:基本信息、产品使用情况、相关竞品使用情况、是否有测试经验、方便时间。再根据报名内容,进行层层筛选。

根据第3点中,测试用户分类,每类大概招募6-8名用户。

一般可用性测试单个模块有5个测试者,就可以发现80%左右的问题,但是要多出1-2人备选。

专业类用户4-5人,自由招募5-6人

6、准备测试物资

分两类,一类物料(会议室、记录设备),一类文档类。

常用文档资料如下图:

可用性测试中的定量的问卷

我们在做产品或系统的可用性测试后,都想把结果更好地传递给相关方。除了定性的研究结果之外,还有定量的可用性问卷,这些可用性问卷是标准化的,不仅可以科学地量化用户体验,也方便相关方之间有效沟通。

常见的标准化可用性问卷有:整体评估问卷、任务评估问卷和网站感知可用性评估问卷,如下所示:

整体评估问卷

用于完成一系列任务场景后,对产品或系统整体的感知可用性测量。目前使用较广泛的有:QUIS(Questionnaire For User Interaction Satisfaction)、SUMI(Software Usability Measurement Inventory)、PSSUQ(Post-Study System Usability Questionnaire)、CSUQ(Computer System questionnaire)、SUS(System Usability Scale)。

任务评估问卷

每完成一个场景任务,让用户对该任务进行感知可用性测量。目前使用较广泛的有:ASQ(After-Scenario Questionnaire)、SEQ(Single Ease Question)、SMEQ(Subjective Mental Effort Questionnaire)、ER(Expectation Ratings)、UME(Usability Magnitude Estimation)。

网站感知可用性评估问卷

大部分标准化可用性问卷最初在20世纪80年代中期到后期被开发,在网络开始流行时,出现了更有针对性的评估网站感知可用性的问卷,目前广泛使用的有:WAMMI(Website Analysis and Measurement Inventory)、SUPRQ(Standardized Universal Percentile Rank Questionnaire)。

测中(正式测试)

终于开始测试了,正式的测试也分了几个步骤。

1、测试介绍:

向用户简单介绍测试目的和流程,尽量让他们处于一个比较放松的状态,取得录制视频和使用数据的许可,签订保密协议;

2、测试前问卷:

测试产品前,填写一个简单的问卷,除了简单的个人信息外需要了解用户对相关产品使用经验和习惯等;

3、测试场景与任务:

开始进行测试,在用户完成任务过程中观察用户的表情和肢体动作,在完成任务后提出一些简单的口头问题;

4、任务后问卷:

在完成一个任务后,用ASQ(After Scenario Questionnaire)梯度问卷调查满意度,再进行下一个任务的测试;

5、测试后问卷:

在所有任务完成后,用户需要填写一个关于整体满意度的梯度问卷,通常使用的是SUS(System Usability Scale)——系统可用性量表。

注意事项:

保持测试环境免受干扰

向被测试人员说明:测试内容、目的、流程、时长、刚刚填写的个人资料表的处理方式。让被测试者有好的认识同时打消顾虑

测试过程中的记录,录音、录像、笔记

记录人员不要直接告诉被测试者怎么操作

测后分析

通过可用性测试,我们得到了单个用户的记录内容。测试时的记录点:求助节点、问题描述、微表情反应。所有跟数字相关的数据如时间:后期根据录音、录屏进行整理。

下面来看如何得到文章一开始说的3个指标,有效性、满意度、效率

1、有效性

有效性对应用户是否能成功完成任务。

功能有效性计算公式:有效性=(完全完成任务用户数x1+部分完成任务用户数x0.5)/用户总数

2、满意度

满意度是一个主观的感受,为了量化,我们通过问卷调查的方式来获取。满意度又分为单个任务的满意度和整体的满意度。分别用ASQ问卷和SUS问卷获取。

3、效率

效率对应时间,用用户完成单个任务的耗时长短来衡量。四舍五入精确到秒,数值越大效率越低。

效率=平均用时/熟练用时

熟练用时:对功能熟悉的人(PM、测试、设计师)按照任务提示进行操作,记录完成操作所需的时间,多个人操作取平均值,四舍五入按秒计时。

限定时间:根据熟练用时而定,熟练用时的3~10倍,保证一个任务不超10分钟。计时单位:四舍五入精确到分。

完成时间

开始时间:用户拿到任务卡开始计时。不要等用户读完任务卡计时,因为有人喜欢读一条记一条,有人喜欢读完所有任务再操作。

结束时间:不要在观察到任务完成了就结束,而要用户宣布自己已完成再结束,因为有人在操作完喜欢检查自己是否操作成功。计时单位:四舍五入精确到分。

4、可用性水平

通过以上3个指标,我们可以得到功能的整体的一个可用性水平。对有效性,效率,满意度做量化处理,按照5:3:2的权重计算得分:可用性水平=有效性x0.5-效率x0.3+满意度x0.2

注意,这里的权重不是固定5:3:2,根据实际项目的需求,来决定占比水平。

5、结果的利用

注意点:

·可用性测试得出的结论可能是体验的优化、方案的决策、设计的输入,不会动产品大的方向,是微调而不是改版

·要做减法而不是加法。发现了问题要取优先级,发现了更多的需求也要取优先级,上线压力要减去一些功能

·做了优化要去验证,优化是否有效

通过可用性测试,我们会得到很多的反馈、问题,用Excel表整理问题清单,用高中低标注,在修改问题时有先后顺序


参考文档

1. Why You Only Need to Test with 5 Users

https://www.nngroup.com/articles/why-you-only-need-to-test-with-5-users/

2. Usability Test, Even When You Know the Answer

https://www.nngroup.com/articles/test-when-you-know-answer/

3. Usability Testing 101

https://www.nngroup.com/articles/usability-testing-101/

4. SUS超全解析

http://www.lanlanwork.com/blog/m/?post=8275

5. 写任务需避免的10大错误

https://mp.weixin.qq.com/s/BrBWxBc9zl3WvhNQPfqI5Q

最后,关于可用性测试的一些知识思维导图、模板等内容,感兴趣可以私信。有问题欢迎交流。

你可能感兴趣的:(一步一步教你做可用性测试)