最好的输入就是输出，最近进行了一次可用性测试的分享。分享会上和大家交流，了解了一些实操过程中的重要点，大多是网上没有的资料，是一些宝贵的经验：

1、正式测试时，单个任务的时间怎么计算。一个测试者需要完成3-5个任务，一个任务一个卡片，一次发一张卡片。在测试前，主持人会介绍说“当我说开始的时候，你就可以开始读任务完成任务了”之类的话。所以从拿到任务卡片就可以开始计时。

2、用户的行为是不可预期的。如在实际测试的过程中，就算用户完成了一个任务，他会继续点击查看其他的内容，原因可能是他不确定是否完成了任务。

3、一些资料会推荐一个用户的时间大概是25-40分钟，时间长了可能不耐烦。但是，如果用户是通过层层筛选选来的，是有偿的，那么测试时间可能达到90分钟/人，因为要尽量不浪费资源。

4、测试过程中，有的用户会表现出烦躁、敷衍等行为，主持人要及时的停止测试，因为测试数据可能不准确。

5、对于“精品用户”，如第3点中提到的，每个用户需要测试90分钟，那么一般一下午只能安排3名左右的测试者。

6、做了就比不做好。专业的可用性测试需要专门的设备、资源，但是也可以根据自己的实际预算、产品的阶段进行简单的可用性测试。

以下是分享会的内容，分可用性测试的介绍和步骤两部分，其中步骤又分为测试前的准备、正式测试、测试后数据的分析3个小部分。

一、介绍

1、定义

在特定场景中，通过观察用户完成特定任务时，所产生的一系列指标。常见的3个指标是：有效性、效率、用户满意度。

·有效性：用户完成任务的完成度，对应用户目标；

·效率：用户完成任务需要耗费的时长；

·用户满意度：用户对该系统的舒适度和认可度，偏主观。

2、可用性测试方法有哪些？

网上搜索“可用性测试”或“usability method”，会发现有很多的研究方法，比如原型测试、问卷调查等几十种。这是因为可用性测试并不是单一的方法，它是由多种方法组成的。

根据自己产品的性质、所处的不同阶段、经费等，采用不同的方法组合来做可用性测试。比如在产品初期，可能只有概念稿、纸质版原型，也是可以做可用性测试的；公司经费允许，想做的更专业，可以找第三方公司做可用性测试，比如眼动测试就需要专业的设备。

此外，可用性测试并不是专门给用研人员用的。产品经理可以验证原型、交互设计师可以发现可用性问题、视觉设计师有类似图标的可用性测试和内容的可用性测试等，所以掌握可用性测试，是一个非常基本的技能。

下图列出的是可用性测试中常见到的一些方法：

在这种图中，大部分的方法我们工作中都有接触。从最底部往上看：红色的是面向专家的方法，比如公司内部设计方案评审；绿色方法比如面对面测试，如我们平时找同事寻求意见等；卡片分类法常用在互联网行业中，规划和设计信息架构。……所以可用性测试的很多子方法，我们都或多或少接触过。

3、可用性测试分类

这么多的方法如何排列组合，怎么用呢？

一般情况，把可用性测试分为2大类：形成型可用性测试和总结型可用性测试。简单看来这两大类的区别是：前者适用于项目前期，后者适用于项目上线后期；前者简单快速，后者专业要求高；前者目的是快速发现问题，后者更倾向于看指标数据。

下图是这2大类的具体区别以及常用的方法：

4、为什么做可用性测试

所以可用性测试的本质就很好理解了，功能与流程含有不确定性，找到目标用户还原使用场景进行测试验证，以评测设计是否行得通、哪里需要改进，为功能上线减少风险加强容错，减少试错的成本。

5、可用性测试流程概况

如同餐厅推出一个新系列的菜品试吃一样，可用性测试可与试菜环节相类似。为了便于理解，我们以餐厅试菜做比喻。

二、步骤

以试菜为类比，接下来就讲一下可用性测试的流程是怎样的。

tips1

就像上新菜一样，试菜往往是针对一系列新品的研究，并不是面向整个菜品的，可用性测试很少用于研究用户对产品或服务的整体体验。

tips2

试菜流程根据餐厅实际情况，可以招募一波试吃路人，也可以小范围内不试吃。所以所，我们给出的可用性测试步骤，是通用的而非标准，根据实际情况取舍。

将可用性测试的整个过程分为：测前准备，测试，测后分析3大块。每一块的关键内容如下图：

测前准备

首先要确定目标，有了目标才能安排计划。试菜的目标可能是：推出新系列产品，并且借机宣传。那么它的计划中就要包含邀请媒体报道了。

1、确定测试目标

2、准备测试计划

计划中包括：目标、测试内容、方法、时间计划、用户招募方案

在规划测试过程之前，我们需要明确测试的方式，比如是远程测试还是与用户面对面的测试。注意为了不影响最终测试结果，需要保证样本用户的测试方式统一。

3、界定目标测试用户

用户招募方案，根据产品的不同，可能需要不同类型的方法。比如管理员类用户和普通员工，就是典型的两种类型的用户。这2类用户可能存在重叠，但是测试功能模块时候，要分开模块进行测试。

4、撰写大纲和脚本

5、招募&筛选用户

可以通过官方发布召集令，报名表信息含有：基本信息、产品使用情况、相关竞品使用情况、是否有测试经验、方便时间。再根据报名内容，进行层层筛选。

根据第3点中，测试用户分类，每类大概招募6-8名用户。

一般可用性测试单个模块有5个测试者，就可以发现80%左右的问题，但是要多出1-2人备选。

专业类用户4-5人，自由招募5-6人

6、准备测试物资

分两类，一类物料（会议室、记录设备），一类文档类。

常用文档资料如下图：

可用性测试中的定量的问卷

我们在做产品或系统的可用性测试后，都想把结果更好地传递给相关方。除了定性的研究结果之外，还有定量的可用性问卷，这些可用性问卷是标准化的，不仅可以科学地量化用户体验，也方便相关方之间有效沟通。

常见的标准化可用性问卷有：整体评估问卷、任务评估问卷和网站感知可用性评估问卷，如下所示：

整体评估问卷

用于完成一系列任务场景后，对产品或系统整体的感知可用性测量。目前使用较广泛的有：QUIS（Questionnaire For User Interaction Satisfaction）、SUMI（Software Usability Measurement Inventory）、PSSUQ（Post-Study System Usability Questionnaire）、CSUQ（Computer System questionnaire）、SUS（System Usability Scale）。

任务评估问卷

每完成一个场景任务，让用户对该任务进行感知可用性测量。目前使用较广泛的有：ASQ（After-Scenario Questionnaire）、SEQ（Single Ease Question）、SMEQ（Subjective Mental Effort Questionnaire）、ER（Expectation Ratings）、UME（Usability Magnitude Estimation）。

网站感知可用性评估问卷

大部分标准化可用性问卷最初在20世纪80年代中期到后期被开发，在网络开始流行时，出现了更有针对性的评估网站感知可用性的问卷，目前广泛使用的有：WAMMI（Website Analysis and Measurement Inventory）、SUPRQ（Standardized Universal Percentile Rank Questionnaire）。

测中（正式测试）

终于开始测试了，正式的测试也分了几个步骤。

1、测试介绍：

向用户简单介绍测试目的和流程，尽量让他们处于一个比较放松的状态，取得录制视频和使用数据的许可，签订保密协议；

2、测试前问卷：

测试产品前，填写一个简单的问卷，除了简单的个人信息外需要了解用户对相关产品使用经验和习惯等；

3、测试场景与任务：

开始进行测试，在用户完成任务过程中观察用户的表情和肢体动作，在完成任务后提出一些简单的口头问题；

4、任务后问卷：

在完成一个任务后，用ASQ(After Scenario Questionnaire)梯度问卷调查满意度，再进行下一个任务的测试；

5、测试后问卷：

在所有任务完成后，用户需要填写一个关于整体满意度的梯度问卷，通常使用的是SUS(System Usability Scale)——系统可用性量表。

注意事项：

保持测试环境免受干扰

向被测试人员说明：测试内容、目的、流程、时长、刚刚填写的个人资料表的处理方式。让被测试者有好的认识同时打消顾虑

测试过程中的记录，录音、录像、笔记

记录人员不要直接告诉被测试者怎么操作

测后分析

通过可用性测试，我们得到了单个用户的记录内容。测试时的记录点：求助节点、问题描述、微表情反应。所有跟数字相关的数据如时间：后期根据录音、录屏进行整理。

下面来看如何得到文章一开始说的3个指标，有效性、满意度、效率

1、有效性

有效性对应用户是否能成功完成任务。

功能有效性计算公式:有效性=(完全完成任务用户数x1+部分完成任务用户数x0.5)/用户总数

2、满意度

满意度是一个主观的感受，为了量化，我们通过问卷调查的方式来获取。满意度又分为单个任务的满意度和整体的满意度。分别用ASQ问卷和SUS问卷获取。

3、效率

效率对应时间，用用户完成单个任务的耗时长短来衡量。四舍五入精确到秒,数值越大效率越低。

效率=平均用时/熟练用时

熟练用时：对功能熟悉的人（PM、测试、设计师）按照任务提示进行操作，记录完成操作所需的时间，多个人操作取平均值,四舍五入按秒计时。

限定时间：根据熟练用时而定,熟练用时的3～10倍，保证一个任务不超10分钟。计时单位：四舍五入精确到分。

完成时间：

开始时间：用户拿到任务卡开始计时。不要等用户读完任务卡计时，因为有人喜欢读一条记一条，有人喜欢读完所有任务再操作。

结束时间：不要在观察到任务完成了就结束，而要用户宣布自己已完成再结束，因为有人在操作完喜欢检查自己是否操作成功。计时单位：四舍五入精确到分。

4、可用性水平

通过以上3个指标，我们可以得到功能的整体的一个可用性水平。对有效性,效率,满意度做量化处理,按照5:3:2的权重计算得分：可用性水平=有效性x0.5-效率x0.3+满意度x0.2

注意，这里的权重不是固定5:3:2，根据实际项目的需求，来决定占比水平。

5、结果的利用

注意点：

·可用性测试得出的结论可能是体验的优化、方案的决策、设计的输入，不会动产品大的方向，是微调而不是改版

·要做减法而不是加法。发现了问题要取优先级，发现了更多的需求也要取优先级，上线压力要减去一些功能

·做了优化要去验证，优化是否有效

通过可用性测试，我们会得到很多的反馈、问题，用Excel表整理问题清单，用高中低标注，在修改问题时有先后顺序

参考文档

1. Why You Only Need to Test with 5 Users

https://www.nngroup.com/articles/why-you-only-need-to-test-with-5-users/

2. Usability Test, Even When You Know the Answer

https://www.nngroup.com/articles/test-when-you-know-answer/

3. Usability Testing 101

https://www.nngroup.com/articles/usability-testing-101/

4. SUS超全解析

http://www.lanlanwork.com/blog/m/?post=8275

5. 写任务需避免的10大错误

https://mp.weixin.qq.com/s/BrBWxBc9zl3WvhNQPfqI5Q

最后，关于可用性测试的一些知识思维导图、模板等内容，感兴趣可以私信。有问题欢迎交流。

一步一步教你做可用性测试