用户研究之文本研究系列-1：定性分析基础

2016-07-04 梁芳 网易金融大数据实验室

1. 为什么要定性分析非结构化数据？

非结构化数据中的一种，就是用户研究项目中获得的用户反馈信息。这类文本数据通常篇幅较大，单条数据记录中便包含着大量信息，其分析手段也以定性分析方法为主。本期将详细介绍相关的理论、一般过程，以及常用工具等，带大家更好地理解非结构化数据的价值与应用。

定性研究是用户研究常用的方法，它让我们得以掌握用户更深层的动机和需要，也因此，数据采集完成之后，我们会得到大量资料或文本信息。

为什么要定性分析非结构化数据？

概括来说，定性研究具备四大特性：

1，因研究个案数据有限，必须概括性地总结问题与结论；

2，为我们提供了多角度比较两个个案提供了可能；

3，在推断因果关系时可用的证据可能比较薄弱；

4，重视基于实地证据的结论总结与表达。

定性研究具备四大特性

那么，与结构化数据常用的分析手段相比，定性资料该如何去分析？是否有方法可循？

2. 定性资料的初步分析

与结构化数据分析最大的不同是，定性资料的分析在其收集过程中就已经开始了！毕竟我们已经在资料收集上花费了大量时间，如果到了项目后期才开始分析这些资料，很可能带来两个后果：

1，我们将无法再继续收集新的资料去填补资料间的断层。

2，我们将无法再收集资料去验证分析过程发现的新假设。

通常，初步分析阶段可以作为的地方有很多，下面只是建议要做的6个方面。

step 0

step 1

下图为今年年初，网易金融大数据实验室进行的关于网易宝更名为网易支付的调研。该调研中，我们针对影响用户品牌接受度的各因素及其关系进行了梳理，并基于设计了（定性）测量方案。

step 1

step 2

step 3

定性资料编码是一个严格的过程，学术界一般按照一、二、三级别编码的形式循序渐进，力求兼顾信息挖掘的全面性和条理性。

一级编码，要求粒度尽可能细，能最直接地概括被编码内容；

二级编码，是对多个一级编码的概括与提炼，

三级编码，则是对二级编码的继续提炼。

step 3

下图为网易理财PC端改版调研项目中使用的编码过程，通过编码之间的逐步“归纳”，我们逐渐找到了当前产品中的痛点，以及可以突破的发力点。

step 3

step 4

step 5

step 6

需要强调的是，一个项目中资料的分析并不是一次性的，需要我们根据项目的进展不断地补充新资料或回查原始资料。这一做法既能保证已有发现足够可信，也是为新发现寻找证据。当然，这也是为什么我们会说，资料的定性分析越早开始越好的原因！

step 99

3. 标准化定性分析方法

下面主要讲述常用的定性资料分析方法，这些方法在我们过去写报告的时候或多或少都有使用过，可能只是不太知道具体方法的名字。比如以证据建成一条逻辑链就要求我们将多渠道、多用户的反馈提炼出核心观点，这可能是跨研究方法的一种佐证。

常用的定性资料分析方法

1：举例说明法

简单地说，举例说明法就是以典型案例的形式来表述一种结论，尤其是这个结论很抽象的时候。这种方法生动、易理解，对结论的表述又可以带有一定的原始信息，也更容易为需求方所接受。当然，一个结论中，可能包含多个不同类型的“典型案例”。

举例说明法

2：清点法

可用性测试中，我们常以一个问题被反馈的次数去定义问题的严重性，这种方法轻松便捷，也足够说明问题。

但需要警惕的是，我们应该知道什么时候需要去处理频率问题，什么时候不需要去处理。在前公司曾有一个同事在做完调研的时候，下了一个结论：用户不关注PM2.5，不需要在产品中上线该功能——原因就是她访谈的5个用户均不关心。但这个结论是非常不恰当的，若再继续访谈几个人，可能结果就会完全不一样。

清点法

3：找出因素法

找出因素法，它要解决的问题是：我有一大堆资料在这儿，其中究竟有哪些是相关联的？

找出因素法

对于这种资料的处理，有两种声音：一种是认为定性研究不能解决因果关系问题，另一种认为可以找到一些方法去做解释。找出因素法面临这一困境的原因是，因果关系是复杂的。一个问题，可能是一果多因，也可能是一因多果，还可能是存在中介变量。

对于找出因素法的争论

应对这个问题取巧的方法就是做相关解释，而非因果分析。

另外也有一些原则可以帮助我们去找出因素，如强调当下性。例如Bartlett提出的问题：是什么因素使得一些小学生在教室排队的时候，是按性别排队？是老师安排？还是小学生的先前的社会化？还是偶尔群体的做法？或者是学校的“秩序”？

我们可以想到的原因有很多种，但如果说是有影响的话，其效果是此时此地的，因此这刻的关联就是什么老师、感觉了什么、说了什么、做了什么？其他学生感觉了什么、说了或做了什么。也就是说我们需要去强调的是“当下性”，而非与此相关的遥远的“素质”等因素

4：其他方法

其实还有很多其他的方法帮助我们更好地分析定性资料，比如图表就是一种非常强的可视化方式。

另外，通过词云、语义网络等将一些关键信息形象突出地表现，能更好地达到分析的效果。

4. 定性分析工具概览

上面说道的图标、词云、语义网络等方法，往往需要借助一定的分析工具。随着定性研究技术的发展，成熟的工具也有很多，比如R脚本、Rost CM6、Nvivo、Atilas.ti 等均能满足基本的定性分析的需求。但每个工具各有差异，使用的场景和目标也有所不同。

Atilas.ti功能简介

相对而言，Rost CM6分析成本最低，最快捷，但得到的结果是最粗糙，可靠性较低，一般在于资料的收集后的前期初步分析，去验证和发现初步想法。

其次是R脚本，R比较便捷的是有R包，我们可以从网上去下载它的分析语言，精确度高于Rost CM6，但时间成本稍微高一些。

最为专业的是Nvivo和Atilas.ti，能反复编码，深入分析，并能有效地展示资料。而它们的缺点就是需要进行人工编码和组织。我们可以根据自己的项目需要去灵活地选择分析工具。

灵活地选择分析工具

实际项目中，我们选择哪款工具是根据当前要回答的问题决定的，每个工具也都有各自的优势。而这，也是我们在定性研究中使用使用工具的初衷！

文章首发于“网易金融大数据实验室”（微信公众号），文章地址：点击跳转文章页

用户研究之文本研究系列-1：定性分析基础

1. 为什么要定性分析非结构化数据？

2. 定性资料的初步分析

3. 标准化定性分析方法

1：举例说明法

2：清点法

3：找出因素法

4：其他方法

4. 定性分析工具概览

你可能感兴趣的:(用户研究之文本研究系列-1：定性分析基础)