一篇文章读懂性格测试工具的信度和效度

谁不想了解自己?

前段时间好友给我一个链接:测试 “你的身体里住着谁” ,看看你的灵魂、心理和行为都和哪个明星或者人物相似。

诸如此类的测试层出不穷,多数人看到后的反应都是参与测一测吧,一方面会觉得好玩,更多的还是好奇,人总是对自己充满好奇,期待无止境的探索;


认识自己,了解自己,对自我成长非常重要;
如何选择一个靠谱的工具帮你提高自我认知呢?
那么我就要说说工具的信效度了。

什么是信度?

信度(Reliability)——对应的就是是否靠谱,学术的说法,在统计和心理测量学中的信度是说测评工具的整体一致性。高度可靠的分数是精确、可重复的,并且从一个测试场合到另一个测试场合一致。也就是说,如果测试过程重复测量一组被测,获得基本上相同的结果。

为方便大家理解信度,我们用画画来打比方。例如:老虎 – 被测对象;画家 – 测评工具;作品 – 测评结果。

心理测量的可靠性关系包括测量的准确性、精确性、一致性和无错误性。各种可靠性系数(值介于 0.00(很多错误)和 1.00(无错误)之间,通常用于指示分数中的误差量,记住越高越好。

美国劳工部专门有一个指南(见表1),帮助企业选择测评工具。

表1:美国劳工部关于心理测评信度系数的指南

什么是效度?

效度(Validity)对应的就是是否有效,具体来讲效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。效度分为三种类型:内容效度、准则效度和建构效度。

还是以画画来打比方,

回过头来,我们看信度和效度的关系会发现。信度是效度的必要条件,但不是充分条件。一个测量的效度要高,其信度必须高;而一个测量的信度高时,效度并不一定高。

两大类性格测评工具——

类型论、特质论的特点

目前市场上有的性格测试工具基本分两大类,类型论和特质论;

类型论,就是先把人分成几种类型,根据测试把你放进某个类型,类型论的工具比较流行的有九型人格、MBTI、DISC、HBDI等等;12星座看性格算不算?这个虽然不是测试工具,但也是把人按照12个星座归类,和类型论有相似的味道。

类型论的——

好处是易于理解,迅速将人归类,从而记住对方身上的一系列特点,而正是因为归类

缺点就是容易用类型往被测试者身上贴标签,忽视了被测试者实际的丰富性


特质论的工具例如HOGAN, 大五人格测试,Lumina Spark。涉及到自我探索,自我发展的课题,每个个体都是不一样的,自然是特质论的工具会来得更可靠一些。

记得刚才那个画画的比方吗?如果我们要知道对象是猫是虎,类型论很好用;如果我们要知道对方是个什么样的老虎,有什么优势以及可能的发展障碍,适不适合成为虎,用特质论会更可靠和有效。

以Lumina Spark为例

看测评工具的信效度

 

既然认真了,那就选一款靠谱又有效的工具吧,从自己裸辞出来创业起,在性格测试工具上我就选了Lumina Learning 旗下的Lumina Spark, 为什么?信效度是其中一个重要原因,当然还有其他原因,请参考我前一篇文章:【认证师约稿】工作20年余,我决定裸辞。对我而言,既然作为一名专业教练和咨询师,如果客户需要用工具提升自我认知,我一定会推荐可靠和有效的工具。


简单说一下Lumina Learning——

Lumina Learning由英国商业心理学会(ABP)董事Stewart Desson博士在2009年创立。以“大五”理论为基础,借助荣格理论的视角,结合积极心理学和成长型思维等最新的心理学研究成果,创新人才发展与识别的解决方案。在经历了10多年的持续迭代后,逐步形成了现在由Spark,Sales,Leader,Emotion,Select 和Team组成的从个人潜质识别,领导力提升,人才选拔到团队协作的6重立体解决方案。

其中性格特质的测评工具Lumina Spark研究了人的24个特质, 以及24个特质在3种不同面貌下的倾向;这三个不同面貌是潜在自我、日常自我和过度自我;Lumina Spark也是第一个能够研究24个特质在3种人格面貌下的样子的性格测试工具;

我们一起了解一下Lumina Spark的信度,也就是可靠性:记得吗,通常是0-1之间,越靠近1的分值说明工具越可靠,美国劳工部的数据说〉0.9就已经是优秀了,看下图,我不用说了。


资料来源:Lumina Learning Research and Validity

再来看看效度,前面说了效度中包含了内容效度、准则效度和建构效度,其中建构和内容效度很重要:

建构效度(construct validity)是用于多重指标的测量情况。此类效度也有两个次类型:

聚合效度(convergent validity):当测量同一构念的多重指标彼此间聚合或有关连时,就有此种效度存在。

区别效度(discriminant validity):此种效度也称之为分歧效度(divergent validity),与聚合效度相反。指不存在相关性。

建构效度最关心的问题是:测量工具(量表)实际测量的是哪些特征?在评价建构效度时,调研人员要试图解释"量表为什么有效"这一理论问题以及考虑从这一理论问题中能得出什么推论。建构效度要求对每个特征的测量背后有足够的理论支持,并且这些被测量的特征之间应该有合理的关系。

内容效度,也就是内容对不对,方法是跟经典的(被证明已经是有效的测量,比如大五人格测试等)内容做比较;

这里我们拿Lumina Spark与大五来做聚合效度测量,大家可以看到下表的很多数字的肩膀上有**,这一符号说明了Lumina Spark与大五在这一维度上的显著一致性;

资料来源:Lumina Learning Research and Validity


太多术语了?看的有些累?坦白说,我在写这篇文章时也查阅了很多统计学说明,再翻阅Lumina Learning总部有关信效度的长篇资料;

总之,我想说,如果想找一个靠谱的工具提升自我认知,启动自我发展,绽放美丽人生的话,记得Lumina Spark,可信有效,有料有范的工具。

你可能感兴趣的:(一篇文章读懂性格测试工具的信度和效度)