二、名词解释
- 心理测验:测量一个行为样本的系统程序。或对行为样本的客观和标准化的测量。或通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。
- 再测信度:用同一个测验对同一组被试在不同时间施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。
- 信度:测量结果的可靠性,或测量结果的一致性或可信性程度。或者一组测量分数的真变异数与总变异数的比率。
- 内容效度:项目对欲测的内容或行为范围取样的适当程度。
- 误差:在测量中与目的无关的因素所产生的不准确的或不一致的结果。
- 结构效度:是指测验对理论构想的测量程度,又称构想效度。
- 常模:根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表。
- 等值性信度:用两个平行测验(同一测验的两个复份)在相距最短时间内测量同一组被试所得结果的一致性程度,其大小等于同一组被试在两个复本测验上所得分数的皮尔逊积差相关系数。
- 效标:是衡量一个测验是否有效的外在标准,独立于测验并可以从实践中直接获得的我们所感兴趣的行为。
- 测验等值:是通过对考核同一种心理品质的多个测验形式作出测量分数系统的转换,进而使得这些不同测验形式的测验分数之间具有可比性。
- 真分数:在测量没有误差时所得到的真值。或无数次测量结果的平均值。
- 自陈量表:为完成自陈人格测量而编制的测量工具。一般采用是非式或选择式。
- 项目区分度:项目区分度是指测验项目对于所测量的心理属性的鉴别能力和区分程度,也称鉴别力。
- 目标参照测验:根据某一明确界定的内容范围而缜密编制的测验。
- 效度:测验的有效性,即一个测验对它所要测量的特质准确测量的程度。或与测量目的有关的变异(有效变异)与实测值变异(或总变异)之比。
- 效标污染:是指由于评定者知道被试测验的原分数,而使被试的效标分数受到影响的情况。
- 锚测验:采用一组测验试题来关联两个待等值的测验形式,以便寻找两形式间的等值关系,这些测验试题即是锚测验。
- 测验的标准化:测验的编制、实施、记分以及测验分数解释程序的一致性。
- 标准分数:标准分数又称为Z分数或真分数,是以标准差为单位来表示一个分数在团体中所处位置的相对位置量数。
- 鉴别指数:是高分组和低分组在某项目通过率上的差别,是项目区分度的指标。
- 人格测验:是以人格为测量对象的测验,测量个体行为独特性和倾向性等特征。最常用的方法有问卷和投射技术。
- 离差智商:离差智商是一种以年龄组为样本计算而得的标准分数,其与传统的比率智商基本一致,韦克斯勒将离差智商的平均数定为100,标准差定为15。
- 成就测验:主要是在特定领域为检测应试者对有关知识和技能的掌握程度而设计的测验,是测量人在接受教育以后的学业成就的测验。
- 一般能力测验:测量个体在多种能力上的潜在优势的测验。
- 特殊能力测验:测量个体在音乐、绘画等特殊能力上的潜在优势的测验。
- 常模参照测验:以被试团体为参照背景,是以个体在团体中的相对地位来评价个体发展水平的测验。
- 标准参照测验:又称目标参照测验。以测验内容领域为参照背景对个体做评价,是以个体水平是否达到该领域某一固定标准来评价个体发展水平的测验。
28.实证效度:指一个测验对处于特定情景中的个体的行为进行估计的有效性,被估计的行为是检验测验效度的标准,所以实证效度又称为效标关联效度。 - 观念校标和校标测量:效标是衡量一个测验是否有效的外在标准,观念效标就是这个标准的理论定义,效标测量则是其操作性定义。
三、计算题:
某被试在一次由65人参加的成绩测验中得85分,排名第7,计算该生成绩(85分)的百分等级。
答:该生的百分等级为P=100—(100*7—50)/65=90假如某儿童4、5、6岁组的题目全部通过,7岁通过4题,8岁通过3题,9岁通过2题,其智龄为?
答: 以其全部通过的最高年龄为起点,6+42+32+2*2=6岁+18月= 7岁6个月
3.450名被试中,选高分组100人,低分组120人,其中高分组中有70人答对第一题,低分组有40人答对第一题,则第一题的难度是?(保留两位小数)
答:P1=70/100=0.7,P2=40/120=1/3,P=(0.7+1/3)/2≈0.52
4.在某个年级890名学生的期末考试中,对一选择题进行区分度测量,已知高分组和低分组各100人,高分组中答对70人,低分组答对40人,则这选择题的区分度是多少,并且根据伊贝尔的项目性能标准,该题目处在什么水平?
答:P1=70/100=0.7,P2=40/100=0.4,D=P1—P2=0.3;处在0.30~0.39水平,题目良好,修改后会更好。
5.某个选择题的区分度是0.7,则该题的通过率至少为?
答:D=P1—P2=0.7,P1≥0.7,则通过率P=(P1+P2)/2≥0.35
6.假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的A/B两个复本,所得的等值性与稳定性系数为0.70.我们还根据被试对每个复本的反应计算出分半信度为0.80。同时,我们让另一个评分者随机抽取50份卷子另外评分,得到评分者信度为0.92。
问:(1).各种信度的误差变异量与误差变异来源?
答:复本信度的误差变异量:1—0.70=0.3,变异来源:时间与内容取样;分半信度的误差变异量:1—0.80=0.20,变异来源:内容取样;评分者信度的误差变异量:1—0.92=0.08,变异来源:评分者差异;
(2).误差变异量的总和是?
答:0.20+0.10+0.08=0.38
四、简答:
- 编制心理测验的一般程序。
答:确定测验目的;拟定编制计划;设计测试题目;项目的试测和分析;合成测验;测验使用的标准化;搜集信度、效度资料;编制测验手册。 - 实施心理测验应注意哪些问题?
答:
(1)做好实测前的准备工作:准备好测验材料,熟练账务施测手续,熟记测验指导语等。
(2)为被试创造良好的测验情景,控制场地的选择,采光,噪音,通风条件,以及施测者的态度,语言,行为表情等。
(3)注意降低被试的的测验焦虑。
(4)与受测者建立良好的协调关系。
(5)标准化评分技术。 - 确定常模团体时应注意哪些问题?
答:群体的构成必须明确界定;
标准化样本必须是所要测量的群体的一个代表性取样;
取样的过程必须详尽地描述;
样本的大小要适当;
要注意常模的时间性;
要将一般常模与特殊常模结合起来。 - 什么是信度,估计信度的方法有哪些?
答:信度是测量结果的可靠性,或测量结果的一致性或可信性程度。或者一组测量分数的真变异数与总变异数的比率。测验自身引起的误差。
再测信度,复本信度,分半信度,同质性信度及评价者信度。
5.请简述内容效度的基本保证条件及适用范围。
答:(1)欲测的内容范围必须定义清楚,界限分明。
(2)测验项目应是所界定的内容范围的代表性取样。
适用范围:
(1) 内容效度最适合于评估教育和职业成就测验。
(2) 内容效度也适合于某些选拔和分类的人事(职业)测验。
(3)内容效度的评估一般不适用于能力倾向测验和人格测验。
6.心理测验的功能有哪些?
(1) 从实际应用角度看:选拔人才、人员安置、心理诊断、描述评价、心理咨询。
(2) 从理论研究角度看:搜集研究资料、提出和验证假设、实验分组。
7.影响信度的因素有哪些?
(1)被试方面
(2)主试方面
(3)施测情境方面
(4)测量工具方面
(5)两次施测的间隔时间
8.百分等级的优缺点有哪些?
百分等级属于顺序量表,表示相对位置,具有易于计算,解释方便等优点,较适用于不同的对象和性质不同的测验,且不受原始分数分布状态的影响。
缺点:
(1)原始分数转化为百分等级是非线性转换,单位不等,尤其在分配的两个极端。
(2)百分等级只具有顺序性,所以无法适当地将它加减乘除,致使大多数统计分析无法运用。
(3)百分等级是相对于特定被试团体而言的,所以,解释时不能离开特定的参照团体。
9.标准化的成就测验要满足哪些要求?
(1)命题组卷标准化。
(2)施测过程标准化。
(3)评分标准化。
(4)测验分数解释标准化。
10.Z分数有哪些性质?
(1)平均数为0,标准差为1。
(2)z分数有正、负,其绝对值表示原始分与平均数间的距离。正值表示原始分大于平均数,负值则相反。
(3)z分数的分布形态与原始分分布一致。
11.信度的作用有哪些?
(1)信度是测量过程中所存在的随机误差大小的反映。
(2)信度可以用来解释个人测验分数的意义。
(3)信度可以帮助进行不同测验分数的比较。
12.同时效度与预测效度有什么区别?
对于同时效度,测验分数与效标资料是同时收集的,而预测效度中,先获得测验分数,隔一段时间后,再收集效标资料。同时效度与用来诊断现状的测验有关,预测效度与预测将来结果的测验有关。
13.区分度的相对性与哪些因素有关?
(1)不同的计算方法,所得区分度值不同。
(2)样本容量大小影响区分度的大小。
(3)分组标准影响区分度。
(4)被试样本的同质性程度影响区分度的大小。
14.心理测验编制的基本程序是什么?
(1)确定测验目的
(2)制定编题计划
(3)编辑测验项目
(4)预测与项目分析
(5)合成测验
(6)测验标准化
(7)鉴定测验
(8)编写测验说明书
15.影响信度的因素有哪些?如何提高测量信度?
影响信度的因素有:
①被试方面:身心健康,动机,耐心,能力等
②主试方面:不安规定施测,给被试暗示,威胁等
③施测情景方面
④测量工具方面
⑤两次施测的时间间隔
提高信度的方法:
①适当地增加测验的长度
②使测验中所有试题的难度接近正态分布,并控制在中等水平
③努力提高测验试题的区分度
④选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度
⑤主试严格执行施测规程,评分者严格按标准评分,施测场地按测验手册的要求进行布置,减少无关因素的干扰
16.量表的四个水平及其特点。
1)命名量表:是水平最低的一种测量量表,只是用数字来代表事物或对事物进行分类,不能进行加减乘除。
2)顺序量表:不仅表明类别,还能表明不同类别的大小等级,或具有某种属性的程度,不能进行加减乘除。
3)等距量表:不仅有大小关系,而且又有相等的单位,因此可以加减运算,但没有绝对零点,所以不能做乘除运算。
4)比例量表:是最精确的测量,既有相等的单位,又有绝对零点,可以进行加减乘除运算。
17.心理测验四个基本条件。
(1)行为样本。从人的大量行为中抽取与测量的心理特质直接有关的一组行为进行测量,并依据对这一组行为的测量结果推断其心理特质和教育成就。
(2)标准化。指测验的编制、实施、记分以及测量分数解释的程序的一致性。
(3)难度或应答率。项目的难度是通过被试答对某一项目的人数的比例来确定的。
(4)信度和效度。信度指的是一个测验的可靠性,即用同一测验多次测量同一团体所得结果之间的一致性程度。效度指的是一个测验的有效性,即一个测验在多大程度上能够测到它所要测量的心理特质。
18.心理测量的特点是什么?
心理测量没有绝对零点,只有人定零点。
心理测量的单位不一定相等。
心理测量是间接测量。
心理测量具有相对性。
心理测量只能测出欲测心理特性中具有代表性的样本,而不能测出其全部。
心理测量强调客观性。
19.校标选取需要满足的条件是?
相关性,即校标与目前所评价事务有相关,并适合用这一个校标来度量。
有效性,即校标与所代表的特质间应是高度一致的。
无污染性,校标的度量不是基于或者部分基于正在评价的测量结果
客观性,由于校标往往是根据主观经验评定的,所以避免主观偏见尤其重要。
实用性,在保证有效性的前提下,校标可能简单,可操作。
六、论述题
- 试述成就测验与能力倾向测验、智力测验的联系与区别。
成就测验和智力测验、能力倾向测验的测量对象都是认知性特质。这三种测验都是测量个体从与环境的相互作用经验中发展出来的能力。所以在本质上,它们有相同之处。能力倾向、智力测验所测量的也可以看作一种“成就”。不过,如果从测验的目的、性质及所含盖的经验范围来看,这三种测验仍有某些不同之处,不能相互取代。
就测验的对象而言,三者本质上有重叠之处,无法加以截然区分。大多学者认为成就测验测量的是一些特定的、限定于某一范围的能力和知识,而另两者所测验的则为一般性的、较为广泛的能力。
从功能上看,成就测验也不同于智力、能力倾向测验。后两者的主要功能是预测一个人在未来的教育、训练或工作经验中可能的表现,它们的使用是在教育或训练程序以前,用以反映被试是否有接受某种课程或专业技能训练的能力。成就测验则是评估被试在接受一些教育或训练程序后所获得的学习成果,它的实施发生在教育、训练过程后。
在测验的技术品质上,成就测验要注重内容效度,而能力倾向、智力测验则必须有较高的预测效度,否则就失去其基本价值。
2.谈谈个人对某一类心理测验(人格测验或智力测验或成就测验或临床测验)的认识。
可从人格测验定义、编制方法、种类等方面谈及。
也可从成就测验定义及常见标准化成就测验谈。
或从智力测验定义、个别与团体智力测验种类谈。
或从心理健康问卷、儿童心智与行为障碍检测入手。
3.比较几种导出分数的优缺点。
按某种规则将原始分数转化为导出分数的过程称为分数的转化。常用的导出分数有百分等级、标准分数、T分数等。(1)百分等级优点为它是一种相对位置量数,它不受原始分数分布状态的影响,具有可比性,且具有易计算、解释方便等优点。其缺点是单位不等,尤其在分配的两个极端;只具有顺序性,而无法用它来说明不同被试之间分数差异的数量;解释时不能离开特定的团体。(2)标准分数优点为它是一个抽象值,不受原始测量单位的影响,并可接受进一步的统计处理;缺点是只能在两个原始分数分布形态相同或相近是才能运用Z分数进行比较,否则,仍然无法做准确比较。(3)T分数(标准分数变式)优点:具有等单位的特点,便于进一步进行系统分析工作;正态分布下,可以利用正态分布表将各种导出分数与百分等级分数做换算;正态分布下,运用某种变式分数可以将几个测验上的分数做直接的比较,即使是非正态分布,也可以运用由正态分布的Z分数转换而得来的变式分数进行直接比较分析。缺陷:分数过于抽象,不易理解;在非正态分布下,分布形态不同的变式分数,仍然不可以相互比较,也不能相加求和。
4.简要描述你小组的心理测量学专题研究思路、方法、过程、结论、成果等。