考试命题的基本方法和要求
曹公奇
衡量教学效果最重要、最有效的方法之一是检测考试,要考试就需要命制试题。命制试题是一项专业性、技术性、综合性较强的工作,需要命题者有着较强的学科专业背景和命题基本技术,还要有较高的对教育发展、课程改革、学情状况、测试结果等进行预测的综合能力。关于命题者的学科专业背景,这里暂且不说,只是谈谈命题的基本方法和要求。
一、考试的基本形式:
明确考试的形式和功能目的,对与命题来说至关重要。考试评价一般分成以下几类。
1.形成性评价:
形成性评价的考试,常用于教学过程之中,为了能够及时了解学生的学习效果,学习中遇到的困难,考查学生达到课程目标的程度,进而发现问题,解决问题,不断改进和完善教学、保证教学目标的最终实现。平时的单元检测、专项检测、月考等,都属于形成性评价,其目的不是为了预测,也不是为了评定学生的学习成绩。
2.诊断性评价:
诊断性评价的考试,就是在教学活动之前或者教学活动过程之中,进行的一种测验,是为了了解学情,考查学生的知识水平,或者是在教学过程中发现学生学习中存在的问题,以便确定后面如何进行有效的教学,或者是怎样有效的补救解决学习上的问题。比如新生的入学测验、平时的摸底考试、教学过程中的过关考试等,都属于诊断性评价。
3.终结性评价:
终结性评价的考试,就是学习活动结束后,对其学习成绩进行全面的检测,反映学生的学习成绩和教师的教学效果,作为一种评价结果。比如期末考试、毕业考试等,为学生学习评定成绩,为教师教学做证明,以便进一步改进教学。
另外,还有水平考试和选拔考试之分,毕业考试基本属于水平考试,如初中学业水平考试、高中学业水平考试等,是为了检测学生达到的学业水平。选拔考试,是为了通过考试选拔所需要的人才,如高考、各类招聘考试等。
中考,过去多数是把学业水平考试和升学考试合二为一。现在统一叫“初中学业水平考试”,应该说主要是属于水平考试,但还是兼有为高中阶段学校选拔新生的性质。
二、考试命题的基本原则:
1.目的性原则:
考试的功能是多方面的。目的不同,试卷编制的结构和试题的难度应有所不同。平常的检测主要是诊断教学内容的掌握情况,阶段考、期中、期末考试及学业水平测试则主要是检查考生的学习水平,而高考、竞赛等是一种选拔性考试,关注的是考试信度和区分度,目的各有侧重,命题要求自然不同。
2.层次性原则:
主要体现在试题难度设计上,应根据考生认知结构的差异性,按照教材内容的难易度,遵循《课程标准》的具体要求,编制具有一定梯度的不同层次的试题。一方面,试题本身要具有层次性,这主要体现在问答题中,即每一题中的各个小问题难度应有区别,要有一定的梯度,即使作为综合题呈现的难度大的题目,一般在其第1、2小题也应设计成较容易的问题(包括送分题),再往后面的小题,难度可逐渐增大;另一方面,整卷试题难度的分布要有层次性,通常是由易到难,由浅入深。
3.科学性原则:
编制试题时必须坚持科学性原则,题目本身绝对不能有科学性错误,同时语言表述要严谨规范,尽可能采用相应的学科语言。试题在语法和标点的使用上应该正确无误,按法定要求使用计量单位名称和符号。从命题的发展趋势来看,根据教育改革和课程改革的要求,可设计一些能充分体现科学研究方法、科学理论水平和科学精神等内容的试题。培养学生的科学精神和人文素养。
4.精炼性原则:
语言表达要精炼,每道试题应该清楚地提出一个或几个独立而明确的问题,学生阅读题干后能够明确知道命题人的要求,即不存在理解题意的障碍。题干要简单明确表述一个问题。
5.创新性原则:
命题思维本身就是一种创造性思维,无论改编试题还是新编试题,都凝结了他人或自己的创造性劳动。一种命题模式,往往具有一定的连续性、稳定性和灵活性。因此创新性主要体现在试题的新颖性,而试题的新颖性则主要反映在取材的新颖性、创设情景的新颖性和灵活性、设问的创新性以及考查知识、能力所占角度的独到性等方面。
三、考试命题的一般步骤:
1.明确考试的性质和目的:
要命制的试题属于什么样的考试,是平时检测、期中考试、期末考试,还是毕业考试、升学考试等,目的是为了检测诊断,还是为了选拔等,都必须首先明确,以便很好地把控命题的水准。
2.制定命题计划书:
要对全卷有个整体计划,需要制定出考试性质、考试目的、知识能力目标、试卷整体构想、试卷结构、题型、数量、基本考点等,为后续的命制试题做准备。
3.编制命题分项细目表:
分项细目表是命题的“大纲”。编制分项细目表,需要把每个题的题号、考查内容、能力考点、题型、认知能力层级、分值、预估难度等全部用表格的形式列出,作为命题的依据。后期命题时,严格按照分项细目表的要求去命制全卷。
4.搜集材料:
按照分项细目表的要求,首先搜集各个试题需要的背景材料、阅读材料、图表等素材。试题材料的搜集,需要考虑到材料的思想价值是否能够体现“立德树人”的宗旨,材料内容是否适宜考生阅读,文本是否文质兼美,语言是否规范经典,篇幅长段是否合适等因素,也可以根据命题的需要,对所选的材料做一定的修改。
5.编制试题及参考答案:
按照分项细目表对每一个题的要求,分别精心编写各部分不同试题,客观性试题要表述严密、答案唯一;主观性试题既要有开放性,又要放中有收,不无边际的发散开放。然后,精心编制整合全卷试题,再做出参考答案。开放性试题要有答案示例。
6.审查修改筛选:
命题人或审题人一一审查题目,看是否符合课标要求,是否与多项细目表的要求一致,是否符合学生实际等,根据审题结果,或更换试题,或重新筛选,或反复修改。以此往复,直至满意。
7.试答全部试题:
可让审题人或其他人试答一遍全部试题,检验试题的科学严密程度及难易度。再根据试答结果调整试题内容。
8.制定评分标准:
试题最终确定后,要制定好评分标准。分值大的主观试题,如何分点或分步评分;开放性试题,如何采意赋分,都要有详细的标准。
9.积累实测数据:
考试结束后,及时收集考试成绩与各种资料,积累难度、区分度等需要的数据,进行试题分析,为以后的命制试题提供借鉴帮助。
四、命题的基本方法技巧:
(一)改编试题:
改编试题是对原有试题进行改造,使之从形式上、考查功能上发生改变而成为新题。在拥有丰富题库的基础上,可以对原有试题或转换,或重组,或改变,也可以把教材上的试题进行重新改编。具体做法如下:
1.转换题型:把问答题改为选择题,很多问答题的命题材料是很好的,从考查内容和考查功能上来看往往是经典题型,但因出现较早,各种资料上都有,显得陈旧而往往被忽视。如将其压缩、升华或从其他角度设问,辅以选择项的巧妙设计,就可以成为一道新颖的选择题。其难度可升可降,因材而异。相反也可把经典的选择题用于简答题的设问中。
2 .重组整合:形式多样,结构复杂。在拥有较多试题的基础上,进行重组整合,命出新题。既可是同一题型之间的重组,也可是不同题型之间的重新组合。通常是根据考查目标、考查内容确定命题材料的重组,然后设问。
3.改变考查目标:就是在知识内容不变的情况下,改变原题考查的目标或能力,如把对某一概念的考查,由侧重于对文字表达那能力考查改为对图形转换能力的考查,或对计算能力的考查、实验能力的考查等。
(二)新编试题:
新编试题,即原创试题,重点体现在一个“新”字,即设置新情境,提供新材料,编制新试题。试题的设问要新颖、思维性强。新编试题,最大的问题是材料的局限性。从命题材料的来源来看,通常是可取材于报刊杂志、经典书籍等,材料一定要规范、经典。还可关注身边的生活事件、关注社会热点,这些也可以给我们命题提供丰富的素材和真实的生活情境。其次,有了好的材料,如何选择利用而改编成试题,难度也挺大。一方面要求命题者要有较强的专业知识,要对课程标准、学科教材有深入的理解和融会贯通;另一方面还要有熟练的命题技巧,对各种题型能够得心应手的命制。
命好新题应主要侧重于对教材的挖掘上。可以通过整合教材结构体系,从知识之间的相互联系上创新情境,提出新问题,还可以实现多种表述形式上的转换创设新情境、新材料展开命题。如把语言文字转换成图表、把表格转换成曲线图、把图、表格转换成文字等。
(三)难度的控制技巧:
试题难度的把握,主要靠对学情的了解和命题人的命题经验。因为,难度系数之类的数据,只有在考试结束后才能出来,命题的时候,主要是根据考试性质预估试题难度。所以,适宜的难度主要靠的是命题经验。
1.降低难度的技巧:
(1)改填空题、问答题为选择题,同时设置选项时注意适当增加选项的明显度,或者适当突显非选项的错误。
(2)分值较高的主观性试题,在问答题中增加辅垫性的设问,即多设问,降低赋分值,也就是降低了难度。
2.增加难度的技巧:
(1)改填空题、选择题为问答题,要求考生用文字陈述回答试题,适当增加答题的难度。
(2)减少设问,增加单个试题的赋分值,分值大的试题,就容易失分。实际就是增加了试题的难度。
(3)对试题难易进行适当搭配,一般说来,先易后难。要按一定的比例,合理设置难题、较难题、一般题、较易题、容易题的数量,显示出整个试卷的梯度和层级。
五、考试命题的质量指标:
从教育测量学上讲,考试命题的技术指标较多,每种指标说法也不尽相同,下面我们就说说常见的四种技术指标。
1.难度:
指试卷(题)的难易程度。一般用试卷(题)的得分率或答对率表示,所以难度事实上是容易度或通过率。 难度用p表示,其值在0~1之间,难度值越接近1,越容易;越接近0,难度越大。试题要有梯度,因此各试题的难度应有不同。一般认为,理想的难度值在0.5—0.7之间,高于0.7和低于0.3的试题不能太多。
难度计算办法: P=平均分÷满分值
例如:第一题平均分为7.5分,此题的满分值为10分,则第一题的难度P=7.5÷10=0.75。
再如:全班语文成绩平均为91.5分,满分值为120分,则这套试题的难度P=91.5÷120= 0.76。
2.区分度:
指试题对不同考生的知识、能力水平的鉴别程度。如果一个题目的测试结果使水平高的考生答对(得高分),而水平较低的考生答错(得低分),它的区分能力就很强。区分度与难度紧密相关,测验过难或过易,会造成考试者都通不过或都通过的结果,这样,测验也就无区分度可言了。
计算区分度的方法很多,特别需要注意的是对同一个试题的考试成绩采用不同的方法所得到的区分度的值是不同的。为了简单计算,我们可以使用下面的一种方法进行计算区分度:先将分数排序,P1=27﹪高分组的难度,P2=27﹪低分组的难度。
区分度D=(27﹪高分组的平均分-27﹪低分组的平均分)÷满分值。
例如,某题满分为10分,高分组与低分组的平均分分别是8.2分与3.3分,则区分度为:
D=(8.2-3.3)÷10=0.49
区分度一般在-1~+1之间,值越大区分度越好。试题的区分度在0.4以上表明此题的区分度很好,0.3~0.39表明此题的区分度较好,0.2~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好应淘汰。
3. 信度:
指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致性和稳定性程度。
信度描述测量结果的一致性、可靠性程度。评价考试结果的稳定性是用考试信度(或测验信度)估计的。由于任何考试结果都因考试误差的客观存在而受到或多或少的影响,因此百分之百可信的考试几乎无法得到。考试信度就是推测考试可信与否的最重要量化指标。信度计算的方法较为复杂,需要借助计算机有关程序进行,我们这里就简要举例说说信度的含义。如一次命题考试,优等学生得 90 分,中等学生得 70 分,薄弱学生得 50 分,并且第二次或第三次测验结果都基本如此,则这个试题就可信。如果第一次甲好,第二次乙好,第三次丙好,则这个试题就不可信。信度的计算方法很多,一般采取半分法,即把同样的题目印制的试卷分成分数相等的两部分,分两次测验,如果两次结果基本相同,则可信;如果两次结果相去甚远,题目的信度则有问题,需要查找原因。
在控制试题难度和区分度的条件下,制定操作性强的评分标准,减少评分环节的误差,适当增加题目数量,扩大试题的覆盖面,尽量消除考试中的干扰因素,就可以提高测验的信度。
4.效度:
指考试有效性或正确性的质量指标,考试效度的高低反映着考试是否达到它的预定目标,是否考了要考的内容。
估计测验的效度还没有十分有效的方法,一般常用内容效度,就是指测验试题对所要测量的内容具有代表性的程度,反映测验题目的选取是否符合《课程标准》的要求,是否恰当地反映出所要测量的要求与水平,主要用于学科测验。内容效度一般不用数量化指标来表示,主要依靠某种依据的基础上作出逻辑分析。提高测验内容效度的方法一般采用分项细目表来控制。
以上四种命题技术指标,是大家常用的。但这些技术指标,基本都是考试结束以后,在对试题的详尽分析中得出的准确数据。命题时,对这些技术指标的把握,主要通过命题人的自身的经验来预估,预估的技术指标是否准确,还要等到考试结束后,进行统计分析准确数据来验证。
六、命题时应注意的问题:
1.选择题的题干要简单明确表述一个问题。能够放在提干内的词语或句子,应避免在每个选项中重复出现。题干中尽量避免使用否定词和陈述句,选项与题干要协调而正确。选项一定要反复琢磨,认真推敲,表述准确,周到严密,保证答案的唯一性。
2.选择题中的备选答案,有一项正确答案,其他选项应有一定的迷惑性,几个选项的表述文字数量尽量相同或相近,在形式上显得长短一致,在选项上不给考生以答题的误导。另外,正确选项和干扰项要随机排列顺序,不要有任何规律,一般尽量不要用“上述答案都对”等类似陈述句作选项。
3.主观性试题问题要具体、明确。题目不要空泛,要让考生一读题目就能知道应该从哪个方面去作答,题干切记笼统空洞,角度要具体,指向应明确。另外,题目尽量不要形成提问的固定形式,要想办法避免题干问题的程式化。
4.开放性试题要结合文本,不能命制那些脱离了文本或题目也可以回答的所谓开放性试题。开放是在试题材料范围内或考查能力范围内的有限开放,不能是无限的开放,角度不限、范围不限、内容不限等,过度的开放,实际根本不能考查出学生真实的学习水平。
5.参考答案的编制一定要认真细致。客观性试题的答案绝对是唯一的,不能模棱两可;主观性试题的答案,要完整严谨,表述准确严密,可以分点作答,以便阅卷的操作性强;开放性试题,要做出答案示例,尽量做出2-4种答案示例,供阅卷参考。
6.整套试题应避免重复现象,涉及同一知识的多个题目之间,考查应有侧重,或者处于认知水平的不同层次。这点可以通过多项细目表的编制实现。一份测试卷内避免出现前面的试题为后面的题目提供答案或线索,或者后面的试题为前面的题目提供答案或线索。综合题要求有一定的梯度和层次,要有综合性,体现能力考核的意图。全卷的知识覆盖面要尽量广一些,要根据知识的重点确定试题分值的多少。全卷考点不重复,知识准确,板块清晰,结构科学,层次分明,总量合理。
命题是一个极度艰辛的过程,是一个深入思考的过程,是一个刻苦钻研的过程,是一个努力学习的过程。通过反复命制试题,不断进行总结反思,逐渐积累经验,才能真正提高我们命题能力和命题水平。
(刊发于《命题研究》2021年第1期,写作过程中曾参阅了网络上有关文献,特此致谢!)
2021.1.31.