大规模的考试,要考虑诸多问题。
现代考试三方面基础:心理学,逻辑推理,
四个假设:人心理特质是存在的。心理特质看不见摸不着,需要根据学生的行为样本进行分析。
教育心理学中,更多说的是心里结构。
试卷出的难,对好学生有利。学生学科能力表现得好坏,对命题的难易程度有关。因此,试卷要有难有简单。
考试的心理学要求。需要列考纲。
例子:
考试的能力与行为变量的关系
每个知识有若干题考察。
试题三层次的理解:
1.测量单元,即定量化,能够以某种方式生产出定量的数据,即分数。
2.应有刺激情景和对应答形式的规定。
因此,对试题应该有三方面构成:
具体分析
对比两个题目:修改后的题目给了材料,考察的是逻辑推理能力。
以下题目,目的在解决问题,实际考察的却是分析问题,因此不符合要求。
以下题目:下列说法正确的是( )
严格来说这不是选择题,这是判断题的组合。命题中不允许出现。
以下题目,既要求学生有读图能力,有要求学生有计算能力。如果做错,很难分析学生哪个能力出了问题,因此,强调考察单一能力这一标准。但这样的题目可改,通过控制变量,如果考察读图能力,则计算尽量简单。如果考察计算,那么图尽量简单。
以下题目,实际上是考概念。但如果学生做错,到底是哪个概念没弄清楚?很不明确,因此不佳。
因此,提干材料选择要符合考察要求。
以下题目,答案应该是D,但前面材料严重影响学生判断。
这一材料,不能联系起来。
以下题目,题干并未告诉我们生命息息相关相互依存。法律也不会惩治好吃的陋习。
以下题目,学术性跟14周岁并没有关系。
每道题提干必须只能陈述一个问题。
以下题目你没有针对提干问问题。
以下题目,相当于问了四个问题,不明确考察内容。
因此,考察学生应该针对高水平低水平有不同取向。低水平高水平能力如下:
这一题目目标明确,考察高水平学习能力,很好。
选择命题还要做到:
大家不学都会做的题目,不要。
题干里不要有无关内容。
啰嗦内容,不要。
题干表述要明确,准确。
这一题应当改为:石墨能作为润滑剂,是因为( )
再如:问题表述不明确
热导体?电导体?傻傻分不清楚。
选择题命题,关于选项的要求:
一般来说,选项长度要差不多,语法要相对应。
以下题目,“春”太露骨了……
以下题目,C毫无逻辑关系,可立马排除。
不应该很容易就排除某些选项。
差题解析:选项设置不合理,题干表述不对。
好题!明确考察点,高水平考察。
主观题命题:简而言之,要合理合适。
题目还好,但如果这是一全省考题,会难倒所有坐车少的,农村的,海岛的学生。这一题存在潜在不公平。
主观题命题的语言,一定要非常明确准确。
对历史局势的认识,应当时客观的历史现实。但设问中,全是主观的认识。从答题的角度,答案全部错误!
要有综合性,要涉及多内容。
设问,答案应和材料保持一致。第四小题,问可以用到的设备,太过脱离初中生生活经验。
实验题:实验的目的,假设,装备装置,如何连接,如何获取实验数据,如何分析解释,得出什么结论。
有些题只是以实验为背景,而非实验题。
这才是真的实验题:
主观题还要注意:
要根据材料内容来哦!
主观命题还要求:
试题之间,相互提示或者依存,如理科题目中,两个小题之间互相依赖,在考试中是不允许出现的。
文科教育很有前途,未来将非常受欢迎。但是中国仍是理科多,文科少。文科教育存在最大的问题,就是注重背诵,而分析推理能力弱。表现在老师身上,就是不会出材料题。
所以,文科老师们,加油!
下一个重要内容:评分量产制定。
控制主观题评分的信度和效度取决于:
好的评分量表(标准)
评分过程按照量表要求进行——
良好的培训
有限的评分组织
有效的评分过程误差控制。
评分量表:
类型:
以英语作文评分标准为例,三个方面分别评分:
可用雷达图呈现。
评分法举例:
不同于传统按点得分,而且根据能力点评分。评价:评价对象,评价方法,评价分析。
如数学的建模,计算,结论……
以此为依托,评价学校教育的优劣之处,从而指导教学。
除此以外,赋分值也很重要。