测试质量标准参考美国

美国是制定测试质量与公平性标准的先行军,其中,美国教育研究会(AERA)、美国心理学会(APA)、全美教育测量委员会(NCME)联合制定的《教育与心理测试标准》是国际心理测量和教育考试领域最具代表性和影响力的质量标准。 美国两大大学入学考试———SAT 考试和 ACT考试都使用这一标准对其考试进行规范和指导。  美国教育考试服务中心(ETS)制定的《ETS 质量与公平标准》(ETS Standards for Quality and Fairness)也在国际上具有一定的影响力。由于《ETS 质量与公平标准》专门为其机构定制, 能够充分体现出机构考试的特点和其核心理念。我们所熟知的托福考试、GRE 考试、托业考试(TOEIC)都是用此标准保障其产品的质量与公平。  在欧洲, 欧洲测试者协会(ALTE)制定的《实践准则》(Code of Practice)和《ALTE 考试良好实践准则》(Principles of Good Practice for ALTE Examinations)在国际上最具影响力。欧洲语言测试者协会自成立之初就致力于统一考试标准,促进考试证书在国际间的相互认可。英国剑桥大学考试委员会的雅思考试、剑桥英语五级证书考试(KET、PET、FCE、CAE、CPE)、英国高中课程考试(A-level)等考试都以欧洲语言测试者协会制定的质量与公平标准作为其考试的质量和公平性准则。  分析以上国际知名语言测试质量标准,可以看出其具有以下3 个方面的主要特征:  1. 测试公平原则和测试行为准则双管齐下。上述国际语言测试标准主要分为两类:测试公平原则和测试行为准则。测试公平原则较为抽象,阐述为:为维护测试公平应追求的价值和期望的专业行为,对测试实践起原则指引作用,如国际语言测试协会的《伦理原则》和欧洲测试者协会的《实践准则》。测试行为准则更为具体,对测试流程各环节应达到的质量标准详细阐述,可对技术细节进行指导,如欧洲测试者协会的《ALTE 考试良好实践准则》和国际语言测试协会的《实践指导准则》。测试公平原则和测试行为准则相辅相成,同一机构在制定质量标准时往往双管齐下。因此,在制定我国的外语测试质量标准时,既要以人为本,制定测试公平原则,关注各方考试群体的权利和责任,又要制定测试行为准则,对测试流程进行规范和审核。  2. 考试公平需要所有考试利益相关者承担应尽的协作责任。语言测试标准服务的目标人群比较广泛,一般包含考试开发者、被测者和使用者三类人群,并有随着语言测试理论和实践发展逐步扩大的趋势。其中以欧洲测试者协会《实践准则》的目标群体最广泛,覆盖范围从个体的考生、家长、教师、职员、命题人员、考务人员,培训机构负责人、学校负责人,到大的机构如学校、公司、出版社,再到政府及整个社会各方考试利益相关者。充分说明维护测试的质量和公平是一个“需要平衡各种利益冲突的复杂的社会过程”,反映了语言学习、教学、测评是一相辅相成、相互促进的过程,更体现出“以人为本”的教育考试理念。因此, 我国的测试标准不仅要对专业测试人员的行为进行规范,还需明确教育决策者、考生、考生家长、教师、学校、出版社等人群的权利和责任。  3. 标准的制定需要充分考虑制定和使用标准的环境。美国语言测试专家Bachman 曾指出,测试是为了满足教育系统乃至整个社会的需要而存在的,因此标准的制定要充分考虑标准的外部环境特征。其中《ETS 质量及公平标准》最具代表性,此标准是从《教育考试与心理测验标准》发展而来,但充分融合了ETS 的产品特点和核心理念,针对性、应用性和可操作性更强。因此,在制定我国语言测试质量标准时,不仅要考虑语言测试的共性,更要充分考虑中国环境下语言测试的特点和我国社会对外语测试的需求。语言测试专家Alan Davies 指出, 测试的黄金法则是“促进所有考试利益相关人的共同利益”,这里的所有人是指测试各环节的所有考试利益相关者。国家外语考试质量标准需针对三类人群: ①测试主办、研制和实施者;②考生;③测试使用者。如图1 所示,测试主办、研制和实施者主要包含测试主办机构、测试开发者、命题人员、评分人员、考务人员。测试结果使用者包含一级使用者和二级使用者。一级使用者是指使用考试做决定的人群; 二级使用者包括家长、教师、教材编写者、教育政策制定者、出版社、媒体等更间接使用测试的人群。
测试质量标准参考美国_第1张图片
  我国外语考试质量不仅仅要服务于测试主办者、研制者和实施者, 以专业质量标准规范考试各个环节,保证达到考试预期目标;也要服务于考生,提高测试效度,保障考试公平;更应关注测试结果使用者,特别是测试结果二级使用者,因为此部分人群是最缺乏语言测试培训的人群,虽不对测试负直接责任,却极可能将考试结果误读、误用。  此外,还有一个重要问题:在我国众多的测试结果二级使用者中,基础教育中的英语教师是一个重要群体,他们是教学过程的主体,也是形成性测试的主导者。开展形成性评价,为基础教育教师和教学提供服务是考试评价改革的重要部分,是提高教学效果的重要手段。但目前大部分英语教师缺乏专业语言测试培训, 有些课堂测试严重缺乏有效的质量控制机制,很难产生测试应有的效果。“教师若能经过普及语言测试知识的培训, 可以更好地理解语言测试的本质,更好地利用公开考试的数据为教学服务,更好地开发自己的形成性考试,让语言测试更好地为语言教学服务。”《教育规划纲要》提出,要加强中小学教师队伍建设。因此,制定针对日常课堂英语测试的标准应该做、也能够做;其和针对大规模高风险的专业英语考试的标准在内容与性质上是一样的,只是在深度与广度上有所区别。根据国际经验,不可能一个标准就解决所有问题,我们完全可以单做一个针对课堂英语测试的质量标准,通过质量标准将形成性评价和终结性评价结合起来,使语言测试更好地服务于语言教学。制定测试行为准则,需要对测试各环节进行细化规范。此部分至少要覆盖以下4 个方面:①测试开发阶段——制定考试大纲和命题手册,具有包括考试的目的与用途、考试内容、记分方式、试卷结构、分数解释,以及各类试题的命制方法和原则;②测试实施阶段——制定考务手册,包括考试时间、考场条件、考试指令等标准;③考试使用阶段——成绩处理、成绩报告、成绩使用等;④质量控制阶段——进行信度检验、效度研究。

你可能感兴趣的:(测试质量标准参考美国)