用大数据直接“判案”对考生公平吗？

机器的大数据算法，只是帮助我们进行判断的工具，而不是代替我们进行判断的“法官”。

文/廖德凯

一场公务员考试引发不少争议。

31岁的刘伶（化名）参加了2017年天津市公务员考试，报考天津市教育系统某机关处室。笔试排名第三，面试中排名第一名，总成绩第一，并通过了体检。但看起来铁板钉钉的入职，却突然发生了转折。她被天津市人才考评中心约谈告知，她的行政职业能力测验试卷被判定为“雷同试卷”，成绩取消。

此案正在走司法程序之中，因此，本文并不涉及按照法律与规则当如何进行判断是非的问题，只是从大数据背景下规则制定的角度谈谈大数据与公考规则之间的关系问题。

我曾长期参与公务员考试相关工作，比较了解相关的流程，因此可以基本判断不存在刘伶被“关系户”挤下去的问题，应当只是公务员考录部门根据“规则”作出的结论。但遗憾的是，这个“雷同”的“结论”是依据大数据算法规则得出，但缺少相关证据支撑，仅从程序上看，这一结论都很难让人信服。

具体来说，这一结论无法回答该考生提出的几个问题：雷同试卷的百分比是多少？判定技术和流程规则是什么？谁和我的试卷雷同？最终还是一个更加极端化的可能：按照雷同试卷判定规则，满分考生是否都是雷同试卷？

面对考生的问题，相信考录部门非常狼狈，因为这几个问题有的是技术问题，也有的是程序问题，还有的是公开性与透明性问题。但很显然，对这些问题相关部门并没有充分的准备。他们的判断依据，仅仅是大数据对比下作出的结论，无法回答考生提出的大部分问题。

按照这条新闻所反映的信息，评估中心仅仅是根据数据对比，得出刘伶女士的考卷与其他试卷雷同，但并没有其它证据进行佐证。刘伶女士考试时考室也没有违规违纪报告，工作人员解释，因为没有发现她的违纪行为，不会被禁考，只是本次成绩取消，以后还可以再考。他们同时解释，这是一种为了防止高科技作弊行为而使用的作弊甄别方式，“雷同试卷”不一定只出现在邻座之间，还有可能出现在不同考场。

从这些信息中只能得出一个结论：评估中心认为她“可能”有作弊行为，但就是这样一个没有任何证据的“可能”，却宣判了一个考生命运，如何能够服人？

说白了，这就是傲慢的规则过于信任大数据而忽略程序公正的结果。

在对公务员“雷同试卷”的判定过程中，科学的过程应当是：大数据分析得出某些试卷“雷同”，此时的算法结论不是判定“试卷雷同”的“最终结论”，而应当视为“举报”或者“示警”——考录部门接到“举报”后，有针对性地进行调查比对——根据调查的证据作出是否属于应取消成绩的“试卷雷同”情形。

如果片面地以机器的算法作为最终认定雷同的依据，一旦存在多人考出满分的情况，就是否会出现“满分考生均为雷同试卷”的荒诞结论，那这时候是不是要把这些满分考生全部淘汰吗？显然不能。

机器的大数据算法，只是帮助我们进行判断的工具，而不是代替我们进行判断的“法官”。

近年来，公务员考试逐步走向规范化，利用大数据判断试卷雷同其实也是规范化的积极探索。但是，算法规则的使用也需要“规则”，考录部门不能有规则的傲慢，而是要以更公开更科学的程序规则弥补技术规则的漏洞。

近年许多公务员考试中的争议，比如“专业不对口”，错一个字都被取消成绩的问题，大多是缺少科学的程序规则，没有科学合理的认定程序，而是生硬地以技术规则作为结论的结果。

我想，以生硬的技术规则来裁判考生的人生，这是公务员考试规则中应当避免的。

用大数据直接“判案”对考生公平吗？

你可能感兴趣的:(用大数据直接“判案”对考生公平吗？)