月初写了篇短文,谈的是教育公平在中国历史的意义。但很多朋友的留言却与文意无甚关联,都是在指责高考分数线不公平的。
高考的“分省限额制”,也是我一贯好奇的话题,刚好借这一篇文章作一点研究。
也欢迎点击上方“尽量有趣一些”关注我:)
——————————
我原以为“各个地区考大学难度差别很大”是个天然而自明的命题,根本无须再加论证。但看上一篇文章的评论,就好像不能这样说。
一位读者给我提的意见
不难看到,从一本到211再至985,各省份间录取率差距是明显的——虽然“上大学”确实已经不难了,但论上”好大学“,各个地区显然难度还是不一样。
以最接近全国水平的湖北/浙江为基准点
高考的分数线是如何划定的?我做了一点点资料的研究,也对两所北方985高校曾从事招生工作的朋友作了些访谈。首先可以明确: “名校”的分数线划定,行政的因素极少,更像是纯粹的市场化行为。
一所大学的在各省的“口碑”如何衡量,是极困难的问题,涉及的因素也甚多;但写文章也总要有结论,变量过多还可能过度拟合,总是得把复杂的问题作简化。(注:本章节数学内容略多,可以略过“模型选定过程”框中的全部内容,直接跳至文字结论,我希望不会影响理解)
简明的讲:尽管因素众多,但参阅Mcmahon对跨国留学生就学倾向和潘昆峰对P大招生的研究, 同类 学校的认可程度还是与"物理距离"呈极大的关联:考生离同类的目标高校愈近,认可度便愈高,愈倾向于报考。
我尝试引用潘昆峰基于“考生数、学校距离和省份人均GDP“三个变量的回归分析结果(如果不太熟悉图表,直接跳过看结论即可):
回归系数(绝对值愈大则正/负相关性愈强)显示,高校对目标省份的招生名额投放, 与该省份的考生数量和物理距离均显著相关,与该省份的经济水平不甚相关(2010年)。
由此,我们便可以尝试确定“211高校招生名额分省投放”模型的三个参数:
a.目标省份的考生数 量;
b.目标省份同目标高校的物理距离;
c.目标省份对高校的经济支持;
有了参数,还要选定模型。
上一个部分,我们将高校的招生比作需求-供给模型:
这是将高校的招生名额假定为产品供给,而考生“花成绩买录取”是消费行为。但招生-录取行为同供给-消费显然还不同:
一方面,211高校的“总产品”总是不愁销路的,这是个完全垄断的供给市场;另一方面,考生的消费却不是自由流动的——河北的考生并不能自由的去北京的市场买东西,各省份的市场间有极高的“贸易壁垒”。
我能想到对招生-录取的最“精确”类比,大概是前些年的iPhone的国际市场销售:无论在全世界哪个国家,新款的iPhone都是抢购情形,总是需要预约很久才能拿到。但在各个国家之间,购买iPhone又不是可以自由流动的。
日本的iPhone固然比中国便宜,但日版iPhone的制式却不能在中国使用——这是政策的壁垒(户籍限制);即使像港版能用的,内地的消费者还是得先花钱飞到香港去——这是经济的门槛(高考移民)。
我所学过的国际贸易理论,内有“引力模型”(gravity model)一说,那是指两国之间的贸易意愿,同双方的经济规模成正比,同物理距离的平方成反比——如果把经济规模替换为考生数量,似乎便可以得出一个简化版的引力模型来:
依着这模型,采取2017年的全国录取数据,便有如下的表格(可点击放大):
注释: 211,指含985在内的全国211高校,去除艺术类;
排名:按各省211实际录取率;
该省211招生计划数:指位于该省内的211高校,在全国的招生总计划数;
800公里内211数量:此处试取东中部省会间物理距离的均值,简化为只计算 距离各省会800公里内的211高校在全国的招生总计划数;
211招生期望数:指该省期望拥有的211招生计划数,参考211高校实际本地名额投放率(约40%),依照本地招生:周边招生=4:6之比例计算;
211录取系数:系本表运算结果,以211招生期望数/考生人数求得,系数越高,211录取越容易;
红字为“支援中西部地区专项招生协作计划”省份。
将输出结果以红色深浅排序(去除京津沪三个极值省份),目测颜色分布已比较接近实际录取率排名结果——但其中总有些省份不合预测,我们还需要考虑“经济支持”的参数:
综合上表可得:
注释:
高等学校生均教育经费投入:采自教育部网站,衡量各个省份对本省大学生的财政支持力度;
总和竞争力排名:系综合考量“211录取系数”(代表 考生数量与 物理距离变量)和“高等教育生均经费投入”(代表 财政支持变量),按照拟合系数1:1的比例进行的综合排名计算。数字愈小,排名愈高,愈容易被211高校录取;
偏离度:衡量模型运算结果同实际结果之间的偏差,=(“总和竞争力排名”-“211实际录取率排名”)/100;超过5%,视作明显偏离。 偏离度为正,意为在招生中受益,该省在更不利的条件下,花费较旁省更少的资源,获取了更多的招生名额;偏离度为负则反之。
结果看,这一简化版的“招生-报考引力模型”可以解释并拟合当前各省的211实际录取结果,可得的结论或许有几点:
一、高考的“分省限额”录取分数线的巨大差异,是由 各省考生数量、 本省及周边名校招生计划,以及 该省对高等教育的投资三项要素共同决定的。
二、主观的努力(多给教育投钱)可以弥补客观条件(人多学校少)的不足,典型如青海。
三、按照传统的七大区域划分(东北/华北/西北/西南/华中/华东/华南), 东北是我国高考受益最大的地区,东北三省的正向偏离度全部超过5%,在东三省教育投资并不更高的情况下,这意味着全国高校都给东北投入了更多的资源。
四、 华南是我国高考受害最甚的区域。全国高考最难的四个省份,华南三省(两广+海南)全部位列其内,其中还包括了海南(考生数最少之一)和广东(教育投资最多之一)这样某项参数有明显优势的行政区。
五、 地理位置仍然是决定高考分数线的极重要因素
(本段可略过)笔者选取了七个大区中高校数量最多的七个城市(北京、辽宁、上海、湖北、广东、四川、陕西),分别计算七个城市的高校对其他区域的招生名额投放,并与该区域考生数量作比,得出“投放优惠比例”:比例为正,意味着该区域得到了较考生数量更多的招生名额,比例为负,则反之。
(可从此处开始读)纵列的红色愈多,说明该区域获得的招生优惠愈烈;黄色愈多,则吃亏愈深;蓝色是该区域为自己投放的比例。
纵观整张表,东北区域显然受益最大。除华中外,所有的外区都在东三省投放了较考生比例更多的招生名额。而尽管各区都要照顾本区考生,东北对本区的照顾仍然最高(投放/数量比达到三倍);
鲜明对比则是华中和华南,所有的区域都在“欺负”这两个大区,给他们投放的招生名额都较实际考生数量为少。尽管广东省在财政上做出巨大努力(对应结果为本省高校的照顾比例也较高),但仍然不能弥补区域的巨大劣势。这同样也能解释湖北身为全国高教第四大省,却仍然是传统上的“高考重灾区”的原因。
六、 京津沪三市的高考优势,实在已经大到不像话的地步。有一种常见的解释(尤其常见于京沪),叫作“我们素质高”,或者“我们精英荟萃,竞争其实也不小”——京津沪的学生真的素质更高吗?京津沪真的如三地家长所言,高考其实也不容易吗?
这其实是个复杂的话题,大概涉及到我国高考制度的整体导向;但篇幅的限制,我们只能放在下一篇中解决。
本账号系私人维护,内容均系原创,主要兴趣领域为非理性主义哲学、美学及艺术史,更新频率不固定,更新内容不固定,欢迎转发谢绝转载——更欢迎大家点击上面蓝色的“尽量有趣一些”关注我:)