灵碧山下提示您:看后求收藏(阿里小说网novels.allcdn.vip),接着再看更方便。
{详见:gbt7714
章建石.一项公平与效率兼备的高考改革为什么难以为继?——标准分制度的变迁及其折射的治理困境[j].北京师范大学学报,2016,:31-41.
mla
章建石.“一项公平与效率兼备的高考改革为什么难以为继?——标准分制度的变迁及其折射的治理困境.“北京师范大学学报1:31-41.
apa
章建石..一项公平与效率兼备的高考改革为什么难以为继?——标准分制度的变迁及其折射的治理困境.北京师范大学学报,31-41.}
一项公平与效率兼备的高考改革为什么难以为继
——标准分制度的变迁及其折射的治理困境
章建石
(教育部考试中心,北京)
[摘要]实施标准分制度是恢复高考后考试标准化改革的一项重大举措,试点和推广历时二十余年,涉及七个省份。与传统的高考分数制度相比,标准分在分数评定的精确性、人才选拔的效率以及对形式公平的保障上均有明显的优势。然而,在多重的制度变迁逻辑中,标准分制度并不能满足各主要利益相关者的诉求。社会对高考改革在科学与公平维度上的独特要求,政府在应对上的民意依赖等,使得这一整体上功能更佳的制度难以为继。高考改革既关系“民生”又涉及“国计”,双重的改革任务对治理方式提出了更高的要求。
[关键词]高考;标准分;制度变迁;社会公平
一、标准化:恢复高考后的一项重大改革
1977年恢复高考,举国沸腾,制度的重建让个体和社会看到了希望,但紧接而来的具体工作却是困难重重。“文化大革命”期间,考试理论和技术、高考相关科目的学科研究几乎完全停滞,考试的实践经验几乎为零,这给高考考试工作的各个环节都带来了前所未有的挑战。对此,原国家教委考试中心1主任、参与恢复高考工作的杨学为先生有着深刻的体会。
题型基本上是科举以来传统的贴经(填空)、墨义(简答)、策论(论述)等;命题没有基本的质量指标,仅有抽象的要求(如难、中、易),靠少数人“入闱”突击;评卷、分数统计完全靠手工操作;管理几乎没有必要的法规予以规范和遵循。当时的考试,时有科学性错误出现,试卷水平时高时低,试卷覆盖面窄,导致押题严重,死记硬背;评卷需要大量人员,评分误差大。2
这些问题表面上指向了高考的命题、阅卷、评分等技术环节,更深层次上指出了高考在扞卫“科学、公平”这一核心价值上的不足。客观而言,高考恢复后前几年的考试质量是可以打上问号的,这与特殊时代背景有关。幸运的是,这些问题及其带来的后果,很快就被一些刚恢复研究工作的心理学学者所关注。20世纪80年代初期,北京师范大学一批有志于推进考试科学化进程的学者,经过努力获得了几年的高考成绩数据,并且进行了严谨、科学的分析,得出的结果用触目惊心来形容一点也不为过。对此,一位当时领衔的专家回忆:
单看区分度,每年有150分左右的题目必须淘汰。更严重的是,大部分试题信度(可靠性)很低,效度(有效性)竟然出现了负值。……“有些文科卷子,只四大道论述题平分天下……拿语文来说,同一张答卷,五个地区打分能差出32分来,数学也差15分。3
显而易见,这些问题表明:高考这一把尺子出了不小的差错。如此权威的量具,如果丧失了科学性,公平性也将荡然无存。高考无小事,高考中存在的这些问题,很快得到了教育行政部门的回应。1985年1月,教育部在广州市召开第二届高考科研讨论会,就高校招生体制改革、定向招生、推荐保送以及考试科学化等问题进行了讨论。会后决定,广东省率先进行高考标准化改革的试验。试验采取“由点到面,逐步推进”的策略,即部分学科、省份先试,最后在全国推广。这期间,进行了若干重要的实践探索:
1985年,首先,数学在广东文、理科8万考生中试验,英语在广东英语类3000名考生中试验。
1986年,广东除数学、英语外,增加了物理;英语扩展到广东、山东文、理科;辽宁省文科,广西英语类共20万考生。
1987年,广东除数学、英语、物理三科外,增加化学、语文;英语扩展到广东、山东、辽宁、广西、四川、湖北、陕西等7省区,约40万考生参加;物理科扩展到广东、山东,约20万考生参加。
1988年,广东继续进行语文、数学、物理、化学、英语的试验,英语扩展到17个省区,物理仍继续在山东试验。
1988年11月15—18日,由国家教委考试中心主持,国家教委教育科学研究规划领导小组办公室参加,并邀请全国几十名教育、心理、教育测量、教育统计学专家及部分省级学校招生办公室负责人、高等学校招办负责人、中学负责人与会,召开了“广东省普通高等学校招生标准化考试试验评估会”。1
经过前期的试点和成效的评估,1989年6月27日,国家教委颁布了《普通高等学校招生全国统一考试标准化实验规划》,开始在全国正式实施标准化考试。
所谓标准化考试是指按照系统科学程序组织的,具有统一的标准,并对误差做了严格控制的考试。它一般包括命题标准化、考试实施标准化、评分标准化和分数解释标准化这四个环节2。基于这样的认识,标准化考试改革一开始的定位就非常明确,即把考试作为一项系统工作,以标准化为抓手,以命题、考试实施、分数解释等为切入点,来进行整体设计。各环节分别推出相应的改革措施,提升考试的科学化水平。具体的改革涉及三个方面:一是命题。根据国情研究并建立了高考科目的考试目标,制定高考的考试大纲,高考的考试目的、性质、内容、范围、题型等都做了详细的规定。二是考试实施。针对新设计的选择题题型,引入了光电阅读器和电脑阅卷,大大提高了阅卷的准确性和效率。对于主观题阅卷中出现的不同阅卷者评分之间的差异,也尝试借助电脑来进行监控,减少了多种误差,尽可能保证阅卷过程的公平。三是分数解释。以高考的分数报告为突破口,尝试将原始分转换为标准分。
标准化改革是我国高考发展史上的一次标志性事件,是恢复高考后的一次重大突破。从改革的紧迫性和必要性、改革目标的切适性以及对后续改革的影响来看,这次改革可以说也开启了我国高考考试现代化的进程。然而,时至今日,当年标准化改革提出的三项任务,其现实境遇差别很大。命题和考试实施方面的改革在原有基础上不断以累进的方式向前推进。具体而言,命题方面:高考的考查目标不断明晰,在学科层面不断细化。作为纲领性的文本,考试大纲几乎每年都要进行修订,1995年制定《高校入学全国统考命题工作章程》。考试实施方面:现代信息化与网络技术在考试实施中更是迅猛发展,从高考报名、准考证发送、考试安排、监考、阅卷到成绩统计和发布等各个环节,都可以见证科技进步所带来的高效和便利。各级政府部门在保障考试安全,扞卫考试公平上投入了大量的人力、物力和财力,成效显着。除了硬件上的投入之外,测量、统计的方法和技术也在阅卷中广泛使用。在多年试验、探索的基础上,2008年教育部颁布了《国家教育考试网上评卷暂行实施办法》、《国家教育考试网上评卷技术暂行规范》、《国家教育考试网上评卷统计测量暂行规范》(教考试[2008]2号)三个重要文件,这些措施对提高阅卷质量起到了积极作用。最后一个分数解释,令人惋惜的是,具体的举措——标准分改革在经历了多年试验之后又几乎退到了原点。标准分改革从1985年在广东试点开始,随后有关省份先后加入,截至1997年,推广到海南、河南、陕西、广西、山东、福建等省,涉及82万考生,人数约占当年考生总数的三分之一。另外有20个省(自治区、市)开始在高考模拟考试中尝试使用标准分,影响不可谓不大。然而,从2001年开始,以上试点省份纷纷停止使用标准分1,2007年广东省也宣布停止使用。时至今日,全国只有海南省还在使用这一分数制度。对于海南省的坚持,社会舆论中一直都存在质疑之声,2013年12月,国家权威媒体还以“标准分还能挺多久”为题进行了报道。
高考考试标准化三项改革的不同遭遇引人深思:同样的改革背景,同样的改革主导价值,同一个改革主体,同一个改革时间点,动用了同样的政策资源和专家资源,同样也有测量、统计方法在考试中的应用,甚至改革者的热情几乎都一样,为何唯独标准分改革昙花一现这项改革究竟触及了什么改革是否合理要回答这几个问题,就要先看一看标准分制度提出的动因及其本身的合理性。
二、制度变迁的动因:为什么要实施标准分
(一)原始分的局限
从考试行业的规范和工作流程来看,分数报告是考试的最后一个环节,通俗地说,就是把考试成绩告诉考生以及成绩的使用方。分数报告主要建立在测量与统计方法之上,采用不同的算法,就会得到不同的结果。其中,原始分是最简单的一种分数报告方式,通常被称为卷面分数,只要统计一下答对题目的数量,参照各题的分值,经过简单加法就能得出结果。如果把考生各科成绩的原始分相加,就合成一个原始分总分,这个值的大小就可以表明考生水平的高低,高校招生时也就可以据此来划线、录取。原始分简洁、明了,计算方便,这是优点。但是原始分的缺点也非常明确:一是分数的意义不明确,不能表明位次方面的信息;二是稳定性欠缺,没有可比性;三是不具备可加性。举一个简单的例子,某学生一次期末考试的成绩(均为原始分)为:语文80分、数学70分、英语85分,表面上看,这个学生的英语成绩最好、语文其次、数学最差,而实际的情况可能并非如此。如果不考虑各科的平均分,这三个成绩的优劣并不能加以判断。如果语文试题简单,平均分较高的话,该学生的语文成绩可能较差。如果数学试题较难,平均分低的话,该学生的数学成绩可能名列前茅。另外,原始分很容易受到试题难度、区分度等影响,而试题的这两个测量学指标只能在考试结束后才能计算出来,考试之前根本无法精确控制,因而原始分的不稳定性是显而易见的。如果同一个考生连续参加两次高考2,语文的原始分成绩都是80分,或者某个考生高考语文、数学的原始分成绩都是80分,从本质上来讲这里的80分根本无法进行比较,因为同一科目不同次、同一次不同科目考试的原始分单位分数的内涵完全不一样。就像在体育的全能比赛项目中,如果某运动员跳远的成绩是7米,跳高的成绩是2米,尽管两个成绩的计量单位一样,但跳远1米与跳高1米是不“等值”的。最后,原始分的不稳定性、单位内涵的不一致也决定了不能将它们简单相加。如果一定要加总,就如同把不同货币按照其面值绑定在一起,得到一个没有明确含义的结果。道理很简单,不同货币的单位值有不同购买力,1美元、1英镑和1元人民币的价值完全不一样,3个“1元”加在一起,只会带来更多购买上的不便。然而,在我国各级升学考试中,将原始分相加进行录取的做法早已成为习惯沿用至今。对考试成绩的误用或滥用,引起了政策制定者和理论研究者的关注。能不能找到新的办法来消除原始分的种种弊端标准分成为了理想的选择。
(二)标准分及其科学性
针对原始分存在的种种不足,统计与测量专家们提出了与之相对应的一个概念,即导出分数。导出分数是在原始分数转换的基础上,按照一定的规则,经过统计处理后获得的具有一定参考点和单位,且可以相互比较的分数3。其中,按照相应的规则和方法把原始分转化为导出分数的过程可称为分数转换。分数转换所采用的方法、算法和约定的规则不尽相同,导出分数的形态也有差异。标准分就是一种广泛应用的导出分数。
标准分是依据教育统计与测量的原理和方法把原始分转化为具有相同意义、相同单位和共同参照点,能表明考试成绩在总体中位置的分数。一般用z表示,是将原始分与平均分的偏差以标准差为单位表示出来的结果。用公式表示为:z=(xa)s。其中:z为标准分,x为原始分;a为全体被试原始分的平均值,s为原始分的标准差。从具体的算法来看,经过转化后的标准分,具有以下基本属性:第一,平均值为0,标准差为1;第二,分数之间等距,可以作加减运算;第三,转换过程属于线性转换,不会改变原始分的分布形状,也不改变原来分数的位置次序。其中的第三点非常重要,因为高校招生是按照分数的位置次序来录取的。标准分的这三个属性为分数使用带来了极大的便利。因为标准分的单位相同且以标准差为单位来衡量考生分数与平均分之间的距离,不管考生群体的平均分、标准差有多大差异,转换为标准分后,都是以1为单位来衡量考生分数与0之间的距离,度量标准统一且固定不变,因此不同科次考试的标准分之间就具备了可比性和可加性。但是,通过转换后得到的标准分在一般情况下都带小数,而且会出现负值。在大规模考试中的取值范围一般在-3到+3之间。这对实际使用很不方便,也不符合传统习惯。测量学家提出的做法是对标准分进行线性转换,转到更大的标准分数量表上,以消除负数和小数点。转换的通行做法是将标准分乘以一个常数,再加上一个常数,两个常数的值不一样,最终得到的标准分结果也不一样,常数的选择可以根据需要、以约定的方式来确定。目前,国际上一些重要的考试和心理测验都是以这样的结果来进行分数报告,如托福、sat、gre、各种智力测验等。我国当时标准分试点采用的转换公式为:高考成绩=500+100z。值得注意的是,这里的线性转换尽管引入了两个常数,但对所有考生的分数都一样处理,相乘和相加的效果具有普惠性,同样不会改变原始分的分布形状和位置次序,只是放大了刻度而已。需要指出的是,标准分转换的一个前提是原始分正态或接近正态,对于非正态的情况则需要通过一定统计方法来强行正态化。这种转换在方法上并不复杂,在考试行业中也很常用。本文关心的核心问题是:对于原始分的一系列统计处理,会不会带来原始分位置次序的变化会不会最终影响考生的录取情况
(三)标准分引起的考生位次调整
在高考中,从考生的卷面成绩即原始分转换到最后的报告分数即标准分,经历了以下几个关键的技术处理,分别是:(1)单科的正态化处理;(2)单科的标准化;(3)单科标准化后的线性转化。考生总分的合成,在单科上述三个步骤基础上,再加上(4)总分正态化;(5)总分标准化;(6)总分标准化后的线性转化。因而,标准分实施后,考生的成绩已经经过了以上复杂的技术处理,考生拿到的高考成绩单也发生了很大的变化,分数变得相对难以理解1。技术本身的复杂性客观存在,但在科学性层面的改进也是非常明确的。但一个不得不承认的现实是:在上述技术处理过程中的步骤(4)会引起考生位置次序的变化,也就是说,考生总分的原始分位次与总分标准分的位次是不一样的。这是标准分的核心技术之一,它充分考虑了试卷难度以及原始分的标准差,是避免原始分弊端的合理做法。然而,在依据总分进行录取的招生体制下,成绩的高利害性决定了这种变动的高度敏感性,很可能影响一部分考生的录取。对此,在试点过程中也有过专门的分析和探讨。
广东省在试点过程中对原始分和转化后的标准分进行了对比分析,计算了两者之间的相关系数,总分的相关系数达到0.984,说明原始总分在转化前后的顺序变化很小2。考试中心也就分数转换对录取分数线上下人数的变动进行了研究,结果表明:“上、下线的考生每年约占录取考生的7%”1。有关省份也进行了类似的分析,结果也差不多。如:1994年的高考结果表明,所有上录取线的考生中,文史类、理工类和外语类各省高分段前三名考生的原始总分位置在标准分转换后未发生变化,其他考生有不同程度的变化,但大多数变化幅度很小,对录取不会带来实质性影响。对于原始分位置处于录取线边缘的考生来说,这种变化幅度也不大,范围也很小,变化的人数仅占上录取线人数的6%-7%2。这个比例对于部分考生的影响有两种情况:一是在原始分中被录取而在标准分中落榜,二是在原始分中落榜而在标准分中录取。这对部分考生的个体利益调整是非常大的。在社会改革中,利益的调整是不可避免的,关键是基于什么样的价值导向。常用的标准是科学与公平。如果把标准分的实施放在科学与公平这两个广受认同的价值天平上来度量,情况将会怎样
从技术上来看,标准分较原始分在科学性上具有明显优势。在高考总分录取的现实规则下,标准分充分保证了分数的可加性,维持了各个科目在录取中权重的稳定性,避免了试卷难度差异给招生带来的不稳定性。最关键的是它能够全面反映学生的真实水平,对中学教学的反拨作用也很积极,能够引导学生全面发展,尽量避免出现偏科现象3。“分数面前人人平等”一直是我国现阶段高考制度核心的价值宣示,这是全社会在高考分数使用方式上最具共识的要求,甚至成为社会公平的底线。但是,践行这一核心价值的前提是高考分数评定的科学性,这是保证分数使用公平的基础。标准分的实施本质上是用更加合理的方法来对每一个学生的成绩进行处理,分数的评定以及对考生能力的评估都更加准确。它对于整个高考制度无论是在科学和公平的维度上,还是在高等教育入学机会这一资源的配置效率上,都起到了积极的促进作用。从这一点来看,它的实现方式——对考生位次的重新排列以及由此带来小部分考生的位次变动,恰恰是有理有据,而且是公平的。
三、标准分制度变迁的多重逻辑
在高考中采用标准分是一项以统计技术为基础,通过赋予分数更为准确、科学的内涵的重大改革举措,它使得考生在测试中享有被更加公平对待的机会。可见,标准分绝不仅是一项技术变革,它所带来的影响是深远的。从初始设计,到试点、成效评估、推广,标准分改革在获得技术理性的保障后始终是按照制度变迁的逻辑来逐步向前推进。在相关标志性的政策文本中,标准分都被定位为一项制度,如《普通高等学校招生全国统一考试标准化实施规划》(教试字[89]1号)要求1992—1995年应在全国建立起高考标准分制度。在1994年国家教委颁发的实施方案通知中,标准分制度更是直接出现在文件名称中4。
标准分对原始分的替代是一个典型的制度变迁过程。在这个过程中,不同群体带着各自的利益诉求参与其中,构成了制度变迁的重要推力,也生动演绎着不同的制度逻辑,并最终诱发和塑造这一领域中相应的行为方式。制度诱发具体的可观察的微观行为,对于一个特定领域中制度逻辑的认识可以帮助我们把握和预测这些行为。而不同群体的行为方式及其相互作用有助于认识这些制度逻辑5。因而,对原始分向标准分制度变迁中各个群体行为变化的对比分析,则能够更加清晰地展示制度逻辑,并揭示制度变迁的动因以及成败的原因。
(一)政府部门的逻辑与演变
无论是从制度变迁目标的确立、推进模式的选择还是对各种资源的发动来分析,标准分制度的实施都带有显着的强制性制度变迁的特点。处于权力结构中心的政府部门在其中始终发挥着主导作用。政府是整个高考制度的设计者,并承担着维护制度核心价值的责任。在我国,高考是政府以分配高校入学机会的方式来配置高等教育资源的一种制度安排。因而,围绕高考的相关改革,能否满足资源配置的效率及公平要求是两个重要的评判标准。这两个标准在高考中的操作性定义为:通过考试能够把真正有潜力的学生选拔出来,并且确保以这一标准来对待每一个考生。前者涉及考试的效度,后者与考试结果的使用方式息息相关。立足这两个标准,可以看到:标准分制度在评分这一考试的核心环节发挥了提高考试效度的作用,实现方式是采用更为科学的统计方法来提高考试结果评定的精度。另外,在高考总分录取规则不变的前提下,结果评定精度的提高使得考试结果的使用筑牢了科学的根基,在公平维度上的改进也是显而易见的。
对新制度在效率与公平维度上潜在收益的预计以及与可能要付出成本之间的衡量,贯穿于标准分制度变迁的始终。“一个社会通过何种制度变迁方式来获取这一潜在收益,则主要受制于这个社会的各个利益集团之间的权力结构和社会偏好结构”1。在我国现行的政治体制中,政府在权力和资源分配能力的对比中拥有绝对的优势,从根本上决定了制度变迁的方向、路径和程度。因而,在制度变迁的不同阶段,尽管政府在权力结构中的地位不发生变化,但其偏好的选择却会随着政策效果的显现而发生变动,这在事实上会改变成本与收益比较的范畴。比如进行政治层面的考察与衡量,这更不可能建立在对成本与收益准确测度的基础上。
在规划、设计之初,政府对标准分制度社会收益的预期是理性而有说服力的。遵循公共产品供给的基本逻辑,尽管难以进行准确的度量,但在增进整个高考制度的社会福祉上作用明显。与社会收益相对的社会成本同样难以预计和准确度量,这不仅因为内涵界定和计算上的难度,还在于社会行动的“非预期结果”2的普遍存在。需要强调的是,这里的社会成本指向的不是经济学视域中的自然资源,也不仅仅是社会学视域中社会资本的衍生内涵,而是包括那些“引发社会动荡的潜在社会风险积累的社会性因素损害”3,表现为“涉及社会个别成员和集团的负担、损失、痛苦、牺牲或辛苦的现象”4,以及由此带来的社会分化、社会不安、社会对抗和阶层对立。随着标准分制度的实施,由于标准分转化的专业壁垒以及由此带来的成绩理解上的困难,来自家长、中学和社会的消极反馈不断增多,质疑、反对的话语逐渐占据主流,引起了政府领导者的关注。标准分开始从一个社会议题逐渐转变为“社会问题”。在这个过程中,政府开始调整自身的偏好结构及其权重,民众的反响越强烈,社会成本越大,政治层面的偏好就越容易以压倒性的优势取代其他方面的偏好。20世纪90年代末到21世纪初这一时期有着特殊的社会政治背景。在维护社会稳定的语境中,社会成本累积所引发的社会治理风险是各级政府不愿意看到的情景。对这种风险的极力避免在标准分制度实施后期越来越成为政府主要的偏好。最后,政治上的成本规避最终全面取代预期的社会收益。成本—收益分析的经济、社会尺度彻底让位于政治尺度,标准分制度随之也被迫戛然而止。至此,这样一次拥有更高效率、更具实质公平、更多社会收益的制度变迁,在政府这一制度供给方天然具有的政治偏好面前败下阵来,甚至表现得不堪一击,不能不令人惋惜。从长远的观点来看,这样的选择实际上要付出更加沉重的代价:对制度变迁中社会成本的泛政治化考量使得改革的努力锁定在原有的制度结构中,并且还会以路径依赖方式影响后续的改革进程。时间越长,新的利益均衡就越难形成,即使面临变革的最佳窗口期,“制度供给方意图从锁定中走出来,也极有可能在既得利益面前犹豫不决而错失良机进而再次使制度变迁落后于时代发展和社会进程”5。如今,放眼全球,国际上诸多有着广泛影响的大规模教育考试,在成绩报告上几乎找不到使用原始分的例子。
(二)考生的制度逻辑
对考生而言,高考是争取优质高等教育资源并以此来实现个人发展的基础。高考在实现代际转换、提升社会地位、改变个人命运上都发挥着无可替代的功能,考生在这一社会上升通道上都应当拥有同等的机会。经过特殊时期的多年禁锢,公平的机会越发让人珍惜,因而,国家一宣布恢复高考,社会对该举措的预期很快稳定下来并迅速沉淀为共有信念,制度在这种预期稳定和共有信念形成过程中产生,并作为均衡的概要表征并协调着参与人的信念1。时至今日,高考作为中国社会最为公正的人才选拔制度拥有广泛的民意基础以及很高的信任指数,甚至早已被建构为共同的社会心理,“分分计较,每分必究”、“分数面前人人平等”、“虽然‘一分之差,天上地下’,但老百姓能接受”2等就是这种心理在高考成绩使用上的具体投射。这也是高考成为高利害性考试的关键。
在当下讨论教育改革、高考改革的语境中,形式公平得到了政府、学界和社会的广泛认同,被认为是“教育公平的第一步”、“第一维度的公平”,全社会在这方面的努力有目共睹,可谓不遗余力。有关高考改革的任何举措,如果与形式公平相抵触,则很难持续。然而,标准分制度的境遇更加复杂,甚至令人费解。一般而言,形式公平是通过制定一个统一的客观标准来实现。以此来看标准分制度变迁,它没有触及高考招生以分数高低来录取的客观标准,也就是说没有违背社会认可的形式公平。相反,标准分采用的统计分析方法使得高考的分数评定更加精准,更符合每一个考生的实际水平。对此,“标准分制定实施方案”中有明确的表述,即能够“使考试分数更科学、准确地反映考生水平”。从这一点来看,标准分制度恰恰是在高考分数的使用上保障并改进了形式公平。这带来了一个令人深思的悖论:追求形式公平的目标没有变,采取的措施更为科学,为什么就没有生命力
制度变迁和具体制度安排的调整要以满足人们的需要为出发点,以尊重每个人切身利益为主要手段,才能充分调动制度变迁主体的积极性和内在动力3。如果我们坚持:个体视角下制度变迁的逻辑在于期望获取更多的个人收益,那么,标准分制度在科学保障形式公平的基础上也达成了这个目的,只不过是在没有外部额外利益输入的前提下采用了调整个体利益分配的方式。在制度变迁过程中,由于技术进步而引发局部利益调整是经常性的,但能否被各利益相关者接受却受制于很多复杂的因素。
在现行国家招生管理体制中,高校年度的招生人数是由教育行政部门按计划来审核确定,招生计划一旦确定,没有特殊原因一般不会增加,即使需要追加,数量也非常有限。这表明:国家每年提供的高等教育入学机会是确定的,每一个考生依据高考成绩来参与这一资源的分配,在这个过程中,考生是利益博弈的主体,遵循共同约定的规则来使自己的利益最大化。原始分制度实施多年,考生的利益格局在这个制度下达到了均衡状态。无疑,标准分制度改革以“整体利益既定,局部利益调整”的方式打破了原有的均衡。“整体利益既定”意味着在高校招生计划确定后,不管采用哪一种分数制度,有资格上大学的考生总数是一定的。“局部利益调整”则主要针对原始分处于录取线边缘的考生,在标准分制度下,大约7%左右的考生在两种分数制度下会发生录取与否的变动。这个群体正是标准分制度进行局部利益调整所涉及的主要对象。虽然其范围不大,但产生的影响却撼动了整个高考制度的形式公平。与原始分的直观、简单而且考生可以自行计算得出成绩相比,标准分经过了复杂的统计处理。这种分数转换带来的影响是系统性的,因为各个高校的录取分数线不一样,对于报考某个高校的考生来说,分数转换前后都会关系到能不能录取。这理所当然地让考生产生了这样的疑问:我的标准分成绩到底是怎么得出的分数究竟是调高了还是低了经过转换,是不是吃亏了分数处理得对不对有没有暗箱操作4针对这些问题,政府部门在前期做了大量的普及性工作1,但成效甚微。考生似乎并不在意媒体的正面宣传和专家的权威解读,显然,考生关注的不仅仅是标准分计算的科学性,更在乎形式公平的自我确证——一种自行计算就能得出结果的方法以及由此带来的公平感。这是除了个体收益外需要考虑的另一个更为重要的制度变迁逻辑。然而,标准分制度在这方面却有着天然的缺陷,分数转换中复杂的统计在成绩理解上设置了较高的专业壁垒,这无疑给公平感的自证带来了很大难度。
(三)专业群体、中学与高校的制度逻辑
专业知识的积累及社会科学的进步是推动制度变迁的基础。拉坦(ruttan)认为制度的供给依赖于知识基础和创新成本这两个因素,并指出社会科学和有关专业知识的进步能够降低制度发展的成本2。林毅夫也指出:制度安排选择集合受到社会科学知识储备的束缚。即使政府有心建立新制度安排以使制度从不均衡恢复到均衡,但由于社会科学知识不足,政府也可能不能建立一个正确的制度安排3。然而,在标准分制度的变迁过程中,作为专业知识的提供者,专业群体在论证、规划和实施过程中提供了充分的智力支持,确保了改革方案的科学性,并尽可能突破原有社会科学知识的局限。据不完全统计,前后共有数百位专家、教授参与了这项改革。仅在1988年的11月,国家教委就邀请近百名专家对广东等省的试验进行评估鉴定。这还不包括各级教育考试机构内部的专业技术人员。需要强调的是,知识分子参与高考这一公共产品的供给并没有直接的利益诉求。作为专业群体他们也不是标准分制度直接的利益相关者。但是,公共产品供给的效率、服务质量、公平与否等是他们所关注的。高考制度本身的理性改进和不断完善是相关学科公共知识分子承担的重要责任,参与标准分制度改革可以看作是他们在这方面的努力,可以此来促使高考在分数评定和分数解释上更加科学、合理,也更具实质公平的内涵。可见,专家群体制度变迁逻辑是清晰的,即通过对制度理性的追求来实现一种新的制度均衡状态,这种制度状态指向科学、效率、公平等方面的预期,最终服务于增进个人和社会福祉的目的。
高考衔接着基础教育和高等教育,它从基础教育中选拔人才,为高等教育输送人才。在高考成绩已经成为事实上评价中学教学、高校生源优劣核心指标的背景下,高考的上线率、重点率以及生源争夺中的高分学生数量,已经成为中学和高校在高考制度中实现自身利益的主要指标,甚至是相关工作人员主要的工作业绩,这两个群体的制度变迁逻辑以利益权衡的方式来展开。可以看出,上线率、重点率和高分学生数量等指标指向的是群体特征,不针对具体的考生。对这些群体统计指标的关注在很大程度上掩盖了标准分制度之于个体的价值以及制度整体层面的收益。一方面,由于无法了解标准分替代原始分后考生位次的变动情况,考生的录取情况也就不能在两种分数制度下进行比较。上线率、重点率到底是上升还是降低似乎成了一个“黑箱”。另外,标准分还消除了考生在每一道试题上的作答与得分之间的简单对应关系。中学无法对学生在高考中的表现进行精细的分析,教研人员也难以进行深入的“试题分析”,并以此来指导后续的教学和备考工作。这在很多教师和考生看来是对原有教学和高考复习工作的“严重干扰”。另一方面,由于上述同样的原因,高校也无法了解不同的分数制度对生源质量会带来什么样的影响。在仍然是依据分数高低来进行录取的招生模式中,高校争夺生源的标准没有变化,只不过是在新的分数制度下进行。尽管“标准分制定实施方案”中明确提出了实行标准分能够“为高校招生录取提供更科学、准确的依据”,但在缺乏效度追踪研究提供充足证据的前提下,标准分制度对高校招生工作的价值同样道不清、说不明。因而,收益不明确是中学和高校在标准分制度改革中动力不足的重要原因。对高校而言,标准分制度似乎无关利害,可有可无。而中学的抵制更加明显。因为标准分的实施使得中学既定的利益争取方式——通过深入分析高考试题和学生作答来改进教学和备考并最终取得高分——不再可能,这对中学在既得利益的维护上带来较大的风险。尽管标准分制度有利于打破中学教学应试化的僵局,也更加符合基础教育改革的宗旨,但在现实利益得失的权衡面前,这种事关全局的、长远的、深层次的意义却显得那么虚无缥缈和苍白无力。
四、高考改革:特殊的公共事务治理困境
在高考改革领域,不同群体的制度逻辑交织在一起,展现了多重逻辑下制度变迁的难度,也为改革本身勾勒出了各种限制的基本轮廓。人、制度、文化是描述和解释人类行为和存在状态的三个元素性概念1。传承一千多年的科举制度虽然在形式上已废止百余年,但其内核已然构成了中国社会文化的重要组成,并且为当下的高考改革、教育改革甚至社会改革塑造了先验的、相对稳定的认知模式。文化就以这样一种模式无形地制约制度变迁与创新的进程。然而,个人在既定的文化约束中仍然有着广泛的自主裁量和选择的空间,“在一种制度选择的环境中,个人如何评价预期收益取决于个人所能得到的有关替代规则下的收益(或损害)的流量与继续使用现有规则所产生的收益(或损害)的流量相比较的信息。”2因而,一项功能更好的制度安排能否成为新的历史结果,需要摆脱的束缚往往超出预计,而且也复杂得多。
收益与成本分析是制度经济学研究制度供给的一个常用模式,其简化的理论推导如下:当制度变革的收益大于其成本时,就产生对制度创新的需求,这一需求必定诱发实际的制度变迁3。然而,这远远不能解释标准分制度变迁的过程。在多重的制度逻辑下,收益和成本类型是多样的,重要性可以转换,而且无法进行测度、比较进而取舍,而在“一个权力中心决定制度安排的基本框架并遵循自上而下制度变迁原则的国家”4中,政治上的要求可以压倒一切。也就是说政治收益或成本上的估计可以随时取代其他方面的权衡,成为决定制度变迁成败的关键。在当前正在悄然兴起的民意政治潮流5中,对于代表广大人民群众利益的政府而言,获得民意支持是最重要的收益,这似乎成为政府作为权力主导者提供新制度安排的能力和意愿的决定因素。在标准分制度试验的中后期,源于考生、中学、大学等群体的民意动摇了政府对坚持这一改革举措的信心。尤其是来自考生的反馈更是把广受社会关注的“公平问题”凸显了出来。这很容易触动政府部门的“神经”,并刺激政府重新衡量这项改革收益。在现阶段,高考公平与否极易带来很大的社会治理风险。因而,对这些风险的规避,并尽可能维护现有民意,成为政府部门的倾向性选择,尽管这不能增加政治收益,但却能降低政治成本和社会风险。
那么,标准分制度有没有对传统认可的高考公平观带来颠覆性的冲击呢公平有不同的内涵,对于当下我国社会发展阶段中的高考制度,形式公平是其核心,获得了社会各界的广泛认同。对形式公平的追求,既体现了“不患寡而患不均”这一传统文化的价值传承,又有科举制度这一样本的经验塑造,更为关键的是它贴近我国社会发展的现实需要。在标准分改革中,相关群体(以考生、家长为主,包括部分中学)对形式公平的诉求成为一种民意,并给政府部门带来改革的压力。然而,他们扞卫形式公平的方式却显得有些盲目。实际上,标准分正是期望通过技术改进6来以更加科学、合理的方式保障形式公平,根本没有突破形式公平的“企图”和可能。可惜的是,这种更加科学与合理的方式由于其专业性而无法得到大众的理解与认可。广大考生无法通过卷面的计算来得出各自的成绩,也无法了解哪些考生在分数转换后发生了位次变化,只是模糊地感觉到“分数被动了”,这在全体考生中营造了一种不确定性和不安全感,进而产生一种被不公平对待甚至暗箱操作的假象。实际上,针对标准分的专业性,政府部门做了大量通识性的解读和技术培训工作,但很快淹没在了社会各界的质疑声中。这种质疑指向的不是专业性本身,而是由专业性所引发的破坏形式公平的嫌疑。然而,需要进一步思考的是,为何这一实质上促进形式公平的做法会遭到如此怀疑这显然有深刻的社会原因,它也从一个侧面展现了当前高考改革所处的尴尬的制度环境:专家的权威被消解,政府的威信面临着下降的风险,社会诚信严重缺失。在高考乃至教育改革的实践中这样的例子不在少数。不少外部正效益明显、整体效率更高、本质上也符合个体收益原则和形式公平诉求的改革举措,囿于“自我确证”的收益评价方式而难以为继。近年来,在收益与形式公平维度上自我认定式的评判标准,越来越成为个体参与制度变迁意愿的决定性因素,这一点在个体的强烈诉求与政府为贯彻执政为民理念所采取的保障措施下,已经成为超越制度变迁本身价值导向的一个终结性的并可据以判定其他规则的“元准则”。标准分制度所包含的复杂的统计方法导致了这项改革带来的收益无法被考生明确感知,对形式公平的保障和改进也无法得到考生的确证,这些都是失去民意支持的关键。
个体层面的收益计算以及对形式公平自我确证钳制下的改革举措,虽然体现了执政为民的政治理念,并且及时回应了老百姓的现实需求,但却在很大程度上伤害到了高考制度的整体效率。作为一项地位特殊的公共产品,高考制度既关乎“民生”,又关乎“国计”。它对高校入学机会这一高等教育资源的分配事关每一个家庭的切身利益,能否满足他们的利益并确保公平公正地对待每一个考生,是“民生”的集中体现,多年来政府部门在这方面的努力卓有成效。然而,若干个体利益之和并不必然地代表整体利益。高考制度能否高效地选拔出时代发展所需的人才,让高等教育资源与学生的学业成就、个人禀赋等更有效地配置起来这一比以往任何时期都更加关乎国家和民族未来长远和整体利益的要求,更是“国计”的应有之义。但是,正如亚里士多德所说的,“凡是属于最多数人的公共事务常常是最少受人照顾的事务,人们关怀着自己的所有,而忽视公共的事务;对于公共的一切,他至多只留心到其中对他个人多少有些相关的事务。”1
对于标准分这一可以让高考制度整体效率更高并且实质上保障了形式公平的改革,在以个体收益计算和形式公平对待方式为特征的民意面前显得异常脆弱,不仅仅是因为特定社会发展阶段民意的特殊性,还在于作为改革的权威主体——政府部门对待民意的方式上。
在社会公共事务治理中,民意诉求是社会改革的原动力,但绝不意味着改革仅仅以此为中心。一方面,对民意的关注虽然能够保证政府对民众诉求的有效回应,但一味地满足每一个现实的、眼前的要求,也经常会使政策缺少战略性和可持续性。如果长期这么做,很可能演变为只忙于解决眼前看得见的问题,而陷入一个自相矛盾、无法持续的处境2。另一方面,在高考这一兼具“民生”与“国计”双重属性的公共事务领域,其改革远不是老百姓开一个需求清单然后交给政府就能够推进的。依据民众的诉求来推行改革符合执政为民的宗旨,能够满足一时之需,收获民心。但是,对民众当下需求一味地迎合则很容易使政府陷入局部的利益纷争之中,而无暇顾及整体设计和长远考虑。高考领域的治理尤其需要在个人与公共、局部与整体、眼前与长远的利益上尽可能地保持平衡,如果顾此失彼,就可能带来严重的后果。这对于政府在推进高考改革过程中如何甄别、研判民意,并在充分尊重的前提下避免滑入民粹主义的陷阱,是一个严峻的挑战。
五、结语
标准分制度改革在20世纪80年代关于公平与效率关系的新阐述中开始,历时20年左右的探索,期间中国经济、社会和教育发生巨大变化。进入21世纪以来,公平成为高考改革领域的核心指导价值,这一点似乎得到了公认,但随着改革的推进,社会对公平的具体要求才不断清晰起来。可以确切地说,形式公平及其特殊的认定方式越来越成为决定各利益相关者参与高考改革的决定性因素。全社会对形式公平的热情空前高涨,需求旺盛,但认知方式并不理性。改革中的利益相关者以各自认定的“公平”与“合理”来扞卫既得利益或争取新的收益,但局部的理性和利益最大化却经常带来集体的非理性和整体利益的损害。高考这一制度设计在建设创新型国家中理应承担更大责任。与对民生的回应相比,保证整体效率的提升和实质性公平的改进同样至关重要,所以不应该成为达成前者目标的机会成本。
进一步分析,除了效率准则外,当前整个社会改革领域似乎同样把形式公平奉为圭臬。然而特定的社会发展阶段决定了在改革中个体以自我理解和确证的方式来界定形式公平,并据此来决定其改革意愿。这是在改革进入深度利益调整期普遍面临的一种制度变迁环境。社会行动的主体采取上述方式的收益是个体的、局部的,但付出的代价却是全局的、整体的,而且在很大程度上排斥了社会科学进步在推动制度变迁中的作用,并抵制资源配置效率更高、总体收益更大的改革举措,这不能不给予足够的重视。
附:中部某省实施标准分后的成绩通知单
高考成绩通知单(文科)1
?
(责任编辑蒋重跃责任校对蒋重跃孟大虎)
whyisauniversityentranceexaminationreformwithbothfairnessandefficiencyhardtosustainthechangeofstandardscoresystemanditsreflectiononthegovernance
zhangjian-shi
(centrefornationaleducationexaminations,ministryofeducation,beijing,china)
abstract:theexperimentandpromotionofstandardscoreinuniversityentranceexaminationhaslastedabout20yearsandcovered7provinces.comparedwiththetraditionalscorereportsystem,standardscorehasobviousadvantagesonscoringprecision,efficiencyoftalentsselectionandinsuranceofformalfairness.however,inmultiplelogicsofinstitutionalchange,itdidnotmeettheneedsofdifferentstakeholders.thespecialrequirementsonthereformintermsofscientificityandfairnessandthepublicopiniondependenceofgovernment'sresponsecouldnotmakethesystemofstandardscoreareality.concerningbothofthepeople'slivelihoodandnationalwelfare,thereformasksformorereasonablegovernancemeans.
keywords:universityentranceexamination;standardscore;institutionalchange;socialequity
[中图分类号]g424.74
[文献标识码]a
[文章编号]1002-0209(2016)01-0031-11
[收稿日期]2015-07-12