灵碧山下提示您:看后求收藏(阿里小说网novels.allcdn.vip),接着再看更方便。
关于浙江新高考赋分方案的再思考
——并修订“顺序名次分”
刘典正
摘要:新高考沿用总分录取的办法,总分=必考3科原始分+自选3科等级分。原始分本不可加,因社会认可并操作简单而“好用”;等级分虽易引发博弈而难保障学科均衡,但因保障机制而“能用”。原始分经排名次用等差数列转化,可变为理论可加而有望好用的“顺序名次分”。名次分是中国式等值机制,具有理论公平性;其科学性,因考试区分度而显现;易操作性,因名次的自致性可以依靠电脑;而其可行性出于国情,约定则成。
关键词:新高考,原始分,等级分,名次分,新框架
引言
启于2014年的浙江新高考,统一招生沿用总分录取的办法:必考3科语数外计原始分,自选3科赋等级分,总分=3科原始分+3科等级分。基于改革实践,再结合中国高考计分历程:原始分——标准分——原始分,我们对新高考赋分方案的判断是:原始分不可加但好用,等级分不好用但能用,赋分方案不具备刚性。新高考改革诸目标之实现需要更加科学而适合中国国情的赋分方案,可加、好用、刚性是基本要求。
一、原始分不可加但好用
原始分即卷面分数,是根据考生答卷情况直接给出的分数,没有经过转换处理,可以反映出考生答题的实际水平。但原始分的缺点非常明显,章建石认为“一是分数的意义不明确,不能表明位次方面的信息;二是稳定性欠缺,没有可比性;三是不具备可加性”[1]。温忠麟有类似的表述:“统考科目使用原始分”,“存在两个方面的不足:一是不同科目的原始分没有可比性,无法直接相加;二是直接相加的结果与政策设定的权重可能出入很大”[2]。综上可以归并为原始分不具备定位性、可比性、可加性、稳定性。
1、原始分不具备定位性
原始分不能反映某考生在全体考生中的位次。期中考试小明语文108分,我们以班为单位(全体),只有考虑到全班同学的最高分、最低分、平均分,等等,经过一系列繁杂的统计才可以明确地说明他的成绩怎么样,他在全班同学中处于什么位置。反之,我们只知道小明的原始分是不能判断他的成绩之高下的,因为位次不明确。
2、原始分不具备可比性
位次不明确可以推论出:不同科目或者同一科目的不同次考试之间,原始分不具备可比性,比较是无实质意义的。如,期中考试小明语文108分,英语同样108分,若满分都是150分,是不是语文英语实质成绩相同我们不知道。因为原始分受试题难度的影响,试题若难原始分就低,试题若易原始分就高。如果期中考试全班语文均110分、英语均105分,那么,小明的语文比班平均分低2分,而英语比班平均分高出3分,同样的108分却代表不同的水平。所以,就原始分所代表的实质成绩而言,语文108分≠英语108分,即不同科目(或同一科目不同次考试)的原始分1分≠1分,所以原始分的“每1分”并不一定等值。实际是因为原始分不具备定性位导致原始分数不具备等值意义上的可比性,所以使用原始分不能对考生水平进行有效的比较。
3、原始分不具备可加性
原始分不能直接相加,因为原始分的“每1分”并不等值,即原始分1分≠1分。高考中,我们习惯于依据考生各科原始分相加得到的总分进行录取,然而,这是不科学的。原始分不可直接相加,强加一起如“语文108分+数学108分+英语108分=324分”,就分值而言“语文1分≠数学1分≠英语1分”,所以324分是难以准确反映三者分值之和的。也就是说,原始分的简单直接相加所得之和是不能反映各科实质分数之和的,因此原始分不具备可加性。
4、原始分不具备稳定性
原始分不稳定,易使权重变形。比如高考中语数外各150分,即政策权重之比为,语文150分:数学150分:英语150分=1:1:1,由于难度等因素,若实际平均分之比为,语文125分:数学108分:英语115分≠1:1:1,即从平均分的角度考量,各科实际权重125:108:115不等于政策权重1:1:1。明显,权重发生了变化。
原始分有如上弊端,要进行各科考试实质分数的相加,就要对原始分进行转化导出,对各科分数进行定位,校正其权重,使各科分数可比可加,如此才能使各科成绩和之总成绩有效。导出分数是在原始分数的基础上,根据确定的规则转化出来的,其目的就是解决原始分所难以解决的定位、可比、可加、权重等问题,就是为了更好、更合理地解释分数的含义,实现分数的等值化,使之意义明确。
原始分需要转化导出才更加有效,实践中我们也引进相关的技术,如高考中使用过标准分,但是,民众不理解,除海南外均退回用原始分。民众的逻辑是:虽然原始分数“语文1分≠数学1分≠英语1分”,但是差不多,一分就是一分,确确实实就是考生自己考试所得,感觉好像是等值的;经过标准分这个引进的办法转化导出之后,民众不理解、不习惯,不信任,以致原始分不能动。标准分的实践未取得预期效果,本来考试标准化改革是为了高考更加公平有效,民众不认可怎么办呢只能遵从民意。于是,高考统考科目赋分方式坐了一次过山车回到了原点:原始分——标准分——原始分,还需要找到原始分可加的理由:“新高考实施前各科目原始分之所以可以直接相加,是由于对于同一共同竞争群体(如某省参加高考的全体文科生)而言,其考试科目是完全一样的,各科目试卷无论难易,对这一群体的所有考生来说具有相同影响,原始分数直接相加不影响竞争公平性。”[3]?这便是我们需要明白的“治理困境”。因而,原始分简单直接相加,在中国很好用。民众认可就好用,这是一种约定或契约
无论如何,从表面来看:确实是民众所认可的原始分延续运用,皆备公平与效率的标准分逐步退出高考。换一种导出分数来试行,如等级赋分制,它的境遇估计不会比标准分好多少,考试的文化环境对考试的运行之影响是客观存在的,它们在中国犯了共同的错误:动了原始分,或者说,用我们不习惯的方式动了原始分。任何引进的理念制度文化要融入本土文化都需要一个融合的过程,这个反应是一个化学式反应,不是物理式反应,即使理念得到完全认同,技术操作层面也不一定完全照搬,因此,直接运用等级赋分制就注定不会一帆风顺。
二、等级分不好用但能用
浙江的实践告诉我们:等级赋分制不好用,但现在还能用还要用。
等级赋分制的不好用,是因为不认可、不习惯、不符合中国国情、不能融入中国考试文化,主要体现在以下三点:1、可能诱导考生及家长在选科时的博弈心理?,造成学科失衡现象;2、赋分过程中可能产生分数差距扭曲?,?不利于提高考试的信度;3、造成选考科目分数的区分度和权重降低?,不能合理体现选考科目的价值和重要性[4]。
1、选科博弈属正常,学科失衡则不正常。浙江7选3,从考生个人水平的角度出发,肯定要从7科里边选自己最感兴趣、最特长的3科,以保证拿到最高原始分;但选考科目的等级赋分制是一种相对赋分,任何相对赋分不仅要看原始分的绝对值,更要看和竞争对手相比之后的相对位次;那么,要想提高位次得高分,除自己实力外就需要更多的相对较弱的对手;所以说,相对赋分产生博弈是正常的。物理、化学两科是比较繁难的学科,但又很重要,问题就出现在难而重要。当大量考生趋易避难,选考繁难学科的都是少量优秀者,当某一学科因难学而退出的相对较弱学生过多,这就造成学科失衡:一则因为该学科人数少,二则因为这些繁难学科的重要性。重要的科目学生少,这是不正常的。保障机制的作用在于:当繁难学科最弱档次学生放弃时,虚拟一部分考生,使实际考生的位置不会后移。而顺序名次分的逻辑是:固定每一个名次,有人退出,后边名次前移,而不是被向后挤。在名次分的机制中不因博弈而影响有兴趣、特长学生的位次,博弈只能成为无兴趣爱好、没有特长的无绝对实力者的专利,博弈对上中等学生的影响极其有限。
2、相对赋分因排序而改变原始分数的差距是必然的,但等级赋分制可达到扭曲的程度则是民众难以认可接受的。简单来说,某科满分100分,设有一组原始分:95、90、89、88.5、88,排序:第一、二、三、四、五名,排序后给我们的感觉是:相邻名次之间是等距的,而原始分的实际分距是:一、二名5分,二、三名1分,三、四名与四、五名是0.5分,5分≠1分≠0.5分,并不相等。如果不改变原始分数的差距且每1分一个名次,应该这样排序:假设100分是第一名,则95分第六名、90分第十一名、89分第十二名、88.5分第十二名半、88分第十三名。“第十二名半”,出现了半名,根本不符合我们排序的习惯和排序概念。所以说,排序会改变原始分数的差距。等级分是这样产生的:原始分-排序-比例-等级-等级分,就是说,排序之后还要按照人数百分比例划分等级,问题就出在这里。扭曲的表现分为:缩小、扩大、极端情况三种。按等级赋分制之规定,同一等级之内等级分相同,而同等之内考生的原始分可能会相差较大,同等内原始分有差距变成了没差距,这是缩小了原始分的差距;一分之差,分为两等,相差了三分,这是扩大了差距。有一种极端可能的情况是:同分落入不同的等级,“如果某个学科相同分数的人数比例过高,还会出现同分不同等的极端情况”[5]。这三种情况,都是民众难以认可接受的。
3、区分度下降是因为把不同的原始分落入了同一等级;权重降低一则因区分度下降,二是因分数全距减小。按照人数百分比例赋分,不仅有可能使不同原始分落入同一等级而缩小了分数差距,更因此而使等级赋分制下的选考科目区分度下降,同分现象之人数比例与等级赋分之人数比例相同,区分度的下降实源于此人数百分比例。由于选考科目易同分,那么区分度自然倚重于语数外,语数外的权重自然提高,那么,选考科目的权重则相应下降。选考科目的权重降低,还因为分数全距的缩短。浙江选考科目等级赋分制40分起赋,实际分全距是[40,100],而语数外的满分各150分,理论上的分全距是[0,150]。为了使选考科目不被边缘化,提升选考科目的区分度和权重迫在眉睫。
等级赋分制的不好用还体现在学生的认可度上。社会的认可,尤其是考生是否认可,我们需要高度重视。考生对于高考改革的基本看法一定程度上左右着家长等相关人士,并共同影响着社会认可度。刘希伟等认为“学生的知识与眼界毕竟相对有限,高考政策调整不可能完全吸收学生的意见与建议”,“他们对于高考政策的认识可能是偏颇的”,我们“必须加强高考政策的解读与宣讲,引导学生形成较为全面、理性的认识,以便尽可能为深化与完善高考改革方案创造有利支持条件”[6]。我们认为学生的知识与眼界相对有限是相对的,它们的认识或许有可能是偏颇的,对他们加强高考政策之解读与宣讲也是必要的,引导其形成较为全面、理性的认识也是需要的,为深化与完善高考改革创造有利支持条件也是可以争取的,但是,高中生的意见必须要得到应有的尊重,毕竟他们已经达到或将要达到高中毕业水平,而且,高考改革的直接服务对象就是高中生。根据调查数据,学生对等级赋分的认可,表示“比较赞成”的比例71.81%,“非常赞成”的比例为7.22%,选择“不赞成”的学生占比20.96%。[7]从选项来看,只有“非常赞成”、“比较赞成”、“不赞成”三项;如变为“非常赞成”、“赞成”、“比较赞成”、“比较不赞成”、“不赞成”、“非常不赞成”六项,考生可以充分自由选择。或者提供“非常赞成”、“比较赞成”、“比较不赞成”、“非常不赞成”四个选项,考生也可以自由表达意志。而赞成方面有两个选项“非常赞成”、“比较赞成”,不赞成方面只有“不赞成”一个选项,在选项设置上这是不对等的,容易影响考生的选择,引导学生赞成。从数据来看,“不赞成”占比高达20.96%,五分之一强,很不低,一定程度上能够说明等级赋分制在学生认可方面的“不好用”。
等级赋分制之所以还能用还要用,是因为:1、原始分不能用,2、有了保障机制,3、无替代品。
1、原始分数不能用:“不同选考科目的原始分显然不能直接相加”[8]。从理论上说,统考科目用原始分直接相加也是说不通的,但是在民众认可的情况下,勉强可以相加,影响不是很大。如果选考科目也用原始分直接相加,有些科目易得高分,有些科目难得高分,造成的结果必然是大家都去选易得分的科目,难得高分的科目之失衡定甚于现在之物理科的状况。我们也不可能有办法把7个自选科目的试题难度拉齐,原始分绝不可用。
2、保障机制打补丁:在物理学科失衡的状况下,经广泛征求意见,2017年11月29日,浙江省正式发布《关于进一步深化高考综合改革试点的若干意见》,建立选考科目保障机制,引导考生选考处于学科失衡状态的物理[9]。据此《意见》,今后将建立选考科目保障机制,并根据选考科目实际,保障机制率先用于物理选考科目,根据实际需要,保障数量为6.5万。当某年物理高考选考人数少于保障数量6.5万时,即启动保障机制,以保障数量6.5万为基数,按规定比例赋等级分,空缺后面等级。按保障数量计算,选考科目6.5万考生,原始分排在前1%的考生,赋等级分为100分,共有650名考生满分。如果考生不少于6.5万,那么就有不少于650名考生满分;若考生少于6.5万,启动保障机制,仍有650名考生满分,使中上等考生选科无后顾之忧,可避免物理选考人数持续下降。章建石认为:这是“使用政策工具进行调整的思路”,“短期内应该会发挥积极作用”[10]。
3、暂时尚无替代品:即使大家对等级赋分制基本都持不很满意的态度,但是暂时还没有找到合适的替代品。刘希伟等认为“我们暂时还难以找到其他更加科学、合理的分数制度,也不可能找到一种没有任何弊端的替代制度”[11]。章建石认为“从长远来看,选考科目的赋分方式还需要改进”,希望“更好、更有针对性、更具体的解决方案能够涌现出来”[12]。于涵等建议“加强实证研究?,探索符合试点省份实际情况的可行方案”[13]。
三、赋分方案不具备刚性
新高考改革要求“全面发展”,要求“确保公平公正”,要求“增加学生选择权”,要求“确保考试招生工作高效、有序实施”;在中国,这就必须要有精细的刚性的赋分方案与这些要求相适应。
全面发展要求刚性赋分。素质教育主张全面发展,应试实践的逻辑却是考什么就备考什么。如果说我们基础教育的课程设置是全面的、科学的,那么,我们考试的实践应该是教什么就考什么。全面施教——全面学习——全面发展——全面考核——全面施教,这是一个程序自动化化的系统,任何一个环节有漏洞都会影响系统的运作。全面发展要求全面学习,全面学习需要全面施教,全面施教要求全面考核,基础教育阶段,越是低年级越是这样。这里的考核,要求是有效考核。所谓有效就是考核评价的影响是有效的,能够实实际际的影响到学习者及施教者。是否高考必考或选考科目,150分还是100分,都直接决定某个科目的被重视程度。高考有考就学,不考就不学;高分高对待,低分低对待;模糊考核就模糊对待,精细考核就精细对待。精细考核就需要精细的刚性的赋分方案,也就是说,基于中国考试文化,要求学生全面地更好地发展,就要求我们全面地精细地考核,因而需要精细地刚性地赋分。
公平公正要求刚性赋分。公平:公是公众,指大家,平是平等;合起来的意思是大家平等。由于人与人之间差异的存在,故没有绝对的平等,而只有相对的平等,所以就需要公平之公,即公正。公正:是公平而正直,正直就是没有偏私。没有偏私,就是依据一定的标准,平等的对待相同的,不平等的对待不同的。就考试而言,在形式上要做到:甲考1分,给甲1份的奖励;乙考10分,给乙10份的奖励。因为:1分1份=10分10份,奖励(份)的依据(分)是相同的,比例是平等的,结果是公平的,所以是公正的。丁考100分,因某种理由给丁101份的奖励,多出来的1份奖励,依据了另外的标准,这样的结果是否公正就需要讨论。或者说,丙和丁同时考了100分,二者对某个机会有相同的资格,并且都在力争,如果我们把机会给了丁,而对丙讲不出任何拿得到桌面上的理由,这就是不公正。为了避免这种不公正,就需要精细的刚性的赋分方案。比如说换一种更加精细的赋分方式,丙得了99.98分,同时丁是99.99分,99.99分amp;;99.98分,依据分数高者优先的规则,机会自然属于丁,就不需要再找其他理由。这样,也更容易做到形式的公平公正。
学生选择权要求刚性赋分。学生选择权是学生基于自身的兴趣特长,根据自己的主观自愿,在相关规定的范围之内,所能够享有的自由选择科目或者教育,自主安排科目进度或学习时间,实现其成长权利的一种手段,它由学生的主观自愿权和教育的客观自由权构成。学生选择权作为学生的一项重要成长权利,一定要受到尊重和保护。学生在行使这一成长权利的时候应该坚持“依规行使”和“相对行使”的原则,并遵守一定的限度。鉴于中国学生的选择权尚处于不成熟状态,我们应立足现实,要运用各种手段保护其成长。就从自主选择科目这个角度看,特别需要精细的刚性的赋分方案。比如说等级赋分造成学科失衡,选物理需要再三权衡,赋分方案就影响了学生的选择权——首先影响了学生受教育的客观自由权,选物理就有可能得低分;进而影响到学生的主观自愿权,可能得低分,那学生就可能牺牲兴趣转而选择其他有望得更高分数的科目。学生的这项重要的成长权利就没有受到保护,选择的限度实际上降低了。如果说刚性分数保护的是兴趣的话,那么,精细保护的是特长。赋分刚性,选哪一科都意味着相近的竞争力度,无兴趣不如有兴趣,保护了兴趣;排名次前0.1%和前0.9%赋同样的分,特长就难以得到保护,而赋不同的分,竞争就有必要,特长由此而因奋力竞争铸就。
高效有序要求刚性赋分。如前面我们举例,丙和丁同时得了100分(等级分),二者竞争同一个机会的时候,如果我们要把机会给其中某一个,一定要拿出说得过去的理由。如果我们用精细的刚性的赋分方案,设丙99.98分(名次分),丁是99.99分(名次分),99.99分amp;;99.98分,我们依据分数高者优先的规则,机会自然属于丁,不需要再找其他理由,少了一道工序,效率自然提高。同时,若同等级分竞争同一机会,即使根据某种事先公布的理由,得不到机会者的不公平之感受,可能依然比少了0.01分的感受要强烈得多。这种感受的积累,可能形成某种无序感,反过来说,在我们这个特定的考试文化环境中,精细的刚性的赋分方案更容易做到有序。
而现行的赋分方案不具备刚性。要求赋分方案刚性,就是要求它不易变化,而前面我们已经证明:无论是原始分还是等级分,都是易变的,所以“原始分+等级分”的赋分方案是易变的,不具备刚性。而等级分同时做不到“精细”。
另外,原始分与等级分相加的合理性我们存疑,二者是否可加必考科目使用原始分计成绩,选考科目使用等级分,王森认为“两种不同类型成绩加总的科学性值得探讨”[14]。我们的答案是明确的,原始分本不可加,与等级分就更不能加在一起。温忠麟认为“有必考科目和选考科目需要合成总分,必考科目用标准分,选考科目要校准分数”[15]也不认同原始分与等级分加总。
我们认为:必考科目和自选科目统一用顺序名次分,可以同时解决“不具备刚性”与“是否可加”以及“认可”的问题。目的就是解决原始分不可加,等级分不好用的难题。
四、中国的等值分名次分
1、什么是名次分
顺序名次分是各科按原始分排名次,按名次赋分,使各科成绩可加的中国式等值机制。笔者在《物理尴尬何时休》一文中,为解决学科失衡的问题,基于排名次的方式为中国民众所熟知认可而提出。把排名次与等差数列相结合,在一定的规则下,经过推导,得到顺序名次分。赋分公式为:名次分=x,现对其做进一步的修订。[16]
修订后的基本思路是:1、各科按原始分从高到低排名次,以名次赋分;2、分数呈等差数列,第一名为满分,最后一名若不并列,分数等于公差;3、一科多考,每次以本次实考学生数赋分,自选最高成绩最终赋分;4、相同分值科目,名次相同则分数相等;5、外语不同语种各最终赋分后,参加总赋分;自选科目以最多考生科赋分,其余科目空缺后面名次;6、名次总分=六科名次分之和,最后以名次总分排总名次待录取。
排名遵循以下原则:1、排名次总原则:原始分高者优先;2、外语各语种同分排名原则:考生多者优先;3、不同次考试同分排名原则:考生多者优先;4、自选科目同分排名原则:考生少者优先;5、强化科目平衡原则:各自选科目总分之和相等;6、补充原则:零分排名次优先缺考者。
我们把“名次分=x”称为顺序名次分的根本公式,简称为根本公式。必考且只考一次科目,可以直接用这个公式计算成绩,如语数两科。
外语科多语种,并考多次。每一语种每次赋分公式为:单次名次分=x,可称为多次考试科目每一单次赋分公式,简称单次公式。多次考后,再以各人最高名次分排名次,同分排名遵循原则3,考生多的某次优先于考生少的某次。各语种多次考试排出最终名次后赋分,公式为:语种名次分=x,称为外语科各语种专用赋分公式,简称语种公式。再对各语种名次分排序,遵循原则2,同分时考生多的语种优先。排序后,用根本公式计算出最终分数。
自选科目,考多次。先用单次公式计算单次名次分,再遵循原则3排出各科最终名次后赋分,自选科目的赋分公式是:自选名次分=x,可称为自选公式,其中的最大考生数,是自选7科中定有选某科人数最大,所有7科皆用此数据计算,。
名次总分=六科名次分之和,最后以名次总分排名次,待录取。
用顺序名次分,理论上选各科人数大体上持平。如果说,此大体持平是合理的、值得努力追求,那么,我们可以遵循原则5使自选各科的总分之和相等。由自选公式,自选名次分=x,可知:自选科目名次相同,则分数相等。设浙江某年有考生30万,每人3科,则自选科目参加考试总量为90万人次,学科均衡则7科每科约有12.86万考生。若某科比较容易但不是很重要,可是考生却最多有19万;而某科比较难学但比较重要,可考生最少只有10万;并且差距经常如此,社会发展难以接受,而如果大体持平之学科均衡我们认为合理且有必要的情况下,可使自选各科的总分之和相等。第一步,按自选公式计算分数,并以这个分数为基础;第二步,考生最多科成绩不变;第三,其余任何一科所有考生平均分配该科目成绩之和与考生最多科成绩之和二者差的绝对值。为什么是平均分配,因为共同承担风险。以考生最多科与考生最少科为例,第一步时,最少科的第一名、第十万名分别于最多科的第一名、第十万名分数等值;第三步时,最多科后九万名的成绩之和被最少科的所有十万名同学平分。当然,这个计算很简单,一个等差数列的求和公式,算出最多科后九万名之成绩和,除以最少科同学数十万即可与各自原成绩相加;是否有此必要,则需要充分讨论。
还需要讨论的有补充原则,就是零分排名次优先缺考者。考试容易出现一些极端少有的状况,比如种种原因没有实质的成绩,要不要给无实质成绩者排名次,怎么排名,这些问题都需要协商讨论。我们的观点是:为鼓励选择,只要做出选择即给排名,为鼓励按时考试,参加考试者均优先缺考者。
2、为何如此修订
于涵等认为“从考试的公平性、理论的科学性、操作的可行性3个原则出发”,认为:1“简单以考生比例划分等级的做法不可取”;2“考生原始分数间的差别是他们能力差别的体现,可以根据考试招生的需要给予不同程度的显现”;3“提升选考科目对人才选拔的贡献”,需要“适当扩大分数全距”[17]。以上论述是此次修订顺序名次分的理论指导,并结合笔者对考试历史发展的有限感悟、对高考改革实践的粗浅认知,以及对素质教育在新时代全面落实的美好期盼。如,自选公式即是按上述“认为3”从根本公式推导得出。
名次分属于等值机制,具有理论公平性;其科学性,因考试区分度而显现;易操作性,因名次的自致性而可仅依靠电脑;而其可行性出于国情,约定则成。
这里的等值机制具体是指,在使用原则5强化科目平衡之前:同分值的不同科目的分数“第m名等于第m名”。比如浙江方案中,语数外同分值都是150分,那么不同科目的“语文第一名,数学第一名,外语第一名”名次分相等,由基本思路2和4,或者用根本公式计算,同为150分。同理,自选科目都是100分,那么,“物理第六万名,政治第六万名,历史第六万名,化学第六万名,生物第六万名,地理第六万名,信息第六万名”,由基本思路4,或用自选公式计算,因名次相同而名次分相等。机制具有理论公平性,首先是同分科目的公平,语数与外语(外语各语种之间),自选科目之间,因所用公式之相同而公平;也就意味着选择或学习相关科目的考生之间的公平,按兴趣和特长选科,不需要有太多的顾虑。当然,无兴趣特长者的所谓博弈我们难以阻止,或许,博弈本身有其合理性,或者说,机制本身具有对抗博弈或包容适当博弈的性能。原则5之强化科目平衡,即是对博弈的包容或对抗,各自选科目总分之和相等,或许是更高意义上的公平——科目平等。
顺序名次分赋分机制的科学性,通过考试区分度而显现,就是说,此机制本身就像镜子一样,考试区分度高,排名次就比较容易,若区分度低,排名次就不易。而任何考试的设计,区分度是必须要考虑的,所以,名次分的科学性要联系到考试区分度。
名次分之易操作,因名次是自致的,原始分的顺序排列即可得到名次,可依靠电脑运行;而其可行性则要看国情是否允许。
3、应该符合国情
在统一高考中用排名次的办法符合中国国情,而在高考中是否可用顺序名次分则需要讨论。所谓中国国情,这里主要指中国的考试文化与考试历史传统。从考试历史之科举传统看,排名次是严格标示的。以最高级别的殿试为例,分三甲录取,相当于分三个等级,第一甲即第一等,第二甲即第二等,第三甲即第三等。等级之间,严格区别:第一甲赐进士及第,第二甲赐进士出身,第三甲赐同进士出身。等级内部,排名严格:第一甲录取三名,第一名称状元,第二名称榜眼,第三名称探花,合称为三鼎甲。第二甲、第三甲的第一名也有专用名:传舻,其余按数字排名。千年的科考,使排名影响深远。早在2006年,教育部在《贯彻〈义务教育法〉进一步规范义务教育办学行为的若干意见》中明确表示:“不得按考试成绩对学生进行排名”[18],排名到了需要禁止的程度,从反面可见,中国考试文化的土壤多么适合排名次的生长。其实,统一高考的总分录取本身就符合排名次的理念,高分优先录取。顺序名次分的根本理念,就是排名次。因为原始分不能动,民众不让动,但又不得不动,或许可以通过排名次这种我们习惯的方式来动,因为考生各单科的“神圣”的名次在转化导出时没有变动,并且在运算的公式中清楚地标示出来。这个办法能否行得通,是需要深入讨论的,如果有讨论的必要的话。如果说高考是一场严肃而高利害的游戏,那么,游戏规则是非常重要的,赋分作为这个规则的重要组成部分,是需要游戏的参与者共同约定的。
排名次符合中国国情,名次分也应当容易得到社会认可。当然,有更公平、更科学、更说得清的思路,必定更加可行。我观目前热议的量表化等具备公平、科学性,但很有可能解释不清,就像标准分一样可能在社会认可方面需要大力宣传与讲解。而较之等级赋分制,顺序名次分具有明显的优势。
五、名次分精细于等级分
名次分是细化的等级分,同时,较之等级分名次分更具有刚性。此刚性,是因同分值科目用相同的公式,并源与根本公式。现我们通过表格,从计算方法和使用科目角度,对二者进行比较,对比如下:(表1)
等级赋分制
顺序名次分
1、计算方法
1、计算方法
1考生参加考试后获得原始分
1考生参加考试后获得原始分
2根据原始分,在全省内进行单科排名
2根据原始分,在全省内进行单科排名
3依名次由赋分百分比例规则找出赋分
3依名次由公式计算出名次分
4找出的等级分,计入高考总成绩
4算出的名次分,计入高考总成绩
2、使用科目:自选科目
2、使用科目:所有科目
从计算方法来看:第一步得原始分、第二步单科排名和第四步计入总成绩,二者相同。唯有分数的导出转换方式不同:等级赋分制,依名次由赋分规则所规定的考生人数百分比例,找出规定的赋分;顺序名次分,依名次通过名次分公式,计算出分数;计算比较精细,规定比较粗糙。从使用科目看:等级赋分制,仅限于自选科目;顺序名次分,适用于所有科目;名次分的适用广泛,可使自选科目与必考科目赋分标准统一。
可以说,顺序名次分对等级赋分制的理念是认同的,但在操作层面上,由按百分比例粗略的划分等级,变为按名次精细的划分等级,意在对等级分进行精细化。使之嫁接在中国考试文化的老根上而发新葩,变我所引进为我所拥有,以期彻底消化而有益于新高考改革。也就是说,等级分要化中国,首先它自身要中国化。
六、考试分数等值新思路
有关资料表明,我国考试关注分数等值问题,最晚不迟于1994年。证据是:哈维.戈德斯坦(英)所作《考试的可比性》一文由纪泽明翻译,发表在《外国教育资料》1994年06期。主要讨论的是:不同次考试等级的等值问题。而到2008年,我们已经在系统的研究分数等值理论,虽然,“在我国,等值问题一直是考试研究中较薄弱的一个环节”[19]。美国2006年出版了《教育测量》(第四版),书中提出的关于考试分数等值的新框架,两年后就被谢小庆在《考试分数等值的新框架》一文中加以介绍,并对等值问题进行了深入讨论。
据该文介绍:这个新框架的等值机制分三种:预测、量表化、等值。作者又进一步介绍,量表化过程可以划分为六种模式:量表系列、基于假设总体的量表化、基于锚测量的量表化、纵向量表化、标定、谐同;并梳理了六种等值方法:等百分位、线性等值、核等值、后分层等值、链等值、基于irt的方法等。这个新框架,基本囊括了我们现在所能见到的所有的分数等值思路。
名次分之等值机制,与新框架相比,或许新框架因专家之校准更精确、更精准,但其可行性容易让我们联想到统考科目所用的标准分在中国的境遇:原始分——标准分——原始分,虽科学公平高效但难以得到社会的认可。我想要说得是,可能因解释不清楚或不习惯而使这些国外成熟的等值机制难以融入中国考试文化。另外,根据素质教育全面发展的主张,应试实践考什么就学什么的逻辑,我们得出:全面施教——全面学习——全面发展——全面考核——全面施教,这一程序自动化化的系统,并且知道任何一个环节有漏洞都会影响系统的运行。根据这一逻辑:语数外、政史地、理化生、音体美、信息技术、通用技术、综合实践等科目都应在“全面考核”的范围内。我们现在的漏洞是:音体美在高考以及会考中,未受到足够的重视;综合实践等科目处于无法考核的状态。从长远来看,依据素质教育的逻辑,高考的“全面考核”在中国势在必行。顺序名次分有望解决上述一些科目赋分的难题,而新框架对音体美等六科或许更加解释不通,排名次则易于接受。
我们可以说,顺序名次分是考试分数等值的中国式思路:可加、好用、刚性,可加是基于等级赋分理念的相同的计算公式;好用是因为它是中国式的中国化的;刚性源于排名次的自致性及名次之明确的标示。
结语
我们不得不承认,中国高考确有自己的特殊性。这是一种高利害的竞争性考试,用一种解释不清楚、听不懂、不理解、不习惯的分数,严重影响改革目标的达成。改革如江河之移徙,苏子曰:强其所不欲而复之则难为力。标准分之失,就在于说不不清楚,或者说听不懂、不理解、不习惯,于是社会不认可而民众“不欲”,也就“难为力”。反之,如禹之治水,顺其所欲行而治之则易为功。顺序名次分是新生事物,而排名次却有悠久历史,虽把握现实国情,遵从相关文献,对赋分规则进行修订;但因思虑不周而欠缺必定较多,然献思路于方家,或许对此轮高考改革有所补益。
天下苦应试主义教育久矣,其病在未能“全面考核”,且限制了学生选择。赋分方案以能确实有助于素质教育之落实为佳;同时期盼:学生选择权,借此轮高考改革,得以走向解放!
参考文献:
[1]章建石.一项公平与效率兼备的高考改革为什么难以为继——标准分制度的变迁及其折射的治理困境[j].北京师范大学学报(社会科学版),2016,:31-41.
[2][15]温忠麟.新高考选考科目计分方式探讨[j].中国考试,2017,:23-29.
[3][4][8][13][17]于涵,韩宁,关丹丹,章建石,焦丽亚.关于改进新高考选考科目赋分方案的若干思考[j].中国高教研究,2018,:44-49.
[5]李金波.新高考招生制度下的等级赋分制[j].教育测量与评价,2016,:48-51.
[6][7][11]刘希伟,韩娟,翁灵丽.新高考等级赋分制:学生认可度的实证研究——基于浙江省的实证研究[j].教育发展研究,2017,:31-35.
[9]浙江省人民政府.关于进一步深化高考综合改革试点的若干意见[ebol].[2018-08-08].http:
[10][12]章建石.关于选考科目等级赋分的改进:历史经验、现实限制与可能方向[j].华东师范大学学报,2018,:79-86,168-169.
[14]王森.新高考选考科目计分机制改进研究[j].教育科学,2018,:14-20.
[16]刘典正.物理尴尬何时休——关于浙江“等级赋分制”的思考[j].湖北招生考试,2018,:16-22.
[18]中华人民共和国教育部.教育部关于贯彻《义务教育法》进一步规范义务教育办学行为的若干意见[ebol].[2018-08-10].http:
[19]谢小庆.考试分数等值的新框架[j].考试研究,2008,:4-17.