作者简介:

杨学为
教育部考试中心原主任,研究员,国家督学,享受国务院政府特殊津贴。
访谈者:徐奉先,教育部教育考试院副研究员。
摘 要:杨学为先生是教育部考试中心(教育部教育考试院前身)首任主任,在机构创立之初即带领全国考试战线开展了高考、会考与自学考试制度改革,对教育考试现代化的基本规律有深入研究和思考,积累了丰富的实践经验。本刊于2025年8月和10月对杨学为主任进行了两次专访,他系统回顾了我国教育考试现代化的缘起、改革历程与实践经验。结合推动高考与自学考试制度改革、引进与推行标准化考试、加强学术研究和创办《中国考试》杂志等实践,他阐述了我国考试现代化在理念更新、技术引进、制度建设和风险管控等方面的诸多探索,同时还讨论了在新的时代背景下如何推动综合考查和多元评价、强化专业能力与加强理论研究等问题。本文旨在为新时期深化教育评价改革提供镜鉴与参考。 关键词:教育考试;现代化;教育评价;高考改革;考试史
教育考试作为教育评价与人才选拔的重要手段,其现代化进程深刻反映了国家教育治理能力的演进。1987年国家教委考试管理中心的成立,标志着我国开始探索建立专业化的国家级考试机构。在随后的30余年里,这一机构(后改名为教育部考试中心)不仅承担了高考、研考、自考等大规模国家考试的组织实施,而且在考试理念、技术手段、制度设计等方面推动了一系列现代化改革。杨学为先生作为考试中心首任主任,亲历并主导了教育考试领域的一系列关键改革,其个人记忆与工作经验构成了理解我国教育考试现代化改革进程的一把钥匙。本文通过对杨学为主任的深度访谈,力图还原教育考试在特定历史语境下变革的动因、关键节点及面临的挑战,在此基础上探讨其对未来教育评价改革的启示。研究旨在梳理历史脉络,提炼核心经验,为新时代深化教育评价改革提供历史镜鉴与启示。 一、教育考试现代化的缘起与内涵 访谈者:杨主任您好!祝贺您荣获“全国离退休干部先进个人”称号,也非常感谢您拨冗接受访谈。1987年国家教委考试管理中心成立,您作为第一任主任,主导了我国首个专业化教育考试机构的建设与发展,领导了高考、自学考试等多项国家教育考试的制度创新。首先能否请您谈谈自己的学习、工作经历? 杨学为:我1960年从东北师范大学毕业,学的是哲学专业,毕业后就留校任教了。1977年是一个重要的转折点,那年8月我被临时借调到教育部高校学生司,正好赶上了恢复高考这件大事。那段经历让我深刻感受到,高考不仅是一场考试,还关系到国家的命运、知识的价值,也关系到千千万万年轻人的前途。1978年,我正式从东北师大调入教育部学生司工作。1987年国家教委考试管理中心成立,组织上决定由我担任主任。在考试中心工作的12年里,我和同事们重点推动了两件事:一是建立普通高中会考制度,让会考成为评价高中教学质量的“另一把尺子”,和高考这把选拔考试的“尺子”分开使用;二是推进自学考试制度建设,这是中国在教育领域的原创制度,后来韩国还专门来学习过。2000年我从考试中心主任的岗位上退休,但没有离开考试研究,陆续编写了《中国考试通史》《中国考试文献集成》《高考文献》等书。现在我快90岁了,有人问我这辈子最欣慰的事情是什么?我说,我曾经给自己定过一个目标,就是让高考的优点多一点,缺点少一点[1]。我努力过了,至于做到了多少,就只能留给后人评说了。 访谈者:杨主任,在您担任考试中心主任期间,您认为哪些关键的社会、经济、技术和教育发展因素促使考试机构必须走向现代化?当时的紧迫性体现在哪里? 杨学为:这个问题触及了当年改革的深层动因。我担任考试中心主任的12年里,恰好是国家经济从计划经济向市场经济转轨的关键时期。外部世界的变化、社会对人才需求的转变都迫使我们思考:延续了几十年的考试模式,还能不能适应新的时代要求?我认为当时推动考试走向现代化的动力主要来自四个方面。 一是经济体制改革对公平与效率的追求。改革开放后,随着社会主义市场经济概念的提出,社会竞争机制发生了变化。过去讲高考,更多的是讲政治可靠,但市场经济要求的是能力本位,要求人才的公平流动,选拔具有真才实学的人。这反映在考试上,就是让考试分数更准确地反映一个学生的真实能力,而不是死记硬背的功夫,要求考试命题从依靠经验向实现科学化转变。同时,经济搞活了,人口流动加快了,随着城市化的发展,大量流动人口子女、在职人员等都需要参加高考和获得学历,对考试的便利化、社会化服务也提出了新的要求。自学考试之所以能在20世纪八九十年代迅猛发展,就是因为满足了大量在职青年不脱产学习、公平拿文凭的刚性需求。二是素质教育对考试的要求发生了变化。改革开放初期,高考的考题数量比较少,而且基本都是考知识点,于是就出现了猜题、押题的现象。如果考生能押中一道题,就能在高考中获得很大的优势。而且,社会上编写的复习资料也很多,告诉考生应该背哪些内容,就像打靶一样,哪是十环,哪是八环,把知识都分类了。当时,片面追求升学率的问题比较严重,中学阶段的教育几乎变成了高考预备班,学生偏科问题比较突出,身体素质也下降了,社会舆论批评高考是“应试教育”的推手[2],这让考试机构压力很大。当时我们想,考试机构不能只做高考这一件事,不能只当人才选拔者,还得当好教育引导者。所以我们强力推行了高中会考制度,目的就是让考试机构手里有两把尺子:一把是会考,衡量学生是否达到高中毕业标准,引导学校开齐课程;另一把尺子是高考,服务于高校选拔,这是我们在当时的条件下从单一考试向多元评价迈出的关键一步。三是考试规模扩大带来的管理压力。你刚才提到了技术因素,这一点在当时非常现实和急迫。20世纪80年代末,高考报考人数突破200万,90年代后期达到300万[3]。以前阅卷是纯手工,几百号人围在大礼堂里翻卷子,不仅效率低,而且容易出错。再加上社会对考试公平越来越敏感,一分之差有可能决定一个孩子的一生,用机器代替手工就变成一项非常紧迫的任务。80年代末我们开始大规模引进光电阅读器(OMR),推广标准化考试。这不仅是技术的革新,更是理念的革新。把客观题交给机器,既提高了效率,也降低了阅卷的主观性误差。但推广之初阻力很大,很多老师质疑机器评分的准确性。我们就在全国率先从试点做起,培训评卷骨干,一步步把标准化考试推向全国。可以说,如果没有那次技术升级,后来就应对不了高等教育的扩招。四是国际交流带来的观念冲击。考试中心成立后,我们开始学习国际先进经验,主动联系美国的ETS和日本的考试机构,出去一看,才发现差距太大了。他们在命题理论、计算机技术应用、考试服务等方面已经遥遥领先于我们。这让我们认识到问题的紧迫性,也意识到中国的考试不能关起门来自己搞。全球化的人才竞争要求考试分数具备国际可比性,比如在高考中引入能力测试的元素,就是后来探索高考内容改革时强调考能力、考素质的一个动因。总的来说,当时的紧迫形势可以概括为三个“跟不上”:传统的考试内容跟不上能力型人才的需求,人工的操作方式跟不上每年几百万考生的规模,单一的考试功能跟不上教育改革和社会发展的多元化趋势。所以,当时提出现代化不是赶时髦,而是被逼出来的,必须把考试中心从一个教育行政机构转变成一个专业化、科学化的服务机构,否则就无法支撑改革开放对于人才选拔的需求。 访谈者:那么在您看来,一个现代化的国家级考试机构,其核心特征是什么? 杨学为:我认为考试机构必须是一个能自我进化、抵御风险、引领教育评价方向的专业机构,其核心特征可以概括为四个方面。 一是命题的专业化与科学化,这是考试机构走向现代化的基础。所谓的专业化,绝不仅仅局限于招揽一批高学历的人才,而是意味着建立一套现代化管理制度。一方面,命题要做到科学化。考试中心成立前,我们请老师来命题,更多凭借个人经验;而现代化的考试机构必须建立常设的学科命题队伍,要有题库,要运用科学的测量理论来评价每一道试题的质量。当年引进光电阅读器,就是为了能快速采集数据和对试题进行量化分析,让命题从“手工作坊”走向“标准化生产车间”。另一方面,评价要实现专业化。考试机构不仅负责命题、组织考试、发布成绩,还应该具备对考试结果进行深度分析的能力。这些数据对于国家了解教育发展质量、高校选拔人才、中学改进教学,都是宝贵的资源。因此,一个现代化的考试机构,应该是一个教育考试的研究中心。 二是强大的风险抵御能力。高考涉及千家万户的切身利益,是社会情绪的稳定器,不允许有半点闪失,任何一次事故都可能动摇公众对公平的信念。风险应对体现在两个层面:一方面是物理层面的安全,比如试卷的印制、押运、保管;另一方面是社会层面的信任,当出现突发事件,比如自然灾害、突发疫情等,考试机构必须迅速响应、有效沟通、果断处置。所以现代化的考试机构必须有一套严密的风险管理体系和危机应对预案,这种能力比单纯会命题更重要,它是机构正常运行的保障。 三是标准化与精细化的管理能力。标准化不是僵化,是为了最大程度的公平和高效。从命题蓝图的制定、考务流程的设计、考场的环境要求,到阅卷的评分细则、分数的合成与转换,每一个环节都必须有明确、可执行、可追溯的标准。我举个例子,主观题的阅卷误差怎么控制?我们当年探索了分步给分和复查机制;后来使用计算机阅卷,主观题都是随机分给两位老师独立评分,评分误差超过某一阈值就自动提交给第三位仲裁。这种精细化的流程设计,保障了哪怕是最主观的作文题也能最大程度地确保公平公正。 四是提供多元服务的能力。现代化的考试机构不能只服务高校的人才选拔,比如当年推行的自学考试,就是为了满足社会成人学习、终身学习的需求。随着社会发展,考试机构还承担了职业资格证书、学业水平评估及国际考试服务,从一个管理者转变为一个专业化考试服务者,服务于学生的成长、高校的人才培养、国家的终身学习体系建设。
二、考试现代化进程的关键维度与探索实践 访谈者:考试中心成立初期,您认为哪些国际经验或关键技术的引入对考试机构现代化产生了深远的影响? 杨学为:改革开放初期,我们就像长期关在屋子里的人突然打开窗户看到了外面的世界,那种冲击感至今难忘。如果要我说哪些影响最深远,我想从理念和技术两个层面举出几个典型例子。 一是在理念层面,美国ETS的专业化机构模式对我们影响深远。1987年考试中心刚成立不久,我就带队访问了ETS。那次访问对我们心理上带来的冲击,可以用震撼来形容。ETS位于美国普林斯顿的园区不是想象中的政府办公楼,而是一个庞大的研究机构。那里不仅有命题人员,还有数百人的研究团队,专门从事心理测量学、统计学、教育评价的前沿研究。ETS非营利、专业化的运作模式,为我们提供了考试机构发展的可借鉴范例,我们回国后就开始在考试中心内部设立了专门的命题部门,开始招聘教育测量专业的研究生,并尝试建立自己的科研队伍。可以说,ETS的模式启发我们开始了向专业考试机构转型的探索。另外,在推进高中会考制度的过程中,我们系统研究过日本的考试制度,对他们的会考经验进行了借鉴。 二是在技术层面,计算机化题库与自适应测验重塑了我们对考试的认知。20世纪90年代中后期,ETS和美国大学入学考试机构已经开始尝试让考生在电脑上答题,题库系统根据考生的答题表现实时调整题目难度,从而更精准地测量考生的能力水平,这让考试测量模式从标准化走向了精准化。这种“题库+计算机化”的技术路径,促使我们在20世纪90年代末投入大量精力探索题库建设。当时已经意识到,未来的考试一定不是每年临时请老师命题,而是从经过动态维护的、科学校准的题库中随时抽取题目组合成试卷。后来的机考、网考,其技术源头都可以追溯到那个时期对国际经验的学习借鉴。 实际上借鉴国际经验与实现我国考试现代化,是一个“引进—消化—吸收—再创新”的辩证过程。国际经验为我们提供了专业化转型的参照系,缩短了探索路径,但真正的现代化必须立足国情、以我为主。无论是ETS的机构模式,还是日本的会考制度、计算机化考试技术,最终都是在与中国教育实际的深度结合中转化为具有中国特色的制度安排与技术路径。虽然说他山之石,可以攻玉,但玉成于手,方为根本。 访谈者:改革开放后,我们开始运用教育测量学、心理学、统计学等专业的知识和研究方法去研究考试,您认为这些研究在提升命题质量、科学解释分数等方面产生了哪些重要作用? 杨学为:我常常说,如果只凭个人经验命题,那就是小农生产;只有建立在科学研究基础上的命题才能称得上是专业化的,没有科学就没有公平可言[4]。教育测量学、心理学、统计学这些学科,恰恰是支撑我们成长为专业化机构的理论基石。 首先,教育测量学让命题从“凭感觉”走向了“有标准”。在引入教育测量学之前,命题主要依赖个人经验。请几位教师集中封闭在一个地方,凭他们对教学内容的认识理解出题。题目出得好不好?是不是太难了?有没有区分度?没人说得清楚。教育测量学给了我们一套分析工具。经典测量理论告诉我们,每一道题目都有难度和区分度,难度是指有多少考生答对了这道题,区分度是指这道题能不能把高水平学生和低水平学生区分开。我记得有一年有一道题的难度系数只有0.2(意味着只有20%的考生能够答对),区分度也比较低。我们拿着数据去找命题老师,老师还不服气,说这道题考的是基本功。但实测数据显示平时成绩好的学生也大多没有答对这道题,说明题目本身有问题,而不是学生水平不够。这就是教育测量学的力量,它让命题评价从“我觉得”变成了“数据说话”,通过对考后数据的挖掘分析,我们逐步提升了命题技术,让考试变得更加科学。 其次,心理学让考试从考知识走向测能力。尤其是认知心理学和心理测量学给了我们一个重要的启示:考试不仅要考学生记住了什么,更要考学生能做什么。传统的学科考试主要是测量学生对某一专业领域知识的掌握程度,而能力倾向测验则主要测量一个人潜在的学习能力和思维品质。一个具体的例子是英语科目考试的改革。传统英语考试重语法、重翻译,学生背得苦不堪言。后来,我们借鉴心理语言学的研究成果,开始增加阅读理解和完形填空等题型,测量学生的语言理解能力和语感。这种转变背后体现的实际上是命题人员对语言能力认知结构的重新理解。另一个例子是作文命题的改革。过去作文题以命题作文居多,学生容易套作;后来开始尝试设计材料作文、情境作文,让学生在具体情境中展现思维能力和表达能力。这种命题思路的变化,本质上是对写作能力这一心理构念的重新定义。 最后,统计学让考试分数从简单的数字变成了有意义的信息。一张试卷能不能稳定地测量出学生的水平?这需要统计方法来检验。如果信度太低,说明考试结果受偶然因素影响太大,这样的分数是不可信的。我们在重大考试项目中引入分半信度、内部一致性系数等统计指标,就是在用统计学的方法为考试质量把关。 访谈者:除了提升命题的专业性和科学性,当时您在完善机构内部治理结构、优化考务管理流程、提升风险管理能力等方面进行了哪些现代化的探索呢? 杨学为:考试的现代化,最终要落在每一个环节的制度化上。只有把权力关进制度的笼子,把经验变成科学的流程,才能扛起为国选才这个千钧重担。 首先,在命题管理方面,考试中心成立之初,我思考最多的问题就是命题权怎么管。过去请老师命题,往往临时找人,随意性大,质量不稳定,也容易出风险,后来就给每个学科设置了专职的学科秘书。这个秘书不是行政干部,而是懂专业的业务骨干,他们的职责是在全国范围内物色、遴选命题老师,建立起一个动态的命题教师库。每年从库里遴选出一些老师参与命题,根据表现决定明年是否继续邀请,也就是说,哪个教师水平高、表现好、出题水准稳定,明年就还请他。这套制度让命题工作从人员的临时组合变成专业队伍的持续建设,同时形成了命题教师的准入和退出机制,让命题权力受到约束和监督,成为命题质量的重要保障。 其次,在考务管理方面,借鉴托福考试的办考经验,引入了标准化流程与机器阅卷。1981年,托福首次在中国开考,第一次使用机读答题卡,第一次施行英语听力考试。那时候我们才真正见识到什么是标准化考试——从铅笔的色度到答题卡的格式,每一个细节都有精确要求。由于担心国内铅笔色度不够,影响机器判卷的准确性,当时答题用的铅笔都是从美国运来的[5]。1985年,我们开始在广东进行高考英语标准化考试的试验,逐步推广了机读答题卡和光电阅读器。经过十几年探索,到20世纪末,机器阅卷已经成为高考的标配,不仅极大提高了效率,还实现了阅卷的客观公正。 最后,在风险管控方面,通过制度建设实现考试安全。风险管控是考试机构最敏感,也最不能出问题的环节。在实践探索中,我们逐步建立了一整套试卷安全管理制度:印制环节实行封闭管理,押运环节由武警或公安护送,存放环节实行双锁保管、24小时值班。到后来,试卷都是武警开车护送,全程监控,确保万无一失。这些现在看来习以为常的制度,都是当年一点一滴从实践中摸索出来的。每年高考期间,交警在考场周围站岗,禁止车辆鸣笛;环保局下禁令,考点和住宅区附近的工地要停工;天气预报按照春节同等规格,给高考预报三天的天气情况。这些跨部门的联动机制,形成了全社会护航高考的风险防控网络。 访谈者:您在任期间,还创办了《中国考试》这本杂志,当时是出于什么样的考虑?这份学术期刊与考试现代化的关系是怎样的? 杨学为:《中国考试》1991年创刊,当时考试中心已经成立四年了。为什么要办这么一本刊物?说起来,与我前面讲到的对专业化和科学化的追求是一脉相承的。首先是为考试研究安一个家。我前面讲过,80年代末我们去美国ETS访问,最震撼我的不是他们的技术,而是他们有一个庞大的研究团队,有自己的一整套学术体系和学术刊物。中国的考试要走向现代化,必须有一块土壤,让考试研究的种子能够生根发芽。我们希望有一个平台,能够汇聚全国乃至全世界关于考试研究的最新成果,让从事考试工作的人有一个思想交流、观点碰撞的地方。其次是推动经验向科学转化。我们给《中国考试》的定位,从一开始就不是单纯的工作通讯或政策解读性刊物。它的办刊宗旨很明确:繁荣考试评价学术研究、推动考试评价改革。为什么强调学术研究?因为中国考试最大的短板就是理论研究滞后于实践需求。我们有几千年的考试历史,积累了丰富的实践经验,但这些经验缺乏系统的理论提炼。教育测量学怎么用?心理测量学怎么指导考试设计?这些都需要有专门的阵地来讨论和传播[6]。所以《中国考试》从一开始就设置了很多学术性比较强的栏目,比如考试评价理论、测量技术等,目的就是引导大家把工作中遇到的现实问题上升到理论层面去思考,用科学的方法去解决。最后是培养专业人才,凝聚专业队伍。考试中心成立之初,全国从事考试工作的人员大多是行政干部出身,真正懂测量、懂考试的专业人才凤毛麟角。通过《中国考试》,我们一方面可以把国际上先进的考试理论、测量技术介绍进来,让国内的同仁学习借鉴;另一方面也可以把全国各地考试机构的实践经验、研究成果发表出来,互相启发、共同提高。现在《中国考试》的作者和读者广泛分布于国家及省市教育考试机构、教育研究机构和高等学校,这说明它确实起到了凝聚专业力量的作用。 三、未来发展方向与建议 访谈者:面向未来,您认为现代化考试机构最需要优先发展和强化的核心能力是什么? 杨学为:作为一个把大半辈子献给考试事业的老兵,我虽然退休多年,但一直关注着考试领域的发展,我认为三个方面的能力最为重要。 第一是人才评价的专业能力。考试机构存在的价值,不在于组织了多少场考试,而在于能不能科学、准确、公平地评价一个人的知识、能力和素养。面向未来,这种专业能力面临更高的要求。高考评价体系提出立德树人、服务选才、引导教学的功能定位[7],这要求考试机构不仅要会命题,更要深刻理解国家的人才需求、教育的发展方向,要能够把抽象的人才培养目标转化为可测量、可评价的考试内容。这种将教育理念转化为测评内容的专业能力,是考试机构不可替代的核心竞争力。 第二是技术融合应用的创新能力。我们那个年代,引入光电阅读器就是最大的技术革命。但今天,人工智能、大数据、云计算正在深刻重塑考试业态,这种技术融合体现在多个层面。比如说智慧命题,利用AI辅助命题、组卷,提高命题效率和科学性;智慧考务通过“一网统管”实现试卷全生命周期可追溯、考务人员精准化培训、考场监管智能化升级;智慧巡考利用AI识别异常行为,从人防为主转向技防为主、人机协同。未来的考试,可能不再是一张卷子考所有人,而是根据不同学生的特点,进行自适应测验、个性化评价,这才是技术带来的真正革命。 第三是开放互鉴的国际影响力。现在中国已经成为世界第二大经济体,教育考试也应该拥有与之相匹配的国际地位。我们应该继续学习借鉴,跟踪国际考试评价的前沿发展,吸收先进理念和技术;加强与海外知名考试机构的交流合作,推动考试结果的国际互认;讲好中国考试故事,让世界了解中国在人才评价方面的探索和贡献。我们有世界上规模最大、组织最严密的考试体系,要有建立中国特色现代化教育考试标准的自信,为世界教育评价贡献中国智慧。 第四,贯穿始终的是对公平公正的守护能力。无论技术怎么变、时代怎么变,考试机构守护教育公平的使命不能变。习近平总书记多次强调教育公平是社会公平的重要基础[8],考试作为社会流动的通道、人才选拔的关口,必须守住公平公正的底线。 访谈者:在建设教育强国和深化教育评价改革的背景下,您认为考试机构应该如何利用现代化手段把考试评价与其他评价方式科学地结合起来? 杨学为:在我工作的年代,主要解决高考这一把尺子怎么做才能更精准的问题;但今天你们要回答的是如何用好多把尺子,并且让这些尺子都能量得准、让人信得过,这比我们当年面临的挑战要复杂得多。“破五唯”不是不要考试,而是要让考试回归它应有的位置,它依然是重要的评价工具,但不是唯一的工具。如何将考试评价与过程性评价、综合素质评价、实践能力评价等结合起来,我想从理念、技术和实践三个层面谈谈看法。 首先,理念层面上必须实现从单一尺子到多元评价的转变。过去全国一张卷,因为它简单、公平、易操作。但今天社会对人才的需求已经发生了根本变化,技术快速迭代、产业形态重构,要求人才具备技术素养、跨界复合能力、高阶认知和创新能力。因此,评价理念必须从统一标尺向多元评价转型。这不是简单地增加几种考核形式就能实现,而是要构建一个技术赋能、多元融合、动态反馈的新型评价体系。这个体系要能够容纳不同的评价目的:育人导向的过程性评价负责引导学生的成长方向,诊断导向的水平性评价负责科学客观地“看见素质”,选拔导向的识别性评价服务于人才选拔。三种功能各司其职,又互为补充,这才是完整的评价逻辑。 其次,在技术层面要利用数智手段,让多把尺子变得可用可信。我们当年引入光电阅读器,解决的是效率和公平的问题;而今天的技术,有可能让过去被认为是“软”的、主观的、难以量化的评价变得可测量、可追溯、可比较。例如,过去我们说过程评价,实际上往往流于形式,因为老师没有时间记录,记录了也难以使用。现在依托信息化平台,可以实现学生学习过程数据的实时追踪,课堂表现、作业完成、小组合作等等都可以被记录、被分析。我看到有的学校通过全场景数据采集,形成了覆盖课前、课中、课后的智能诊断评价系统,实现了学生精准学、教师精准教。又比如综合素质评价,以前长期面临评价难落地的困境,现在人工智能技术的发展就为破解这个难题提供了可能,比过去凭印象打分要科学得多。 再次,在实践层面要稳妥推进,在探索中积累经验。理念有了,技术有了,真正落地还需要制度设计的智慧和耐心。我注意到各地已经开始了有益的探索,比如深圳有些学校的学生学业质量评价由期末考试、过程评价和学科综合展示评价三部分组成,提高了素养立意的综合展示评价占比。这种“结果+过程+表现”的组合,既保证了考试的客观权威性,又给其他评价方式留出了空间。这些努力就是朝着多元评价迈出的实质性步伐。 最后,必须守住一条底线,就是客观公平。任何评价方式的使用,都必须考虑不同地区、不同家庭背景学生的可及性。如果综合素质评价变成了家庭资源的比拼,那就背离了改革初衷。我们运用技术手段也是为了确保城乡、家庭等不同背景的学生都能获得标准化的考试体验。另外,技术的运用不能以消解考试的客观性为代价。过程评价、综合素质评价都很重要,但它们和考试的功能不同,过程能反映努力及努力的方向,但用过程直接表征结果,其科学性就可能出问题。考试仍然是衡量学业水平最客观的尺子,我们要做的不是用其他评价取代考试,而是让它们各司其职、相互补充。我们这一代人的主要任务是让高考这把尺子量得准、量得公平,你们的任务是要在这个基础上,让考试评价守住学业水平的底线,让过程评价引导学生的成长,让综合素质评价看见分数背后的“人”。这是一项前无古人的事业,也是一项必须做好的事业。希望你们能比我那一代人走得更远、做得更好。 访谈者:杨主任,您长期从事考试史研究,回望推动考试现代化的历程,您认为考试史研究给了您哪些启示?未来应该怎样更好地从历史中总结经验教训? 杨学为:我退休后花了很多时间在考试史的研究上,主编了《中国考试通史》,也写了一些文章。回过头看,当年推动考试现代化改革的那些实践和思考,其实都离不开历史给我的一些启示。 第一,考试从来不是孤立的技术问题,而是关乎国家治理、社会流动、文化传承的大问题。我研究科举史,最深切的一个体会就是科举制度在中国延续了1300多年,之所以能长期存在,根本原因在于它承担了多重功能:是选官制度,是教育制度,是社会整合的纽带,是儒家思想传播的载体。科举制以智力为选才标准,从全社会选拔出优秀人才出任各级政府官员,同时极大地促进了文化普及;它按地域分配录取名额,也有利于民族团结、国家统一。这让我认识到,考试机构不能只盯着命题技术、考务管理这些“术”的层面,更要理解考试在国家治理中发挥的“道”的功能。我们当年推动标准化考试、建立会考制度,表面上看是技术革新,本质上则是回答在改革开放新时期,考试应该承担什么样的社会功能?如何在效率与公平之间找到平衡?这些问题,如果不理解历史,就很难想透。 第二,考试始终处于矛盾之中,这些矛盾推动着考试不断改革与进步。我在研究唐宋时期的科举制度时发现,关于考经学还是考诗赋,考知识还是考能力的争论,贯穿了整个科举史。这些争论背后,反映的是考试自身的矛盾:内容与形式如何统一?科学性与公平性如何统一?其实这些问题都受到传统、政治、经济等社会因素的影响,受到考试的经验、理论、技术、条件等因素的制约。人们对考试的期望很高,而考试的结果又往往不尽如人意。因此,考试总是处于矛盾之中,人们对考试争论不断、爱恨交加,导致考试屡废屡复。正是这些矛盾、争论,推动考试不断改革与进步。理解了这一点,就不会因为遇到困难而气馁,也不会因为改革见成效而自满——考试改革永远在路上。 第三,要从历史中总结经验教训,必须立足当代问题,带着问题意识去研究。我们不可能期望考试史的研究解决所有考试的问题,但是没有考试史研究的基础,很多考试问题就不能得到很好认识和阐释。历史上考试中遇到的诸多问题,比如户籍问题、作弊问题、命题问题、片面应试问题等等,于当今的考试中无不一一遭遇。以片面追求升学率这个问题为例,我研究过克服“片追”的各种方案,发现很多方法之所以无效,是因为没有建立适应双重任务的评价制度。这个认识,直接影响了后来我们对会考制度的设计,就是让会考成为评价高中教学质量的另一把尺子,与高考分开使用。所以我认为,未来的考试史研究,不能停留在写历史的层面,而是要真正走向用历史,要带着现实问题去回溯历史,看看历史上的人们是怎么处理类似问题的,哪些经验可以借鉴,哪些教训必须记取。 第四,要深化考试文化研究。2017年,在恢复高考40周年的时候,我写过一篇文章,最后提出一个观点:未来的考试研究重在考试文化的研究[9]。为什么这么说?因为技术层面的问题,随着科学的发展、技术的进步,总能找到解决方案;但文化层面的问题,比如社会对考试的态度、考试价值观的塑造、考试与社会流动的关系,这些问题更根本,也更复杂。考试不仅是一种制度、一种技术,更是一种文化现象。科举文化中读书做官的价值取向如何影响了中国人的集体意识? 这种心理在当代高考中如何延续和变化?这些问题,关系到教育评价改革能否真正落地。科举文化中所蕴含的浓厚功利性导向,以及全社会过度重视考试的心理惯性,在当今高考语境下依旧顽固地存续着。要改变这种状况,单靠制度改革是不够的,还需要文化的重塑。 我这一生,先是做事,后是研究事。做事的时候,历史给了我智慧和定力;研究事的时候,现实给了我方向和动力。如果说有什么经验可以分享给后人,那就是既要向前看,拥抱新技术、新理念、新方法;也要向后看,从千年的考试史中汲取智慧。考试是古老的事业,也是常新的事业。唯有时刻保持历史的眼光,才能在纷繁复杂的现实中看清方向、守住底线、有所作为。
参考文献略。