2025-03-25
引用格式:刘友棚, 洪秀敏. 人机交互技术辅助儿童发展评估:现状、特征与展望[J]. 中国考试, 2025(3): 51-60.作 者刘友棚,中国教育科学研究院基础教育研究所助理研究员。洪秀敏,北京师范大学学前教育研究所所长,教授(通信作者)。摘 要:探索人机交互辅助儿童发展评估有助于推进新时代儿童心理发展与教育评价改革。当前,以触屏设备和类人型机器人为代表的人机交互技术被广泛应用于辅助儿童发展评估,它们通过创设基于游戏的评估情境、即时给予儿童积极性反馈、模拟真实的社交互动行为、监测儿童情绪反应以及自动记录评估数据等方式,强化了儿童发展评估的游戏趣味性、具身互动性、真实属性以及便捷高效等特征。面向未来,应积极推动人机交互与儿童发展评估的深度融合,借助人机交互技术探索个性化评估、实施纵向性评估、推进多模态评估,为儿童身心全面发展提供更为精准、适宜的教育指导和支持。关键词:人机交互;儿童发展评估;数字化评估;教育评价改革一、问题提出儿童发展评估是指通过观察、访谈、测验、实验、调查等技术手段,获得儿童的有关身体、动作、语言、认知、情感、社会能力等方面的数据和信息,进而对其发展状况做出价值判断的过程[1]。实施儿童发展评估是确定儿童发展水平的必要手段,对于衡量教学计划或活动是否达到预定目标、调整和实施适宜性教育教学、促进儿童健康发展具有重要的价值意义[2]。当前,我国儿童发展评估方式以量表、测验、观察、访谈等为主,为人们了解儿童发展状况提供了重要依据。然而,随着评估理念和技术的迭代更新,这些评估方式的局限性日益显现。例如,使用量表评估时,对婴幼儿或未识字儿童的评估多依赖于家长或教师来填写,儿童主体性在评估中被严重削弱。又如,在结构化访谈评估中,答案选项通常由评估者事先准备好,无法充分反映儿童的实际想法,也不适用于年龄较小或语言发展缓慢的儿童。中共中央国务院在《深化新时代教育评价改革总体方案》中明确指出,要充分利用信息技术,提高教育评价的科学性、专业性、客观性,利用现代信息技术创新评价工具[3]。如何利用现代信息技术革新优化传统的儿童发展评估方式,是教育评价领域一个亟待探索的问题。近年来,人机交互技术为儿童发展评估的革新优化提供了新路径。人机交互是指通过机器/计算机/机器人输入、输出设备以及相应的软件,以有效方式实现人机对话的一种技术[4-5]。依据接触的程度,人机交互可划分为接触式交互(如键盘、触屏等)和非接触式间接交互(如眼动追踪、语音识别、面部识别等)。近年来,随着人机交互技术的普及,国内外学者尝试将人机交互应用于儿童发展评估中,如采用触屏设备(touchscreen)、类人型机器人(humanoid robot)等,将传统线下评估中呈现的纸质评估材料、口头描述评估任务、手动记录评估结果等转变为触屏设备或类人型机器人自动呈现评估材料和评估任务、自动录入和保存评估结果。此类评估利用人机交互的互动性、趣味性及便携性等功能特征,充分激发和维持儿童的具身性参与,能够确保评估采集到更为真实、有效的数据。可以说,人机交互技术在赋能儿童发展评估上具有巨大潜力。本文聚焦人机交互辅助儿童发展评估这一核心话题,通过梳理分析国内外新近文献,阐述人机交互辅助儿童发展评估的现状,总结其发展特征,并据此思考和展望人机交互技术应用于儿童发展评估的未来方向,以期为新时代教育评价改革创新提供参考。二、人机交互辅助儿童发展评估的现状本文主要以触屏设备和类人型机器人两类典型性技术为例来考察人机交互辅助儿童发展评估的基本现状。下文围绕这两类技术模式予以阐述。(一)触屏设备辅助儿童发展评估触屏指一种可以感知并且对触碰到屏幕的物体(例如手指、输入笔等)作出响应的电子显示屏。智能手机、平板电脑、触屏电脑等都是触屏技术的应用体现[6]。触屏不仅可以为用户提供可视化信息内容,还可以感知和理解人类行为并接受用户的直接输入。以平板电脑为例,用户可以对电子屏幕进行点击、拖动、滑动、自由旋转、捏压、轻弹等触摸方式,或者输入文字、语音,向平板电脑发出指令,以实现自身的需求。触屏设备辅助儿童发展评估主要以多点触控、手势识别、语音识别等为技术支撑,通过触屏设备的动画、语音等功能来呈现评估材料、解读评估任务,儿童根据触屏设备的语音提示、图片提示或视频,通过各种触摸方式回应触屏设备,还可通过语音表达与其进行互动,触屏设备自动记录儿童的触屏或语音数据,以完成整个评估。1.儿童对触屏设备的接受情况儿童对触屏设备的接受程度直接影响评估效果。因此,在阐述触屏设备辅助儿童发展评估之前,有必要了解儿童关于触屏设备的接受情况。对于当代儿童而言,触屏设备是其最常接触且最为感兴趣的人机交互技术之一。一方面,许多儿童从小成长于能够接触触屏设备的环境之中。我国上海地区一项针对1~3岁儿童的调查显示,96.5%的儿童在家庭中有使用智能手机的经验,87.7%的儿童在家庭中有使用平板电脑的经验,47.4%的儿童每天至少使用一次智能手机[7]。针对英国儿童的调查发现,三分之二的儿童拥有自己的智能手机[8]。另一项针对美国低收入家庭的研究发现,50%以上的儿童在3岁时便拥有自己的平板电脑[9]。可见,当代许多儿童的日常生活离不开触屏设备,即使是年龄较小的婴幼儿,日常活动也与触屏设备紧密相联。另一方面,儿童熟悉操作触屏设备。Aziz等在马来西亚和英国调查了2~5岁儿童在使用iPad时的触屏能力,发现2岁的幼儿已掌握了点击和拖动/滑动的触屏方式,3岁的幼儿能够使用点击、拖动/滑动、自由旋转、拖放、捏压和轻弹的触屏方式,4岁幼儿的触屏模式已接近成人[10]。与此同时,由于触屏设备包含许多具有教育性的游戏类应用程序,可以为儿童提供有别于现实生活的游戏体验,儿童能够从中获得愉悦的情绪感受[11]。总体而言,当代儿童不仅在日常生活中经常接触智能手机、平板电脑等触屏设备,而且能够较为熟练地使用触屏设备。这意味着,将触屏设备作为辅助儿童发展评估的工具具有可行性,儿童在参与评估时有能力自主操作触屏设备,以完成评估任务。2.触屏设备辅助儿童发展评估的模式触屏设备辅助儿童发展评估的模式主要表现在三方面,即创设基于游戏的评估情境、增强评估过程的即时反馈、自动记录儿童的评估数据。首先,通过触屏设备创设基于游戏的评估情境,让儿童在参与游戏的过程中顺利接受评估。触屏设备的视频、图片、音频等功能可以为儿童创设富有故事性的情境画面(如卡通人物、情节故事等),促使儿童在游戏中完成评估任务。例如,刘倩倩通过触屏设备创设了“熊猫乐园”这一游戏情境,以评估3~6岁幼儿的国家知识、爱国判断、国家归属、国家自豪、国家自尊、探索了解、尊重保护等国家认同发展指标。该评估以卡通熊猫闯关为游戏主题,借助触屏设备中的熊猫形象向幼儿讲述游戏规则、提出问题(测评题目)等,幼儿根据熊猫指令操作屏幕(触屏互动)或以语音回答问题(语音互动)来完成评估任务[12]。又如,澳大利亚纽卡斯尔大学研究人员Day等开发了一款旨在评估6~12岁儿童社会情感发展的游戏应用程序Rumble's Ques。在该评估中,儿童可选择一个卡通人物作为游戏角色;游戏过程中,代表儿童的卡通人物会遇到另一个主角(一个名为Rumble的迷路孩子);儿童的任务就是帮助Rumble找到回家的路。在这一过程中,儿童需通过触屏设备与Rumble进行交流,Rumble则会通过提问了解儿童的社会情感发展水平,提问形式包括图片、文字和语音播放,提问内容为测评题目[13]。再如,美国3C研究院(3C Institute)研究人员Craig等通过一款名为Zoo U的智能化游戏系统,评估7~12岁儿童的社会问题解决能力[14]。在游戏开启前,儿童可在系统中选择男性或女性头像以及相应服饰,以代表自己在游戏中的角色身份;在游戏过程中,儿童通过点击虚拟人物启动对话,并根据情境任务选择代表行为决策的图片(实为测评题目),以完成评估目的。可以说,将触屏设备应用于儿童发展评估,最为常见的方式就是借助触屏设备创设一种游戏化的评估情境。评估任务以游戏形式呈现,儿童在评估中不再被认为是被评估对象,而是游戏玩家,在不知不觉中完成评估。其次,通过触屏设备即时给予儿童积极性反馈,确保儿童在评估过程中保持较好的注意力。受身心发展特征的影响,儿童在参与评估中较易分散注意力,尤其在一些测评内容较多的评估中,难以长时间维持参与到评估中的状态。因此,评估需要及时给予儿童反馈。从现有研究看,基于触屏设备的评估在儿童完成每一个评估项目时,均会即时以语音或动画的形式给予其积极反馈。例如,陈靓影基于触屏设备评估了4~6岁孤独症儿童对自我的认知和对赞赏的反应,评估以人机交互的游戏形式进行。在其评估系统中,当儿童每答对一道题,系统即会发出“你真棒!”“你真厉害!”等赞赏性语音反馈[15]。在刘倩倩所研制的学前儿童国家认同游戏化评估系统中[12],当儿童完成每个关卡任务时,游戏中的卡通熊猫均会发出语音“恭喜你,小朋友,你已经完成第一关啦,继续加油吧!”,以激励儿童继续参与游戏,直至完成所有的评估任务。最后,通过触屏设备自动记录评估数据,可以实现评估过程的便捷高效。触屏设备中的触摸屏技术、语音识别技术、无线联网技术等能够记录、存储儿童的触屏行为和语音内容,以此作为评估儿童发展水平的重要指标。例如,McKown研究团队所研制的儿童社会情感能力评估系统SELweb,能够自动记录儿童的触屏或点击鼠标的反应并生成报告以反馈给教师[16]。上文所提到的Rumble's Ques评估系统、“熊猫乐园”等,其内部系统均能自动记录幼儿触屏的图画选项及其回答卡通人物时的语音内容,并自动整理和输出相应的数据结果。总之,在触摸屏技术、语音识别技术以及无线联网等技术的加持下,儿童在评估系统中的诸多反应均被自动记录、存储和处理,整个评估程序相对便捷高效。3.触屏设备辅助儿童发展评估的成效多项研究证实,基于触屏设备的儿童发展评估具有良好的信效度。例如,Frank等通过探究触屏设备评估1~4岁婴幼儿认知发展,发现触屏设备辅助儿童认知评估的可靠性,与行为数据记录、眼动追踪等评估方式的成效相近,部分表现还更有优势[11]。Derosier研究发现,儿童社会问题解决能力评估系统Zoo U的评估结果与教师或家长所报告的儿童社交技能水平之间存在显著相关[17]。再如,刘倩倩的研究发现,基于传统测验法获得的数据与基于触屏设备所获的数据之间存在高相关,相关系数介于0.83~0.87[12]。高春颍等认为,触屏设备辅助儿童发展评估具备良好的可行性和有效性,能够应用于儿童多领域的评估之中[18]。可以说,触屏设备应用于儿童发展评估的成效能够达到甚至超越传统评估方法。总体而言,在基于触屏设备的儿童发展评估中,评估的游戏性、趣味性得到凸显,儿童对评估具有较大的兴趣和主动性,其视觉、听觉、触觉等均参与其中,儿童在评估中的具身性被充分激发。(二)类人型机器人辅助儿童发展评估类人型机器人指一种在现实环境中基于以人为本的方式与人类共同互动的实体化机器人,具有物理存在性、自主或半自主行动性以及基于社会规范的互动性等特征[19-20],如国际市场上流行的Nao机器人、Pepper机器人、QT机器人等。类人型机器人以语音识别、情绪识别、肢体动作捕捉、传感器、编程、仿生科技等为技术支撑辅助儿童发展评估,通过语音、肢体动作等为儿童呈现评估材料、解读评估任务,儿童根据类人型机器人的指令做出语音、眼神、肢体动作等反应以完成评估任务,类人型机器人自动记录儿童的评估数据。1.儿童对类人型机器人的接受情况作为一种新型技术产品,类人型机器人形象生动,且具有语音互动、动作表达、面孔识别、答疑解惑等功能,对于儿童而言具有较强的吸引力。首先,类人型机器人易于激发儿童的好奇心,吸引儿童的兴趣。有研究发现,92%的儿童对类人型机器人表现出喜好之情[21]。儿童天生对玩具情有独钟,类人型机器人由于具有类人特征,且一定程度上能说会道、行动方便,其功能超越了如洋娃娃、汽车模型等传统玩具,因而深受儿童青睐。其次,儿童与类人型机器人之间关系较为和谐。李洁等发现,学前儿童在心理属性和知觉属性上均认为机器人具有感知性和情感性,他们想与类人型机器人成为朋友并与之互动的意愿较积极[22]。Kahn等同样发现,儿童认为机器人具备智力、兴趣、情绪情感等心理特征,并赋予其友善、可信任等品质[23]。即使有研究者向儿童告知机器人的机器性质,儿童关于机器人具有思维、情感等心理能力的看法并未被削弱[24]。再次,儿童能够自主操作和使用机器人。有研究发现,12个月大的婴儿可通过类人型机器人的目光凝视来进行物体学习(object learning)[25],年仅3岁的儿童便可通过机器人干预习得计算思维概念[26],4岁儿童即能使用编程来设计和操控机器人[27]。最后,类人型机器人正逐渐融入儿童的日常生活中。美国商业情报联盟(Allied Business Intelligence)预测,到2024年,全球超过7900万个家庭至少拥有一台智能机器人[28]。可以预见,随着机器人技术的迅速发展,类人型机器人将像智能手机、平板电脑那样成为儿童生活和学习的重要组成部分。总体来说,儿童与类人型机器人之间关系和谐,儿童通常会将类人型机器人视为好朋友、好伙伴。类人型机器人具有自主或半自主行动性,儿童只要具备基本的听说能力,就能与类人型机器人进行互动。这为类人型机器人有效赋能儿童发展评估提供了重要支撑,确保类人型机器人辅助儿童发展评估具备可行性。2.类人型机器人辅助儿童发展评估的模式类人型机器人辅助儿童发展评估的模式的主要特征包括能够模拟真实的社会交往情境、监测儿童的情绪反应、即时给予儿童积极性反馈、自动记录儿童的评估数据等。本文主要介绍前两个方面。其一,借助类人型机器人模拟真实社交互动情境,为儿童创设自然化的评估环境。类人型机器人主要通过语音识别、眼神互动、肢体互动等创设较为真实的社交情境,儿童在与其互动过程中完成评估任务。类人型机器人一般具有眼睛、嘴巴、手、脚等类人部位,可以模仿人类的方式与儿童进行互动,引导儿童完成评估。例如,Ramírez-Duque等使用类人型机器人评估特殊儿童的联合注意力[29]。具体来说,在评估之前,儿童与类人型机器人进行3~5分钟的游戏,以增进儿童与机器人之间的熟悉感。评估任务开启后,类人型机器人要求儿童眼睛看向房间的某一玩具(如直升机、摩托车、卡车等),通过语音发出诸如“小明,请你看看直升机”这样的指令,如果儿童在五秒之内作出正确反应,类人型机器人则会进一步通过语音或肢体动作鼓励儿童,如“小明,干得好!让我们继续下一步任务”。在这一过程中,机器人发出的指令由单一逐渐转为多维,评估任务由简单趋向复杂。Leite等的研究则认为,类人型机器人所表现出来的注意力引导、同理心以及所营造的社交情感氛围,都在不断向真实的社交互动情境靠拢[30]。可以看出,类人型机器人在评估中扮演着人类评估员的角色,能够模拟真实的社交互动情境,并借助语音指令、赞赏表扬等引导儿童在人机互动中完成评估。其二,类人型机器人可以监测儿童在评估期间的情绪反应。其主要通过情绪识别等技术了解儿童参与评估过程中的情绪状态。Alnajjar等在研究中使用类人型机器人评估特殊儿童的注意力水平[31]。评估期间,类人型机器人与儿童进行游戏对话,置于类人型机器人胸前的摄像头能够随时检测儿童的脸部,并根据儿童脸部进入摄像范围的面积给予儿童注意力1~5的评分;与此同时,类人型机器人能够对游戏对话期间的儿童情绪状态(快乐、悲伤、愤怒、惊讶和中性)进行即时监测。相对传统评估而言,仅凭肉眼难以准确区分儿童脸部的情绪表现,尤其一些微表情难以被及时发现和监测;但对于类人型机器人而言,实现这一目的则较为容易。3.类人型机器人辅助儿童发展评估的成效当前,多数研究将类人型机器人应用于特殊儿童的相关评估和诊断中(如多动症、联合注意力等),并证实类人型机器人的评估成效是乐观的。例如,Choi等借助类人型机器人评估小学三年级至四年级儿童的多动症[32]。评估期间,类人型机器人要求儿童完成相应任务,其内部系统中的传感器会对儿童的行为和动作进行即时检测和评估。结果发现,类人型机器人对儿童多动症的评估准确率高达97%,可以成为临床医生和特殊教师用于诊断儿童多动症的实用工具。Ramírez-Duque等的研究发现,类人型机器人能够通过对联合注意力的评估帮助医生诊断儿童的孤独症情况[29]。Alnajjar等的研究同样发现,类人型机器人对儿童注意力状态的评估结果与治疗师评估结果有80%以上的一致性[31]。可见,将类人型机器人应用于特殊儿童的发展诊断具有显著成效。总体而言,如果将基于触屏设备的评估看作单一系统的人机交互平台,那么类人型机器人辅助儿童发展评估则可被视为合成多个系统的人机交互平台。也就是说,基于触屏设备的评估依赖于单一的电子屏幕,而基于类人型机器人的评估,则通过类人型机器人的目光凝视、面部表情、身体运动、头部运动、手势、人际距离控制和语音交流等与儿童进行自主或半自主的沟通,引导儿童完成评估任务。三、人机交互辅助儿童发展评估的主要特征相比于量表、观察、访谈等传统评估方式,人机交互辅助儿童发展评估的价值特征主要体现在四个方面,即游戏趣味性、多维互动、真实属性、便捷高效等。(一)赋予评估游戏趣味性,适应儿童心理发展特征游戏是儿童基本生存的需要,是儿童身体活动、认知活动、社交活动的需要[33]。儿童在游戏情境中,能够充分地表现自己。因此,为儿童创设一个富有游戏性的评估情境,并强化其趣味性,有助于儿童在评估中表现出自己的真实水平,提升评估的有效性。首先,触屏设备、类人型机器人通常安装有娱乐性游戏、教育性游戏等软件程序。通过人机交互技术来呈现评估任务,可以将评估“包装”成游戏,进而促使儿童从心理上视评估活动为游戏。因此,当儿童看到触屏设备或机器人时,参与评估的积极性和主动性就会被大大激发。其次,人机交互技术辅助下的评估过程富有游戏性。人机交互技术在创设丰富的视觉和听觉情境、提供虚拟角色互动、即时给予奖励等方面具有优势,能够为儿童在参与评估的过程中提供良好的游戏体验,更容易鼓励、引导儿童有效完成整个评估流程。(二)增进评估的多维互动,促使儿童具身参与评估儿童的身心机能仍处于发展阶段,这也意味着儿童在参与评估期间可能存在注意力分散或精神集中时间不持久等问题,从而影响评估成效。因此,理想的评估工具应当既能轻易激发又能够较长时间维持儿童参与评估的兴趣、好奇心、注意力等。从已有研究来看,人机交互技术辅助下的儿童发展评估在这方面具有显著优势,其评估任务通常经由图片、视频、音频、机器肢体动作等多种方式传递,能够从视觉、听觉、触觉、动觉等多个维度增进儿童在评估过程中的多感官互动,促使儿童在持续性、多通道的互动过程中维持良好的兴趣、好奇心、注意力等,确保儿童具身性参与评估,以采集到真实、有效的数据。(三)追求评估的真实性,激活儿童现实生活经验当个体处于一个较为真实的虚拟情境时,大脑中的镜像神经元就会被激活,个体大脑即会联系以往真实生活中的相似经验,呈现与当下所看到的事物相似的画面[34-35]。在评估中,要想激活儿童的镜像神经元,让儿童通过评估材料的刺激联想到其现实生活经验,进而表现出真实的发展水平,评估工具需要具备高水准的真实属性。基于人机交互技术的评估为实现这一目的提供了可行性路径。例如,在类人型机器人辅助下的评估中,机器人在某种程度上扮演儿童的同伴、教师、朋友等角色,通过编程、联网等操作,与儿童进行语音、肢体、眼神等互动,为儿童创设了一个近乎真实的社交情境。当儿童在与类人型机器人互动时,会比较容易以自然的方式激活并运用以往生活经验,从而采集到儿童更真实的表现数据。(四)实现评估的便捷高效,保障评估工作的效率水平相比传统评估方式,人机交互辅助下的儿童发展评估更为便捷高效。首先,人机交互技术有助于减轻测试者的负担。在传统的评估中,测试者一般需要先通过开展游戏来激发儿童的兴趣,增进儿童对评估环境的熟悉程度;评估过程中,测试者需要手动记录儿童的反应;为防止儿童注意力分散,测试者还需要多次提醒儿童关注评估任务本身。而利用人机交互技术进行评估时,评估前的熟络环节、评估中的数据记录、注意力提醒等均可由触屏设备或类人型机器人自主完成,测试者只需在旁观察儿童与触屏设备、类人型机器人的互动即可。其次,人机交互技术有助于增加评估结果的客观性。人机交互辅助下的评估具有高度结构性,即每一位儿童所接受的信息都是一致的,这有助于减少其他因素对数据采集的影响。例如,在以往的访谈评估中,测试者需要为每位儿童介绍访谈内容并提出问题,但测试者访谈时的语调、语速、情绪等可能会产生变化,因此无法保证儿童接收的信息是一致的。基于人机交互的评估则可在相关技术的支持下确保每一位儿童所接受的评估情境是一致的,由此避免主观因素的干扰。最后,人机交互技术有助于采集到更多类型的表现数据。触屏设备、类人型机器人等均包含诸多技术功能,如语音识别、情绪识别、肢体动作捕捉、传感器、编程、多点触控等。通过对这些技术的综合应用,基于人机交互的评估工具能够在同一时间内采集到儿童的多种类数据,有利于更立体、综合性地评估儿童的发展。四、人机交互辅助儿童发展评估的未来展望科学、规范的儿童发展评估是检验教育适宜性与有效性的关键,它可以为调整及改进教育工作、促进儿童健康成长提供宝贵依据。本文以触屏设备、类人型机器人为两个重要手段,以点带面,展现和讨论人机交互技术在辅助儿童发展评估的广阔前景和独特价值。诚然,人机交互技术并非只包括触屏设备和类人型机器人,尤其在科技迅猛发展的当下,其范畴愈发广泛。面向未来,教育工作者应更加积极地拥抱人机交互技术,充分发挥人机交互的功能优势,系统优化与创新儿童发展评估方式,为儿童的全面发展提供更精准、更适宜的教育引导与支持。(一)探索个性化评估,满足特殊儿童发展的特殊需求相比于常规儿童,特殊儿童的身心发展需求往往更加复杂。因此,针对特殊儿童的评估,亟待摒弃传统的评估方式,转而借助人机交互技术开发更具个性化的评估系统。例如,对于具有超常智力、创造力或特殊能力的天才儿童,传统评估方式难以准确反映其真实发展水平,而基于人机交互的评估在这方面则具有优势。通过虚拟现实(VR)和增强现实(AR)技术,结合自适应技术和先进的机器学习算法等,可以为他们打造一系列量身定制的智能化评估方案。这些技术不仅能够模拟出各种真实且富有挑战性的场景,还能够根据天才儿童的表现与反馈实时调整评估的难度与复杂度,进而更加精准地识别出天才儿童的发展需求,提供个性化的发展指导。又如,对于孤独症儿童而言,他们在社交互动上存在一定障碍,且对常规化的评估环境容易感到不安。基于人机交互的评估则可以通过新奇的评估界面和友好的交互方式,唤起孤独症儿童的兴趣与注意力,降低其防备心理,引导他们在相对轻松的氛围中接受评估[36]。未来应主动将人机交互技术应用于个性化评估中,帮助家长和教师掌握特殊儿童的发展需求,助力特殊儿童的个性化发展。(二)实施纵向性评估,追踪儿童发展的全过程儿童的发展是一个持续变化的动态过程,这意味着任何单一性评估都难以准确反映出儿童的真实水平。尤其对于低龄儿童而言,他们的身心发展日新月异,当下所评估出的发展水平可能在下个月就会发生显著变化。因此,对儿童发展水平的判断不能仅停留在一次性的、静态的评估上,而应采用纵向评估方式,持续、系统地记录儿童的发展情况。然而,传统的评估方式通常需要耗费大量的人力、物力和时间,难以保证儿童评估工作的连续性。相比之下,人机交互评估系统应用较便捷,儿童能够自主操作,且评估系统能对儿童发展的数据进行自动化采集和储存,大大减轻了评估人员的工作负担,提高了评估的工作效率。未来应充分发挥人机交互的技术优势,更广泛地开展儿童纵向性评估,追踪儿童发展的全过程,及时发现儿童发展过程中的问题与不足,并持续为家长和教育者提供具有阶段适宜性的教育建议和指导。(三)推进多模态评估,关注儿童发展的综合性特点儿童的发展是一个多维度、全方位的过程,涵盖了认知、情感、社交、运动、语言等多个方面。传统评估往往只能采集儿童发展的单一数据,无法对其发展的多个维度进行评估。然而,人机交互为儿童的多模态评估提供了重要的技术支撑。所谓多模态评估,即借助摄像、语音识别、自然语言处理、可穿戴设备、传感器等技术或设备采集与儿童相关的音频、视频、图片、文字等多模态信息,并在特定算法的支持下,将来自不同采集装置的数据进行有机整合,形成完整的儿童发展图谱,最终实现对儿童发展的综合性评估[37-38]。例如,人机交互多模态评估系统通过融合多种数据信息采集装置,不仅能够实时监测儿童的心率、体温、运动状态等生理数据,而且还能采集儿童的语音、表情、社交等情感信息,进而对儿童的综合性发展水平进行评估,帮助家长和教师系统了解儿童的发展全貌。未来应积极应用人机交互技术开展多模态评估,通过设置多种先进的数据信息采集装置,拓展儿童数据采集的范畴,并对多模态数据进行系统分析,以更加深入地洞察儿童的健康成长和身心发展。参考文献略
2025-03-25
引用格式:柳博, 李新煜.高考英语听力考试发展历程与改革路径探析 [J]. 中国考试, 2025(3): 25-30.作 者柳博,教育部教育考试院命题三处处长,研究员。李新煜,教育部教育考试院命题三处,助理研究员。摘 要:听力考试是高考英语的有机组成部分,在考查英语综合语言运用能力、引导中学英语教育教学方面发挥重要作用。由于受到教育教学、试题命制及考试实施等条件因素的制约,听力考试纳入全国高考英语的时间较晚,在实践中尚存在发展不平衡、不充分的问题。推进高考英语听力考试改革,应以学科核心素养为导向,强化考查综合语言运用能力,深化考试内容与形式改革,扩大机考改革试点,不断提升考试技术。关键词:高考英语;听力考试;制约因素;考试改革;机考作为广泛使用的国际通用语言,英语是我国外语教育的主要语种,也是高考的重要科目。高考英语主要考查听力、阅读、写作及口语表达等方面的能力。听是英语学习和交流过程中必不可少的技能,英语听力是即将进入高等学校的学习者在接受专业教育或进行学术研究的必备能力之一。高考英语听力考试发挥着考查综合语言运用能力、引导中学英语教育教学、提升学生英语学科核心素养的重要作用。纳入高考考查范围以来,英语听力考试在内容与形式等方面取得了长足进步,但也存在各地考试模式不统一的问题。这些差异不仅反映出高考英语听力考试发展中存在不平衡、不充分的问题,更体现了对于听力考试进行系统化研究的重要性和必要性。推进新时代英语教学评一体化改革发展,应进一步深化高考英语听力考试内容与形式改革,强化综合语言运用能力考查[1]。一、高考英语听力考试的发展历程不同于阅读、写作等其他语言技能考试,高考英语听力考试对考试设施设备、考场组织管理及中学教育教学基础有着特殊要求,是随着国家的经济实力、教育水平和考试组织能力的不断提升而逐步发展的。我国高考英语听力考试的发展历程大体可以分为三个阶段。(一)酝酿萌发阶段(1952—1999年)1952年,教育部发布《关于全国高等学校一九五二年暑期招考新生的规定》,标志着全国高等学校统一招生考试制度的建立。当时,只有报考外语专业的考生须加试外语,但加试成绩不计入总分,仅供录取时参考[2],有俄语和英语两个语种供选择。这是高考外语考试的肇端。1978年,即高考恢复第二年,英语开始成为必考科目,报考外语院校或专业的考生还须参加口试[3]。各省根据当地实际情况,组织开展语言能力面试,主要包括对听说能力的考查。这一招考规定延续至今。1989年,国家成立高考英语命题专家委员会,开始按照标准化考试的规范要求进行命题。尽管当时已经意识到听力考试的重要性,但囿于不同区域的经济社会发展和教育教学条件差异较大等现实情况,一直未将听力列入全国统一命题考试的考查范围。(二)创立探索阶段(2000—2013年)随着改革开放不断深化,经济社会快速发展,国家对各类人才的英语综合能力要求也越来越高。在听力技能考查方面,高考不考,则学校不教、学生不学,英语教育教学界对将英语听力纳入高考考查范围的呼声越来越高。同时,各级教育行政部门对英语教育教学也越来越重视,加大师资能力和设施设备建设,开展听力技能考查的条件也日益完备。经过充分研究论证和考试准备,2000年,全国高考英语试卷增加听力考试,首次命制听力部分占全卷权重13%和20%的两种试卷[4]。2003年,教育部在原教学大纲的基础上制订了各学科普通高中课程标准[5]。根据《普通高中英语课程标准》有关听力测试“在学期、学年考试和结业考试中所占比例应不少于20%”的要求,高考英语明确听力部分占全卷分值20%的权重[6]。但部分地区由于师资力量、教学条件等方面的限制,难以有效开展英语听力的教学和测试。为了适应各地教育教学实际,高考英语2004年推出含听力试卷和不含听力试卷供各省(区、市)使用,以确保不同地域的考生能够在相对公平的条件下参加考试。经济全球化背景下,国家对新世纪人才的外语素质有了新的更高要求,更加强调综合语言运用能力,各地开始探索高考英语考试内容与形式改革,以更好满足国家对人才选拔的要求以及教育教学实际。由于听力考试容易受到考试设备和考场环境等因素的影响,为保障考试安全性和稳定性,2009年起,浙江、天津、云南等省市开始探索实施听力单独考试,每年提供两次考试机会,取较高成绩计入高考总分。2011年,为了将英语听力和口语考试从选考科目变为必考科目,提高学生的英语实际应用能力,广东省率先探索实施高考英语听说机考,将听力和口语技能融合考查,每年3月组织一次考试,满分为15分(从2021年起调整为20分),计入高考总分。多年实践表明,听力单独考试模式具有显著优势:一是强化对听力技能的考查,正向引导教学;二是提供多次考试机会,减轻学生的备考压力;三是即便听力考试过程中发生意外情况,其对高考整体组考工作影响较小,相应地降低了风险防控难度。(三)改革发展阶段(2014年至今)2014年,国务院发布《关于深化考试招生制度改革的实施意见》,新一轮高考综合改革启动。外语作为普通高校招生全国统一考试科目,除每年6月统一举行一次考试之外,还鼓励有条件的省(区、市)积极开展改革试点,提供两次考试机会[7]。在实践探索过程中,英语听力成为“一年两考”改革的着力点,全国主要形成了四种新模式。第一种是纸笔+机考模式。2017年,上海开始实施高考英语听说机考,对听和说进行综合考查,但重点考查英语口语能力,每年提供两次考试机会,分别在1月和6月举行,满分为10分,在6月的高考纸笔考试中仍保留听力部分。第二种是纸笔连考模式。2020年,山东开始实施听力单独考试,采用纸笔形式,于每年1月连续举行两次考试,满分为30分,在6月的高考纸笔考试中不再保留听力部分。第三种是机考模式。2021年,北京开始实行高考英语听说机考,每年提供两次考试机会,分别在12月和3月举行,满分为50分,在6月的高考纸笔考试中不再保留听力部分。第四种是纸笔两考模式。2024年,贵州开始实施听力单独一年两考,1月和6月分别举行一次听力纸笔考试,满分为30分。上述四种模式下的两次听力考试成绩,均取考生的最高得分计入高考总分。截至目前,全国共有27个省(区、市)将听力成绩计入高考总分。这种做法有利于全面考查英语语言运用能力,对中学英语教育教学起到积极引导作用,也得到了高等院校的广泛支持。回顾高考英语听力考试的发展历程可以发现,高考对听力技能考查日益重视,对综合语言运用能力考查日益加强,使传统英语教育教学和考试评价过程中普遍存在的重读写、轻听说现象有了相当的改观。特别是近年来高考听力考试改革产生的效果显而易见。首先,多种考试模式并存,有利于各地根据实际教情学情考情组织考试,促进教考衔接,提高学生英语水平;其次,为考生提供两次考试机会,打破“一考定终身”,缓解学生应考压力;最后,将听力考试与其他部分考试分开施考,有利于集中精力实施听力考试,分散工作压力,维护英语考试整体的安全性和稳定性。同时,也要清醒地认识到,听力考试改革也会使教育教学、试题命制及考试实施面临更多挑战。当前,仍然有部分地区未将听力成绩计入高考总分,这既有现实资源条件约束的客观原因,也有对听力考试的重要性认识不足的主观因素。二、高考英语听力考试发展的制约因素高考英语听力考试在发展过程中主要受到教育教学、试题命制和考试实施三个方面条件因素的制约。当前,高考综合改革省份的高考英语听力考试呈现多种考试模式共存的特点,也大多是这些因素共同作用、相互妥协的结果。(一)教育教学条件我国幅员辽阔,不同地域英语教育教学水平存在较大差异。总体上,优质教育教学资源主要集中在经济较发达地区,欠发达地区的教育教学水平相对薄弱,某些偏远地区甚至存在严重的师资短缺问题。在英语听力技能的教学与培养上,各地重视程度有高有低,有些听力成绩不计入高考英语总分的地区甚至直接忽略听力教学。此外,各地教学模式、教学资源的差异也较大,而语言学习具有持续性和渐进性的特点[8]。英语听力技能的培养需要语言学习环境的浸润,需要循序渐进,难以通过机械刷题来提高。真实、地道的英语资源既有助于培养语感,还能拓展学生的知识面,而教育水平较薄弱地区获取资源的途径有限,教学形式较为单一。除了地区间差异,同一地区基础教育不同学段间的英语教学衔接也有待进一步优化。根据教育部的指导意见,小学开设英语课程的起始年级一般为三年级[9],据此,大多数学生在参加高考时一般已具有10年的英语学习经历,并且这一学习过程是连贯递进的。但是,也有部分地区义务教育和高中教育阶段英语教学存在脱节甚至断层现象,无法确保英语教育教学高质量持续开展。(二)试题命制高考英语听力考试命题包含选材、编制试题、审校、录音、试听等多个环节,涉及文字、音频等多模态素材,更加强调情境和语篇素材的真实性,以充分体现口语交际的特点。听力录音要求发音准确、清晰、自然、流畅。整个命题流程涉及人员多,风险较高。阅读、写作等其他部分试题可以通过在字体、字号等方面设置统一明确的规范,确保每份试卷具有相同的标准;就听力考试而言,试题的录音需要真人现场录制。由于个体的差异性,为保证听力录音的质量,在对播音人员的培训、声音校准以及后期音质处理等方面都具有较大的挑战性。同时,由于听力考试的命题及音频编辑制作具有较强的专业性和特殊性,以及考试命题工作的保密性等特点,导致目前较为缺少听力考试命题方面的文献和实证资料,也使关于听力考试及命题的理论与技术研究受到一定的限制。(三)考试实施高考英语听力考试在实施层面存在较高的安全风险,组考难度较大,易受天气、环境等外界因素的干扰。听力考试具有即时性和单向性特点,录音播放实时、不可逆,考生个人无法自主操控收听录音内容,必须全神贯注才能避免漏听试题信息。由于担心偶然性风险,考生和考务人员在整个听力考试过程中可能会比较紧张。此外,听清录音内容、听懂录音内容、准确理解录音内容,分别代表了依次递进的听力能力层次,体现了不同考生的听力理解水平差异。然而,由于听力考试语音试题的特殊性,在听不清、听不懂之间缺少明确的界限,考生容易将作答困难等个人问题归咎于录音质量、设备或环境问题。应当说,经过多年实践,高考英语听力的组织实施工作已经具有比较完备的操作规范以及应对各种突发情况的预案和安排,即使个别年份极个别考场出现意外情况,总体上仍可以确保听力考试公平有效。尽管如此,考务工作的复杂性也在一定程度上影响着听力考试改革的平稳推进。除了上述因素外,不同地区的经济社会发展水平、对英语教育及听力考试重要性的认识等因素也会影响高考听力考试的改革发展,而最关键的问题在于是否将听力成绩计入高考总分。作为普通高校招生录取的重要依据,高考分数具有高利害性,对考生报考大学具有重要影响,对英语教育和学习有着显著的后效作用。笔者调研发现,听力成绩不计入高考英语总分的省份普遍对听力教学不够重视,有的地方甚至直接停止了听力教学。笔者对高考数据统计分析发现,将听力成绩计入英语分数的部分省份,其非听力部分的平均考试成绩普遍高于听力成绩不计入的省份。也有学者研究发现,高考英语不考听力对大学生的听力、口语能力和英语综合能力均有负面影响[10]。由此可见,为更好发挥高考英语的选拔和促学作用,加强听力考试确有必要。三、推进高考英语听力考试改革的建议举措高考综合改革实施以来,英语以核心素养为导向,强化综合语言运用能力考查,注重基础性、提高综合性、强调应用性、突出创新性[11]。听力作为一项关键语言技能,与其他各项语言技能紧密相关,听力考试具备上述“四性”特点,宜作为深化高考英语考试内容与形式改革的重要突破口。进一步推进高考英语听力考试改革,应在加强听力教育教学资源建设的基础上,充分发挥高考指挥棒的积极作用,强化对听力技能的培养和考查,着力在听力考试内容、形式和技术等方面进行改革创新。(一)加强考试内容改革近些年,全国高考英语听力考试着重通过模拟真实的交际情境,突出考查考生使用英语开展日常交际、学习和思辨活动,以及进行交际、解决问题的能力。但是,大部分听力考试采用纸笔形式,在一定程度上限制了素材内容的真实性、试题的交互性和考查的综合性,故应进一步加强听力考试内容改革研究。首先,立足发展学科核心素养,强化考查综合语言运用能力。进一步拓展考查内容,提高设问灵活性,创设更贴近真实生活的试题情境,如听力录音摒弃播音腔、采用多人录音等。其次,增强试题交互性。不仅考查听后回答问题的能力,还要考查利用听力技能实现交际、解决问题的能力,如设置更加丰富的题型,而不局限于单选题。再次,探索提高听力考试分值权重。充分发挥高考以考促学的功能,引导学生重视听力技能的学习和培养,提高在日常生活学习中用英语交流的能力。最后,通过实施听力机考,探索将听力技能与其他语言技能融合考查,如探索听说测试、听写测试等,使考查内容和形式更加符合在生活学习与跨文化交际过程中多项语言技能综合使用的真实情境。(二)推进考试形式改革认真总结近年来北京、上海、广东等省市高考英语听力机考的实践经验,研究借鉴国内外有关英语听力机考的先进做法,积极在全国推广听力机考。高考英语听力实行机考主要出于四方面的考虑。首先,可以进一步改进试题结构,提高考试的效度和情境的真实性,更好实现考查目标和引导教学。其次,进一步提高考试实施的安全性,降低其他因素对考试的影响,省去试卷印刷与运送、录音播放等考试组织环节。再次,考后可直接进行评分,无须扫描考生作答,进一步缩短阅卷时间,提高阅卷效率。最后,通过机考平台可以便捷地将听力与口语等语言技能考查联结起来,开展高考英语听说机考(有的省市已经实现),全面考查综合语言运用能力。在机考实施上,各省可根据本地教育教学和经济社会实际,尝试开展高考英语听力机考自主命题考试。相比于全国统一命题考试,分省机考能够使考试内容与难度水平更加贴合当地教情学情考情,有利于进一步提高考试安全性。(三)提升考试技术水平目前,已有省份进行了高考英语听力机考改革试点的成功探索,在组考流程规划、平台设计、实践应用等方面积累了丰富经验[12]。未来可进一步探索应用大数据、人工智能等先进信息技术手段赋能命题、考务、评价等考试全流程,全面推进数字化考试模式[13]。在命题上,不仅可以利用人工智能技术筛选语篇素材、编辑试题、创新试题设计甚至生成原型试题,还可以让人工智能承担语音自动校准甚至自动配音等听力录制工作,提高命题质量。在考务上,不仅可以实现考试实施过程中的试题信息流精准化、规范化管理,还可以实时监控、记录并预警考生的实时反应和作答行为,维护考试安全。在评价上,不仅可以按照有关测量理论模型对考试数据进行常规分析,还可以按照个性化需求拓展评价范围。在高考英语听力考试技术创新实践的基础上,还要结合最新的测量理论与人工智能技术,积极开展有关测量理论、评价模型及结果呈现等方面的创新应用研究,不断提升听力考试的理论研究与实践水平。高考英语改革一直在路上。随着高考综合改革即将在全国全面实施,英语听力考试改革试点取得了良好的成效。未来高考英语听力考试应不断深化考试内容与形式改革,逐步扩大机考改革试点,实现对综合语言运用能力更好、更全面的考查,更好服务高等学校人才选拔培养,引导基础教育英语教学改革,推进教育强国建设。参考文献略
2025-03-18
引用格式:李木洲, 刘子瑞. 新高考改革十年的回顾、反思与展望[J]. 中国考试, 2025(3): 16-24.作 者李木洲,浙江大学科举学与考试研究中心副主任,研究员。刘子瑞,浙江大学科举学与考试研究中心在读博士生。摘 要:新高考改革既是对新时代国家人才培养需求的回应,也是传统高考改革的延续与深化。回顾新高考十年历程,其改革成效显著,主要体现为公平追求由绝对转向理性,选考多样性由过度转为适度,能力考查由唯智转向全面,招生录取模式由单向变成双向。然而,新高考改革在破解传统高考唯分数等问题的同时,也面临一些新问题与新挑战,诸如等级计分存在公平性和科学性风险、综合素质评价与招生录取关系有待优化、高中师生新高考适应能力偏弱、大学自主招生能力有待提高等。进一步深化新高考改革,应着力提升等级计分科学性,提高高中师生新高考适应能力,优化高校综合评价招生机制,增强多元录取通道引流功能。关键词:新高考改革;等级计分;综合素质评价;高考公平高考是我国各类考试中最为重要、影响最广泛的考试[1],肩负着为国家选拔人才、为学生搭建成长桥梁的使命。自20世纪改革开放至21世纪初,高考经历了包括地方改革试验在内的20余次改革[2],逐步建立起较为完善的考试制度、录取制度和管理制度,推动了考试理念和技术的进步,初步实现了科学化、信息化及现代化转型发展。然而,这些改革大多或仅关照高考制度的某个方面,或仅在高考某些领域进行试验探索,未从根本上解决唯分数论影响学生全面发展、一考定终身使学生学习负担过重以及应试教育倾向等社会反映强烈的问题。2014年,国务院发布《关于深化考试招生制度改革的实施意见》(下称《实施意见》)[3],标志着新一轮高考综合改革(下称新高考改革)正式启动。至今,新高考改革已逾十年,全国已有29个省份(不含港澳台)分五个批次实施新高考改革方案,均已基本实现平稳落地。回顾、反思与总结新高考改革十年的成效与经验,对进一步深化高考改革,尤其是构建新时代引导学生德智体美劳全面发展和利于拔尖创新人才选拔培养的高校考试招生制度体系具有重要的理论与实践意义。一、新高考改革十年成效作为全面深化教育改革的重要组成部分,新高考改革是我国新时代实现教育与政治、经济、文化、科技等协调发展的客观需要。同时,新高考改革与历次高考改革一脉相承,是对历次改革的持续和深化[4]。历史地看,新高考改革虽是一个革故鼎新的动态进程,是一项仍未完成的重大教育改革事业,但与传统高考相比,新高考十年实践在促进公平、科目设置、考试内容、录取模式等方面均有较大转变或改进,取得了明显的改革成效。(一)高考公平追求:由绝对转向理性公平是高考制度的根本和灵魂[5]。我国高考历来强调公平公正,旨在立足现实社会条件和考试技术,以合理的规则对高等教育入学机会进行分配。公平分配高等教育入学机会的关键在于确定可量化比较且简便易行的标准,这使得考试分数成为象征高考公平的重要标志。但在高考本身的高风险、高利害及自古以来形成的考试至公观念的影响下,传统高考在追求公平的同时,也导致学生、教师、家长和学校对高分的执念。这最终使传统高考对公平的追求走向绝对化,甚至产生唯分取人等畸形的高考公平理念,削弱了高考的人才选拔效力,不利于学生成长成才。《实施意见》将深入推进素质教育确立为新高考改革的首要原则[3],标志着引导学生素质全面发展成为新高考改革的核心目标之一。由此,高考公平的内涵更加丰富,它不仅是分数参照下的入学机会分配公平,更是综合素质参照下的学生发展机会平等。新的公平内涵促使新高考改革超越分数框定的公平范畴,确立更加理性的公平理念,即既强调入学机会分配标准的公正客观,也注重学生素质的全面发展。十年来,在新高考公平理念的指引下,形成了“3+3”模式与“3+1+2”模式并行的高考选科格局,积极探索构建高校招生多元录取模式。这些举措为发展水平不同、类型各异的学生提供了更广阔的发展空间和更充分的发展机会。可见,新高考改革总体上扭转了唯分数的错误观念,将实现学生素质的全面发展作为衡量改革成效的重要标准,推动高考公平从注重形式公平向强调实质公平转变。(二)选考多样性:由过度转为适度文理分科是我国传统高考的主流模式,在该模式下学生的选择空间较为狭隘,难以根据自身兴趣和学科发展潜力进行个性化学习。作为社会关注度高、影响教育改革发展全局的20个重大问题之一,文理分科在2010年被列入《国家中长期教育改革和发展规划纲要(征求意见稿)》[6],为后来新高考取消文理分科奠定了基础。自2014年起,上海、浙江、北京、山东等第一批和第二批改革试点省市实施“3+3”选科模式。这一模式为学生提供多达20种选考科目组合,而浙江第二个“3”为“7选3”,科目组合多达35种,极大拓展了学生的选择空间。但同时,该模式也导致物理等科目选考人数下滑、专业招生录取难度增加、部分教育资源薄弱地区的配套支持难以为继等问题[7]。这表明“3+3”选科模式在扩大学生选择机会的同时,也产生了功利化选科的问题。此外,该模式下的科目组合多元选择,也使教育资源相对薄弱的地区处于不利竞争地位。因此,在新高考改革初期,科目组合的多样化实际上存在一定的过度化。为纠正这一问题,从第三批试点省市开始,采取“3+1+2”选科模式,即学生选科时必须在物理、历史两门中选择一门,再从其余四门中选择两门。这既是对学生功利选科的纠正,也是对高考形式多样化的调整。一方面,这一调整保障了物理和历史两个科目在自然科学类专业和人文社会科学类专业中的基础地位,平衡了学生在高中阶段的多样性学习需求与在大学阶段的专业发展需求;另一方面,该模式将选考科目组合减少至12种,降低了中学选课走班教学的难度,减少了教育资源配套支持对高考选科的限制,有利于新高考科目改革在中西部地区的推广[7]。综上,新高考科目设置从“3+3”到“3+1+2”的调整,很大程度上是对科目组合多样化的一种有限平衡,客观上也是深入推进新高考改革的现实需要。(三)高考能力考查:由唯智转向全面伴随高考改革的持续推进,德智体美劳全面考查的内容体系逐渐完善[8]。传统高考以分数作为测量学生知识掌握程度的标尺,以文理分科作为学生知识学习的界限,考试内容侧重考查学生的智育水平。诚然,这种考查方式有利于促进学生文化素养的提升,但文化素养只是素质发展的一个方面,灌输、刷题等应试方法阻碍学生创新能力和实际问题解决能力的发展。因此,优化高考内容是引导学生素质全面发展的关键。2018年9月,习近平总书记在全国教育大会上指出,要致力于培养德智体美劳全面发展的社会主义建设者和接班人[9]。这为新高考内容改革提供了根本遵循,即构建德智体美劳全面考查的考试内容体系。在德育考查方面,突出其首要地位,以立德树人为核心,加强对社会主义核心价值观、依法治国理念、中华优秀传统文化的考查;在智育考查方面,注重考查学生的创新思维以及发现问题、分析问题和解决问题的能力,反对机械的知识记忆;在体育、美育和劳动教育考查方面,创新考查策略与方法,在纸笔测验中创设引导学生劳动观念、审美素养、体育意识发展的情境性试题。在综合素质评价中通过审核学生素质发展档案、组织专业面试等方法评价学生素质全面发展的程度。可见,新高考改革使德智体美劳五育考查内容体系更加立体,使考试内容呈现的学生素质内涵更加全面,增强了高考对学生素质全面发展的引导。(四)招生录取模式:由单向变成双向招生录取模式关涉考生与大学专业匹配度,影响大学人才培养成效。理想的录取模式应有利于学生与高校之间的双向选择,在保障学生自主择校的同时,为大学在充分考察学生素质的基础上进行录取创造条件。在传统高考录取模式下,生校选择呈现出明显的单向化特征:学生参考往年的录取情况,根据自己的高考分数和排名选择最有希望被录取的高校和专业;招生考试管理部门按照学生的志愿完成录取投档;大学按照招生考试管理部门提交的考生档案接收学生。这种模式下学生尚有根据高考分数选择大学和专业的余地,但大学除自主招生途径外,缺少主动选择学生的空间。为打破统一考试、统一招生、统一录取的单一化招生局面,新高考改革赋予大学更多的招生自主权,为实现生校双向选择提供了较大的空间。《实施意见》提出:“高校要根据自身办学定位和专业培养目标,研究提出对考生高中学业水平考试科目报考要求和综合素质评价使用办法。”[3]在这一政策下,大学通过设定选考科目、组织面试等方式衡量学生专业发展潜力与自身办学定位、人才培养目标的契合度,从而实现大学对学生的自主选择。可见,这种模式较好地保障了大学在招生录取中的主体性,有利于推动大学由被动录取向主动招生转变,使生校选择实现由单向变为双向,提高了学生与专业间的匹配度。总之,新高考改革是对传统高考改革力图解决的一系列重要问题的一次整体性突破[10]。经过十年试点探索,新高考促使高考公平理念更加理性,推动引导学生德智体美劳全面发展更加有力,为学生创造了更加广阔的个性化发展空间,赋予了大学更加充分的招生自主权。二、新高考改革的问题梳理新高考改革是一次全面、综合的改革,环节多,涉及面广,力图解决传统高考遗留问题的同时,也面临一些新问题,主要涉及等级考计分方式、综合素质评价、高中师生适应性等。厘清这些问题及其产生根由是进一步深化新高考改革的重要基础。(一)等级计分存在公平性和科学性风险为配合选科选考,部分新高考选考科目实行等级计分。但在实践中,等级计分存在诸多公平性和科学性风险。一是总分录取机制下的等级成绩不等值问题。等级成绩不只取决于学生凭借自身水平获得的原始成绩,还受到当次考试难易程度和考生数量的影响,因此对选考不同科目的学生而言,即便其等级成绩总分相同,仍无法获得统一的分数解释。二是等级计分易诱发物理和历史选考失衡。从第三批改革省市开始已经将物理和历史调整为限选科目,考试成绩以原始分计入总分。但其他选考科目实行等级计分,即使学生的原始成绩只有六七十分,其排名仍可能位居前列,并最终获得高于原始分的等级成绩。如此,提升物理和历史科目地位的初衷就落空了,导致这两个科目空有首选之名,其实际地位不升反降。三是等级计分可能弱化高校拔尖创新人才选拔效力。等级计分意味着处于同一排名比例中的学生,即便原始分数有较大差距,也可能被赋予相同的等级分数。这弱化了原始成绩反映的学生水平差异,降低了选考科目的区分度,不利于潜在的拔尖创新人才脱颖而出。(二)综合素质评价与结果使用有待优化新高考改革通过综合素质评价,寄予高考破除唯分取人和推动多元录取的期望。但目前这些期望还未充分实现,原因在于综合素质评价在招生录取中的作用有待进一步发挥。一方面,在实施综合素质评价时,许多中学往往基于综合素质的若干维度逐层向下分解考查点,然后将各考查点简单合成一个等级或分数。这种分拆与合成式的评价方式不仅存在科学性问题,也不足以发挥综合素质评价应有的诊断引导作用[11]。有调查显示,80.20%的学生认为综合素质评价“作为高考招生的一种方式,大家填写时有很强的功利性”;65.84%的学生认为综合素质评价“存在刷分现象,不能反映真实的能力和水平”[12]。另一方面,综合素质评价在大学招生录取中的权重仍比较低,且应用规模较为有限。以北京市为例,相关人员在综合素质评价试点之初就曾指出,未来的综合素质评价录取将“选择很少的学校,拿出少量计划”来进行,且“这部分数量比较小,不会作为招生录取的主渠道”[13]。就目前来看,历经七年多的试点探索后,在北京实施综合素质评价招生的大学仅有七所[14]。(三)高中师生新高考适应能力偏弱与传统高考改革相比,新高考改革与中学教育教学的联系更加紧密,给高中师生带来了新的挑战。其中,高中教师职业压力增大和学生选科能力薄弱两个问题尤为突出。一方面,新高考改革引发高中教学变革,教师面临的职业压力有所提升。有研究指出,压力适应成为影响高中教师在新高考背景下自身适应性发展的关键因素,但教师对自身适应压力能力的评价偏低[15]。另一方面,尽管新高考改革赋予学生更大的选科自主权,但选科能力不足限制了学生行使权利,选科选考额外增加了学业焦虑。在家长普遍关心选科选考的现实背景下,学生普遍存在“被选科”问题。这不仅与新高考改革鼓励学生自主选择的初衷不符,也将家长卷入学生的学业焦虑之中。因此,深入推进新高考改革,需要加强选科指导和生涯规划教育。(四)大学自主招生能力有待提高有研究指出,当前大学招生能力不足的具体表现包括招生目标不明确、招生程序不规范、管理机制不健全等[16]。招生目标不明确和专业招生人员短缺是影响大学招生能力提升的重要因素。招生目标不明确限制了招生的精准性,部分大学和专业无法厘清自身对学生专业素质和知识能力的基本要求,难以根据自身办学理念、发展定位、培养模式等提出适切的考试科目要求。而专业招生人员的缺失,是制约招生机构专业化建设的关键所在。长期以来,大学招生录取基本上是对学生的分数排名与学校的录取分数线进行机械匹配,并不需要招生人员具备鉴别学生能力素质的专业能力,因而招生人员无须也没有任何专业性可言[17]。然而,新高考改革在某种程度上降低了考试成绩的区分度,可能扩大校内专业间的生源质量差异,因此,为保障总体招生质量,需要大学不断提高自主招生能力。需要指出的是,当前新高考改革仍面临一系列新问题和新挑战。有些源于政策设计有待完善、考试录取技术有待提升,也有一些源于我国现实教育生态和传统考试文化,需要从新高考改革的内部和外部两方面加以客观分析。三、新高考改革问题的主要成因梳理十年来新高考改革面临的问题不难发现,其主要成因涉及改革政策设计、各方利益诉求、教育发展水平及考试文化观念等方面。(一)改革仍处于动态调整之中无论任何改革政策,只有在实践探索中才能得以不断完善,新高考改革也是如此。以新高考“物理遇冷”问题为例,在试行“3+3”选科模式之初,受趋易避难的功利心驱使,选考物理的学生人数一度出现断崖式下滑。为解决这一问题,避免国家人才培养结构失衡的风险,在第三批及之后的改革省市改为试行“3+1+2”选科模式,收紧了学生的选择空间[18]。可见,改革政策的成熟和完善大多需要经历一个实践探索的过程,而这一过程往往是曲折前进、螺旋上升的,可能会伴随各种问题和挑战。但是,这些问题和挑战是改革过程中的阶段性产物,随着改革不断深化,相关配套政策更加科学与完善,问题和挑战也将逐渐得以克服。(二)改革所涉主体利益诉求复杂新高考改革牵涉的利益群体众多,需要兼顾和权衡的利益诉求更加复杂。这直接体现在不同区域、不同身份的利益相关者对改革的评价上。有研究指出,就区域而言,西部地区的高中生对改革的满意度明显高于东部地区[19];同时,高中生对选科制度的满意度在省会城市(直辖市)、地级市区、县(区)城镇、乡镇逐渐降低[20]。就身份而言,大学生和高中教师对新高考改革的整体认可度较高,但社会人士对改革成效的认可度较低[21]。不同身份的利益相关者对新高考改革寄予的不同期望导致改革面临众口难调的困境:高中生期待通过改革减轻学业和考试压力,大学生更重视高考制度对个人发展和职业选择的影响,中学教师关注高考选才的效率与公平,大学教师更注重高考改革在优质生源分配、专业分流中功能的发挥,家长与关心高考改革的社会人士则格外重视高考对促进学生个性品质的养成及对未来长远规划的影响[22]。可见,新高考改革牵涉的不同利益群体的诉求,增加了其寻求广泛共识和兼顾各方利益的难度。(三)区域间教育发展水平不均衡新高考改革受到诸多现实条件,尤其是教育发展水平的制约。客观而言,东部地区先行试点,中西部地区渐进推行,是改革利用东部地区相对丰富的教育资源完善高考制度设计的理性选择,有利于降低中西部地区的改革风险,但无法回避中西部地区改革资源相对不足的客观现实。因此,中西部地区的新高考改革面临较大的压力。例如,落实选科选考制度要求高中实施走班教学,这对各科师资和教学设施条件提出了更高要求;而第三批及之后启动新高考改革的省份普遍存在高中师资不足的问题,教师缺口率高达21%~50%,61.1%的生均公用经费未达标,多数中学支持选科走班教学的教室、仪器设备等硬件设施缺口率高达26%~50%[23]。又如,落实综合素质评价录取制度不仅需要当地加大新型教育基础设施建设投入,还需要大学在录取环节增加筛选考察流程,高中在日常教学中进行评价结果维护等。对政策配套设施的需求无疑会提高综合素质评价的实施成本和对教育资源的依赖程度。当前,我国教育资源在区域和城乡间的分布不够均衡,若在推广综合素质评价的过程中再忽视校际资源差异,则可能拉大城乡或区域间的教育发展水平差距,甚至可能加剧城乡或区域之间的教育不公平[24]。可见,区域间教育发展水平不均衡是新高考改革难以回避的现实,应坚持协同稳健的改革原则。(四)功利性考试文化影响深远我国传统考试文化观念中的消极成分尤其是功利性文化,在很大程度上制约着新高考改革的推进。从历史上看,科举考试作为进身之阶的高利害功能催生了我国考试文化的功利性特征,致使唯分取人等传统考试的弊病延续至新高考改革之中。有研究指出,新高考改革在推行等级计分之后,有学生为了取得高分而投机选科;有家长为了学生在所选科目取得高分,不惜弄虚作假,报考该科充当“分母”;有学校为了提升本校考试成绩,甚至安排已取得较好成绩的学生再次参加考试并获取低分,以抬升其他学生的等级成绩[25]。这些伴随等级计分出现的问题,本质上是功利性考试文化导致的唯分数现象在新高考改革中的体现。此外,我国自古以来对考试公平的极端重视也在一定程度上影响着新高考改革的推进,尤其是自科举时代就已形成的至公理念延续至今,社会大众对高考分数之外的其他录取标准接受度较低。正因如此,新高考改革的综合素质评价长期遭受权威性和公平性质疑,尤其是大学在按照综合素质评价自定标准进行录取时往往面临“不公平”舆论压力甚至行政责难[26]。可见,功利性考试文化和对高考绝对公平的追求在某种程度上限制了新举措的实施,无形中增加了新高考改革推进的难度。四、新高考改革的路径优化深入推进新高考改革是我国新时代教育评价改革的重要组成部分,也是构建有利于拔尖创新人才脱颖而出、引导学生德智体美劳全面发展的考试招生制度体系的根本举措。基于上述对新高考改革面临问题及成因的分析,进一步深化改革应注重从以下四个方面加以推进。(一)提升等级计分的科学性长期以来,由于分数之于高考招生录取的重要性,使得高考计分机制改革往往伴随较大的风险和难度。因此,完善新高考计分机制,应尽量避免制度层面的重大变革,坚持技术调整为先,探索等级分数生成和使用的优化方式。一是为各选考科目制定学科能力标准,探索基于标准参照的等级计分方式。所谓标准参照,即考生成绩的等级取决于原始成绩与外在客观的学科能力标准的比较。这就使标准参照的科目等级计分方式避免了考生群体因素对学生等级成绩的干扰,有利于提升等级成绩的效度[27]。二是探索必考科目原始分数与选考科目等级分数加权后计算总分。目前,高校招生录取的主要依据是考生各科考试分数简单相加或赋分转换后相加得到的总分。这种方式操作简便,易于总体比较,但不利于考生与大学专业的精准匹配。当前大学专业高度细分,新兴专业发展迅速。为体现不同专业对选考科目的倾向,由大学自主设定,采取加权的方式计算总分,可能是一种有利于精准选拔的计分方式。当然,以技术手段改进新高考计分机制,需要以科学的教育测量理论与改革的适应性研究为前提,同时还应做好政策解读和宣传工作,以促进社会大众对新高考计分机制的理解和认同。(二)提高高中师生对新高考的适应能力新高考改革的平稳推进离不开中学的积极参与,尤其是高中教师和学生的支持。因此,深化推进改革应进一步增强高中师生的认同度,支持他们适应新高考改革背景下的教与学。一方面,优化高中教师评价机制,针对新高考改革后各科教师工作量不均衡等问题,建立科学合理的核算体系,完善教师绩效评价机制,通过工作量的合理分配,使教师保持良好的工作积极性。同时,高中应重视教师群体在新高考改革中的利益诉求,通过适当的政策鼓励和支持,调动教师参与改革方案实施与反馈的积极性。通过参与性平等为教师发展诉求提供表达渠道,逐渐打消教师对改革政策的疑虑和担心,增强其自我认同和在新高考改革中的适应性发展[15]。另一方面,提升学生的选择能力[28],建立健全相对完善的高中生涯规划教育体系,优化生涯规划课程,加强学生职业意愿、职业性格的教育与引导,为学生创造充分认识自身职业发展兴趣和潜能的条件,鼓励学生结合自身学业状况合理选择考试科目。(三)优化高校综合评价招生机制中学综合素质评价和高校综合评价招生分别是在基础教育和高校招生两端对我国素质教育战略的贯彻落实[29]。在高校招生录取中参考高中综合素质评价,能有效发挥高考指挥棒的正面引导作用,为综合素质评价的深入推广提供助力,使其促进学生全面发展的育人初衷得以实现。因此,优化高校综合评价招生机制是新高考改革持续引导学生全面发展的关键举措。其一,可考虑实施分层推广综合素质评价与高校招生硬挂钩的策略,支持一批“双一流”建设高校率先推进综合评价招生试点,探索健全综合素质评价可操作性使用细则及办法。其二,进一步优化“两依据一参考”的高校招生录取机制,推进五育全面考查,探索德体美劳等非智力因素考查或评价的科学办法,构建选拔性考试与达标性评价相结合的综合评价方式[8]。其三,完善高校综合评价招生监督保障机制,在严格落实各级相关主体责任的同时,发展适合国情的教育考试理论和技术,尤其是创新评价工具,利用人工智能、大数据等现代信息技术,探索开展各学段学习情况全过程纵向评价、德智体美劳全要素横向评价[30],为高校综合评价招生提供真实、客观的学生素质发展信息。(四)增强多元录取通道引流功能大学招生考试改革既要引导学生素质全面发展,也要考虑到不同学生之间的素质差异,为发展类型和水平不同的学生提供多种成才通道[31]。高校招生多元录取是引导学生差异化发展和全面发展的重要举措。深化新高考改革应强化多元录取通道的分流与引导功能。一方面,应积极推进普职分类考试招生改革。加快探索构建符合职业技术人才选拔培养规律的职教高考制度,既是满足技能性人才适性发展的必由之路,也是教育强国建设的重要举措。另一方面,应积极探索高水平大学多元自主招生机制改革,为拔尖创新人才选拔培养提供多样化通道。国外一流大学大多采用多种录取办法招收各类资优学生。进入新时代,为加快中国特色世界一流大学建设,我国高校应进一步厘清国内招生与国际招生、普通专业招生与艺体类特殊招生、一般人才选拔培养招生与拔尖类人才选拔培养招生等不同招生录取通道之间的内在关系,构建目标明确、定位各异、标准合理、比例适当的类型多样、功能互补的本科招生体系[32]。需要指出的是,教育考试改革是一个循序渐进的长期过程,有其自身的规律性,不能脱离或割裂我国社会主义初级阶段基本国情与历史文化传统[33]。当前,深化新高考改革既离不开现代化教育测量理论与技术的支撑,也离不开改革外部条件的保障,尤其是教育资源的优化配置和改革共识的广泛凝聚。参考文献略
2025-03-18
引用格式:蒋凯, 王涛利. 求真精神还原科举制本来面目: 评刘海峰教授专著《正说科举》[J]. 中国考试, 2025(3): 101-104.作 者蒋凯,北京大学博雅特聘教授,长江学者。王涛利,华中科技大学教育科学研究院讲师。摘 要:刘海峰教授最新专著《正说科举》立足科举制废止120年的时代背景,从世界文明发展史的视角深刻剖析科举制的功过,有力澄清了与之相关的戏说和反说,是“大师写小书”的精品力作。该书坚持论从史出的原则,系统梳理大量史实资料,阐释科举制在人才选拔和公平竞争方面的独特价值,并指出废止科举的必然性。该专著聚焦科举制以考促学、平等择优的选才精神,为新时代教育评价改革、拔尖创新人才培养和各类考试改革提供了重要参考。关键词:科举制;人才选拔;平等择优;教育评价改革科举制是我国传统社会一项重要的人才选拔制度,深刻地影响了我国古代的政治、教育、文化和社会发展,在世界文明史上具有鲜明的独特性。然而,关于对科举制的评价却众说纷纭,有人赞誉有加,有人批判否定。2025年是科举制度废止120周年,刘海峰教授最新专著《正说科举》的出版恰逢其时,将科举制置于世界文明发展史的时空背景,从宏观视角和比较视野深刻剖析科举制的功过。该书以求真务实的精神还原科举制本来面目,是一部弘扬中国文化自信、彰显中国精神、展现中国特色的力作。作为浙江大学科举学与考试研究中心主任,刘海峰教授在科举学、高考改革、高等教育史和高等教育理论等领域卓有建树。他的相关研究成果在《中国社会科学》《教育研究》《历史研究》等人文社会科学知名期刊发表,并多次获得全国性重要学术奖励,包括高等学校科学研究优秀成果奖(人文社会科学)一等奖三次、全国教育科学研究优秀成果奖一等奖两次,等等。自1992年刘海峰教授在第四届全国教育考试科研讨论会上报告《“科举学”刍议》一文[1]伊始,科举学作为一门跨学科交叉的学问逐渐萌芽、建立和发展,并开始走向专业化和体系化。在此过程中,刘海峰教授以极大的学术勇气明确提出“为科举制平反”的主张,并借助翔实的历史资料澄清与科举制有关的“戏说”和“反说”,令人耳目一新。通读全书,“为科举制平反”既是该书的核心观点,又是该书牢牢吸引读者的独特魅力所在。笔者试图从什么是为科举制平反、为什么要为科举制平反、如何为科举制平反三个议题进行讨论,以飨读者。一、什么是为科举制平反这个议题主要涉及两个问题,一是厘清科举制的本质,二是阐明为科举制平反的含义。对于前一问题,刘海峰教授《正说科举》一书指出,科举制是中国和东亚国家帝制时代设科考试、选才任官的制度,不属于专制体制,更不是愚民政策;仅凭文学作品中塑造的范进、孔乙己形象,就将科举制视作禁锢人民思想、维护封建专制统治的恶制,并不符合史实[2]。事实上,科举考试同样选拔了诸如白居易、柳宗元、王安石、张居正、韩愈、黄炎培和沈括这样的文学家、政治家、教育家和科学家,为才学之士提供了阶层流动的通道,平民子弟也可以通过科举“朝为田舍郎,暮登天子堂”。历朝历代借助科举考试选拔有才能的学子,其根源恰在于科举取士强调公平与学问,适应当时的社会需求,为维护社会公平和社会秩序提供了有力保障。科举考试以考促学、以评引风,在促进社会流动的同时还为中国文学发展营造了良好氛围,对衍生而来的文学思潮、文学创作和文学风尚产生了深远的影响。因此,刘海峰教授主张将科举视作一个含义丰富的中性词,而非阻碍社会发展、荼毒人性的贬义词,以避免先入为主的思维定式。这种追根溯源、扎根历史情境的研究路径不落俗套,使该书突破了人云亦云的认知陷阱,书中提出的“让科举研究从激情批判走向理性判断”的重要主张发人深省。对于后一问题,刘海峰教授在专著中指出,为科举制平反不是全盘肯定科举制,也不是反对废除科举制,而是主张全面客观地评价科举制的利弊[2]。面对有关科举制的多种观点,该书作者在系统梳理百余年科举研究历史的基础上,将为科举制平反的观点划分为三种类型。其中,最激进的一种观点否定废除科举,力主恢复科举制,如梁启超、孙中山;较为温和的一种观点认为科举制度可以不废,但并未提出恢复科举制度,如杜亚泉、胡适、钱穆;而相对客观中立的一种观点不否定废科举但肯定科举制度,强调立足不同时代背景看待科举制的存废,如顾颉刚、潘光旦和杨学为。刘海峰教授将自身的观点归属于第三种类型,并且在这部新著中分析了科举考试在促进社会公平和阶层流动方面的作用,澄清了科举制在近代被废止的必然性。因为这些学者主张为科举制平反的对象并非“废止科举”这一历史事件,而是以考选才的科举制度。因此,刘海峰教授在书中提出根据社会环境和时代变化长时段评价科举制的主张,以纠正长久以来对科举制的偏见[2]。这一主张不仅体现了作者敢为人先的学术勇气,而且展现了他严谨求证的学术智慧。二、为什么要为科举制平反首先,刘海峰教授在专著中指出了对科举制的诸多认识误区,如科举考试无法选拔真正有才华的人、科举考试缺乏公平性、科举导致官场腐败、科举造成官本位体制、科举考试脱离实际等。但是,这些看似合理的批评实则经不起推敲。以科举制缺乏公平性为例,该书认为,与世袭制、九品中正制相比,科举制度以公平客观的考试为核心,强调公平、公正、公开,更能够维护广大学子的合法权益和实现阶层流动。一方面,科举考试注重至公精神,通过弥封、誊录法和发还落卷等方式保障评卷的公平性和客观性,有效降低了非能力因素对考试结果的干扰;另一方面,科举考试不以贵贱和出身取人,为众多考生提供了可比的标准,比其他人才选拔方式更为进步[2]。其次,全面、客观地看待科举,是有史为据的必然和知古通今的反思。正如该书作者所强调的,只有全面深入地研究科举制,才能避免随波逐流、浅尝辄止,从而对科举制做出理性而全面的判断。在注重人情社会的国家实行考试制度,不仅可以有效地降低人情、关系、出身等因素的影响,而且有助于维护客观公正的竞争秩序,促进社会流动和稳定。目前围绕我国教育考试改革尤其是高考改革的一些争论,更是印证了科举考试在甄别人才方面的积极作用,彰显了该书以史为鉴的学术价值。再次,从世界范围看,科举制产生了深远的国际影响,与弘扬中华文化和民族自信的现实背景紧密相关。刘海峰教授认为,科举考试虽然诞生于古代中国,但是其平等择优方式具有一定的现代性,或者说具有超越帝制时代的生命力[2]。帝制时期的科举考试满足了官僚政治人才选拔需要,是中国社会一种独特的“文化基因”。肯定科举制的积极作用,有助于提升文化自觉、文化自信和文化自立,科举制是不应该被忽视的文化遗产。这种立足世界遗产传承和全球文明建构的治学理念提高了科举学研究的深度,为弘扬中华优秀传统文化、促进跨学科交流提供了新路径,对增强世界文明多样性具有积极意义。最后,对科举制的功过需要辩证地看待。围绕维护统一与压抑个性、贤能治国与做官为上、以考促学与僵化应试、普及文化与不重视科技、及第争先与累于科举等诸多议题,刘海峰教授秉承论从史出的治史态度,在书中进行了仔细辨明。例如,为直观地呈现科举竞争的激烈程度,该书作者查阅了大量文献资料,统计得出清代中期以后全国多数省份乡试录取率在1%左右的结论,有力地阐释了清代出现“人累科举”局面的原因,并客观地揭露了八股考试虚耗士子心力和阻碍创新思想的弊端[2],展现了作者勇于追求真理的学术担当。三、如何为科举制平反刘海峰教授的这部专著指出,应当拓宽学术视界,将科举制置于世界文明发展史的时空情境中进行全面考察[2]。从横向维度看,可以将中国的科举制与东亚科举文化圈和英、法、美等国的文官考试相关联,以更好地理解中华文化的深远影响力。日本最早效仿中国实行科举考试,在公元7—8世纪之际引进隋唐律令制度,并设秀才、明经、进士、明法四科和医、针二科考查学生。韩国不仅是中国域外实行科举考试时间最长的国家,而且将科举考试视作重要的精神文化遗产,多次举办再现科举考试的纪念活动。越南则是世界上最晚废止科举考试的国家,甚至建立了和中国贡院相似的专用考试场地。科举制度在为这些东亚国家提供镜鉴的同时,为有关国家选拔人才提供了本土化调适空间,有力地促进了东亚科举文化圈的形成和各国文化水平的提升。就科举考试强调公平竞争、平等择优的本质精神而言,英、法、美等国的文官考试制度也深受中国科举制度的影响。1570—1870年间,涉及中国科举的英文文献多达120余种,足见西方国家对中国考试制度的好奇与关注。在系统梳理东西方相关研究文献基础上,刘海峰教授总结道:科举制西传欧美,是中国对世界文明的一大贡献,可在某种程度上称为中国“第五大发明”[2]。这一观点不仅具有深刻的文化内涵,而且展现了作者在科举学领域的深厚积累和极高的学术敏锐度。从纵向维度看,科举制度实行了1300年,其时间跨度上至隋唐,下至明清。科举考试实行的编号、密封、监考和复查等方法仍沿用至今。以科举制为研究核心的科举学不仅内涵丰富、形式新颖,可以为当下各类考试和教育评价改革提供有益参考,而且相关研究队伍素质过硬,重要成果不断涌现,形成了一个蓬勃发展的新兴学科。该书正是对科举制的发展历史、文化价值、东西方影响、考试精神传承、人才选拔经验与教训等多个论题开展广泛研究的上乘之作,凸显了科举学在研究深度与广度方面的强劲潜力。尤其是在当前深化中高考考试内容改革、加强拔尖创新人才选拔培养和优化高考改革治理环境的背景下,加强科举学研究对深化考试评价改革具有重要的参考价值[3],有助于构建中国特色教育评价体系。例如,科举考试为维护平民考生合法权益而实行的官卷制度,是破解“寒门难出贵子”现实困境的重要参考路径,为推进我国教育公平提供了宝贵经验。四、结束语刘海峰教授长期从事高等教育理论与历史、教育考试研究,《正说科举》融汇了他在科举学领域的多年研究成果,是科举学研究的又一力作。诚如作者所言,偏见比无知离真相更远。科举制的废止不是对科举制本身合理性的全盘否定,为科举制平反也不等同于否定废科举[4]。尽管科举制度距离我们已远,考试却依然是鲜活的存在。每年与高考相关的话题不仅牵动着广大考生的心,而且折射出社会对公平正义的维护与追求。那些对高考和应试教育的批判,亦折射出人们对构建多元人才评价体系、实现每个学生全面发展的美好期许。刘海峰教授的新著呼吁为科举制正名,其价值不仅是替那些被误解的沉默的大多数进士先辈发声,客观探讨科举考试的千秋功过,更是为推动科举研究、服务教育评价改革和拔尖创新人才培养提供历史借鉴,对我国教育强国建设具有深刻的启迪意义。参考文献略
2025-03-10
引用格式:唐盛昌, 徐奉先 .构建拔尖创新人才早期识别培育链的探索与思考: 专访上海中学原校长唐盛昌[J]. 中国考试, 2025(3): 7-15.作 者唐盛昌,上海中学原校长,正高级教师;获全国教育系统劳动模范、人民教师奖章、上海市首届“教育功臣”等称号,享受国务院政府特殊津贴。访谈者:徐奉先,教育部教育考试院副研究员。摘 要:唐盛昌校长长期致力于拔尖创新人才的早期培养和国际课程实践的比较研究,先后在上海中学、上海华育中学等学校开展资优生教育探索和创新素养培育实验项目,对拔尖创新人才早期培育的基本规律有深刻认识,积累了丰富经验。本刊于2024年11月对唐盛昌校长进行了专访,探讨拔尖创新人才早期培育链的构建问题。通过分析上海中学等学校在课程改革、教学管理和评价体系等方面的创新举措,总结其在拔尖创新人才培育选拔方面的成功经验。实践研究表明,早期识别和培养、课程体系优化、教学方式创新以及多元化评价体系的建立是构建拔尖创新人才培育链的关键要素。本文旨在为我国基础教育阶段拔尖创新人才培养提供实践参考。关键词:教育强国;拔尖创新人才;早期培育;国际经验引 言我国在由教育大国走向教育强国、由人力资源大国走向人力资源强国的过程中,需要探索拔尖创新人才的早期培育和选拔路径。基础教育阶段作为人才培养的奠基时期,在拔尖创新人才的早期识别和培养中扮演着关键角色。当前基础教育阶段如何开展拔尖创新人才早期培育的实践,发现具有中国特色的拔尖创新人才早期培育基本规律,已成为一个紧迫课题。上海在拔尖创新人才培养方面积累了丰富经验,通过对上海中学原校长唐盛昌的专访,本文深入探讨拔尖创新人才早期培育链的构建问题,以期为我国基础教育改革提供有益参考。一、拔尖创新人才早期培育应关注八个特质访谈者:唐校长您好!非常感谢您拨冗接受采访。您领导并创建的上海中学国际部,多年来在拔尖创新人才的早期识别和培养方面进行了深入研究,积累了丰富经验,被誉为“中国人办的一所成功的国际学校”。首先能否请您谈谈自己的工作经历?唐盛昌:我于1962年参加工作,主要从事数学教学,包括奥数培训,1989年担任上海中学校长。1993年上海中学成立了国际部,2013年我退休离开时,学生规模已经达到3300人,并且参加了IB(International Baccalaureate Diploma Program)考试,成绩按照IB的总分排名应该是全球前五。因此,对于国际教育这一块我比较了解。从1996年到2002年,我担任国际文凭组织(IB)校长委员会委员,也是亚洲地区、亚太地区的校长委员会委员和亚太地区教育咨询委员会委员。我退休后还办过民办初中,就是华育中学,上海初中阶段具有拔尖创新潜质的孩子有相当一部分都集中在这所学校。访谈者:上海中学在全国率先开展过多年的资优生教育探索和“创新素养培育实验项目”,积累了不少拔尖创新人才培育的实践经验。在您看来,基础教育阶段具有拔尖创新潜质的学生一般都具备哪些特质呢?唐盛昌:我认为应该包括八个方面。一是责任心与思想境界。一个学生如果没有责任感,只考虑个人前途,不能把眼光放在国家和人类的高度,没有宏大的志向,是难以获得可持续发展的。所以,我们非常强调促进学生基于责任与志趣的价值追求,从而极大激活学生发展的内在动力。在智力水平与学业水平相差无几的情况下,学生的志向、毅力、思想境界直接影响他们可持续发展的高度。这一点,在许多人的成长中得到印证。二是兴趣和潜能的匹配。这是学生可持续发展的内在动力源与未来发展达到一定高度的重要支撑。学生的兴趣领域不一定是他/她的潜能领域。实际上,学生的潜能在哪里,家长和教师可能都不知道,包括基础教育阶段的学生自己也不一定了解。这就需要学校去探究,给予学生课程学习一定的选择性,让他们在选择学习的过程中逐渐认识自己的潜能,找到潜能与兴趣的匹配点。三是思维的批判性与深刻性。批判性思维关注发现问题,“学源于思,思源于疑”,是否敢于质疑、敢于发现并提出新的思路,是评价拔尖创新人才的一个重要指标。通过实验探索,我们发现有发展潜质的学生在面对问题时,大多能表现出批判性思维。而思维的深刻性是建立在兴趣领域深而广的个性化知识积淀基础上的。学生能在提出质疑的同时,运用积淀的个性化知识,根据自己的思路去收集证据,直至运用证据证明猜想。这恰恰是科学家获得发现、发明的一般思路。举个例子,平时我们做氢氧化铁实验的时候都会注意到,反应现象是从白色过渡到红褐色,但是在一次实验中,有学生提出为什么在反应过程中大概有一秒钟的时间出现了绿色,老师也感觉很吃惊,在十几年的教学过程中没有注意过这个问题,然后这个学生就跟老师一起探索,最后成功解释了这一现象。四是思维的跳跃性与缜密性。对于有发展潜质的学生来说,发现问题与提出新的思路、观点都需要思维的跳跃性[1]。但只有跳跃性还不够,需要通过思维的缜密性来佐证。这一点也可以举出一个实例。过去有个学生是国际数学奥赛冠军,而且是当年全世界唯一的满分获得者。在国家集训队的时候,有一次考试中需要用到复变函数中最大模定理,他事先并不了解这一定理,却在考场上推理出了这一结论,并把结论应用到解题过程中,整个考场也只有他一个人可以证明,这就反映出他思维的跳跃性与缜密性。有发展潜质的学生并不是在每个领域都表现出这种思维特性,在其感兴趣的领域更容易得到彰显。五是钻研与痴迷。实际上通过金牌考验的孩子非常多,但那些真正能被称为拔尖创新人才的,无一例外都对学科的钻研达到了痴迷程度。专业知识的学习如果没有其他身心发展和思维水平的提升作为支撑,就无法匹配拔尖创新人才标准。比如中科大的少年班项目,可能会培养出大量达到大师级水平的大学教授,但经过反复观察,并不能断定这些孩子是不是拔尖创新人才。如果少年班只有这样的学生,那么他们发展的上限就是大学教授,这与我们的初衷有很大差距,我们希望这些孩子能够成长为具有世界影响力的人物。所以,如果没有专业的内驱动力,将无法获得持续的提升。六是坚忍性。在对目标的追求过程中,意志品质起到了强大的支撑作用,包括抗挫折力、自制力、持久力等。华罗庚曾经说过,根据我自己的体会,所谓天才就是坚持不懈地努力。学生在学习、成长与进行课题探究的基础上,同样需要坚忍性来助力他们发展。上海中学多年的实践表明,大多数资优生存在明显的“飞跃期”,并在“飞跃期”之前可能产生“高原期”,之后可能产生“迷茫期”,作为教师要对这些具有发展潜质的学生加强针对性指导、引领。有个学生最初进数学冬令营的时候是上海市十多名,后来在冬令营中名列前茅,入选了国家集训队。刚入队的时候只是中等水平,但经过一段时间的训练,成功进入前几名,这是一个飞跃;后来拿到世界数学奥赛金牌,又是一个飞跃;获得金牌后他的兴趣转向物理,并成功考入国家集训队,入队前夕利用三个月时间准备雅思考试,并取得了8分的成绩,这也是飞跃。在一次次坚持与飞跃中,他得到了突飞猛进的发展。七是个性化的知识构成。有发展潜质的学生可能存在单核、双核和多核等知识结构。单核知识结构的学生虽然整体成绩不错,但有一个核心学科,围绕这个学科涉猎其他各科。双核知识结构的学生集中在两个领域特别突出,如数学和计算机、数学和物理、数学和英语等。多核知识结构的学生在三个或三个以上的学科领域表现非常突出。这种个性化的知识结构是学生未来创新素质的基础,对学生未来的专业趋向与人生发展将产生重要影响。不同的知识结构没有优劣之分,要根据学生的意愿加强引导。我们过去的课程体系构建与实践,极大地促进了学生的个性化知识构成。八是基于一定领域发展的可持续性。一个人一生中最辉煌的时期不应该是高中时期,而应该是中学以后的学习和生活,对于有潜质的学生来说更是如此。那么,高中在拔尖创新人才培育过程中如何才能确保现在好、将来更好?这就需要为学生未来学习和可持续发展扎下坚实的学力根基。例如,培养学生广而厚实的知识基础,关注学生基于一定领域的学科领悟力与智慧生成,准确识别学生的优势领域与潜能,关注数字技术与专门知识领域的整合与创新等。上面八个特质是在我们实验中总结出来的,虽不能涵盖拔尖创新人才早期识别与培育的全部,但对科技类拔尖创新人才早期培育而言是尤其值得关注的。如果学生能够在这八个特质上显现出良好的发展潜力,就有可能在未来的道路上走得更远,在拔尖创新人才的成长道路上不断迈进。二、关注拔尖创新人才早期培育与推进教育公平的关系(一)选拔培养拔尖创新人才应从对物的关注走向对人的关注访谈者:在从教育大国向教育强国迈进的过程中,拔尖创新人才的识别和培养是一个必须解决好的问题,需要我们在一系列观念上冲破束缚。在您看来,关注拔尖创新人才的早期培育,应该如何处理它与促进公平、优质均衡之间的关系呢?唐盛昌:教育公平是社会公平的重要基础,突出促进公平,构建公平优质的基础教育体系是教育强国建设的重要举措[2]。教育公平既包括机会公平,意味着每个人接受某种类型和阶段教育的可能性;也包括条件公平,意味着每个孩子在受教育过程中受到平等的对待,每个孩子都能在自己的已有基础上得到更好的发展。机会公平强调所有孩子都能上学,条件公平则强调在孩子能上学的基础上,努力提供适合每个孩子发展的教育,使其得到适合个性的应有发展。教育公平不等于教育平均化。在过去相当长的一段时间内,推进教育公平的立足点主要被放在对学生享受教育资源的物质的公平上,尽可能满足每个学生享受相对均等的教育机会,关注学校硬环境、师资等的平等。在教育强国建设背景下,教育公平的立足点必须适时从对物的关注走向对人的发展的关注。当然,人的发展需要物的支撑,但新时代推进教育公平的“物”的创设,应当置于人的发展需求下去思考,尽可能创设适合每个孩子发展的教育条件。学生的发展是有个体差异的,教育公平的推进要关注这种差异。每个孩子的发展基础、优势领域、个性爱好、发展侧重点各不相同,教育发展到今天,对教育公平的理解就应该从初级阶段的机会公平上升到真正意义上关注人的发展的条件公平,而不能总用通常意义上理解的“物”的公平去看待真正适合孩子发展的教育公平。如果说对有学习困难的学生提供帮助与提升是教育应尽的责任,那么对具有发展潜质或已经显露出良好发展潜能的优异学生、拔尖学生采取针对性的教育举措,包括提供适合于他们发展需要的条件、辅导,也应是推进教育公平的关键环节。(二)提供适合有发展潜质学生的早期针对性教育,是推进教育公平的应有之义访谈者:有学者指出,当前不能简单以平等性公平的观念去批判拔尖创新人才培养违背了公平原则,而是应将其纳入差异性公平范畴,在教育体系中为具有创新潜质的学生打开培养通道,建立专门的英才教育政策与法规体系[3]。在您看来,中小学阶段学生创新能力的培养,如何既面向全体,又因材施教呢?唐盛昌:拔尖创新人才的早期培养与高素质劳动者的早期培育是有差别的。目前,基础教育最欠缺、最薄弱的环节就是对英才学生的培养,将这批学生的发展与拔尖创新人才早期培养结合起来也应该理直气壮。关注拔尖创新人才的早期培育,一方面要有“面”上的思考,不至于让真正有潜质的学生被早期埋没,同时可为未来人才涌现提供更为坚实的基础;另一方面也需要有“点”的突破,包括认识、发现、开发某一方面具有潜能的学生,或对已经表现出一定发展潜能的优异学生、拔尖学生进行有针对性的教育。关注拔尖创新人才早期培育,许多国家在关注“面”上推进的同时,也注重在“点”上的突破。例如美国的蓝带学校(Blue Ribbon School)、州长中学(the Governor Dummer Academy),韩国的科学高中等,都是在宏观思考基础上的“点”的深化,在许多具体措施方面做得相对超前。我们当前关注比较多的还是学生在“面”上的发展,缺乏“点”上的深入思考以及对适合于他们教育的整体性研究。在促进有潜质学生发展的多样性上,我们的准备还显得相对不足。例如,从当前许多竞赛、加分的激励政策来说,主要偏向于科技类有潜质的学生,对人文类、经济类、艺术类等有潜质的学生如何激励,还有待深入思考。提供适合有发展潜质学生的针对性教育,需要摆脱功利思想,真正从学生的潜质和发展需求出发去思考条件的创设、平台的搭建。人们必须认识到,如果我们在拔尖创新人才早期培育上不能认识到自身在国际化背景下的差距,势必会影响我国未来的人才结构,进而影响国家核心竞争力的提升,势必也会对教育公平的效能提出深层次挑战。(三)努力创设适合学生“可能能力”发展需要的支撑平台访谈者:刚才您提到拔尖创新人才的早期培养要重视在“点”上的突破,您认为怎样才能找到学生兴趣与潜能的匹配点,让学生明确更适合自身发展的方向呢?唐盛昌:儿童的“可能能力”存在递减法则,当他们的这部分能力得不到认识或应有的关注与针对性开发时,这些“可能能力”就会减退甚至消失。当学生前一阶段的教育认识到了这些可能能力,并促进他们得到良好的发展时,后续阶段的教育也要创设良好的发展平台,帮助这些学生将“可能能力”尽可能地获得可持续发展。从一定意义上说,《教育强国建设规划纲要(2024—2035年)》中提到的“创新潜质学生”[2],正是在某一阶段的“可能能力”得到了初步展现的学生。拔尖创新人才的早期识别,就要努力创设适合他们发展需要的平台,促进他们创新素养的提升。如何创设适合这些有创新潜质的学生发展需要的良好平台?首要的是课程。如果缺乏有针对性的课程载体,开发学生的潜能和提升创新素养就是一句空话。无论是美国的蓝带学校,还是韩国的科学高中,他们都有一套与一般学校完全不同的课程体系。如果学校的课程差别小,就会不可避免地导致千校一面、千人一面。目前,我们许多学校只有应对高考的课程,却没有真正意义上培养学生创新意识的课程体系,这就很难促进不同潜质学生的多样化发展。除了课程平台,努力创设适合学生发展的数字化平台也非常必要,因为基于数字技术平台的生存、发展、创新素养已成为数字化时代人才必备的核心素养之一。促进有潜质的学生基于数字技术与感兴趣专门领域的课程整合,更有利于发挥他们的优势和迸发更多创新火花。但是,促进这些学生的发展,仅仅依靠学校的力量是远远不够的,还应当充分、有效地利用社会资源,给予学生更多的发展空间。三、我国中学教育培养拔尖创新人才的优势和存在问题访谈者:刚才您谈到了国际经验的重要性,您在很长一段时间内专门从事国际教育,在中外比较的过程中,您觉得目前国内中学教育主要的成绩是什么,在培养拔尖创新人才方面有哪些优势呢?唐盛昌:我们现在正在努力实现中国式现代化。中国式现代化的五个特征中,第一个特征就是人口规模巨大的现代化。我国中学教育的第一个巨大成就与此相对应。作为一个拥有14亿人口的大国,我们在普及知识、义务教育和基础教育发展方面取得了举世无双的成就。即使是美国,他们的基础教育也比我们差很多。我曾多次去美国,最发达的纽约地区,最差的学校与我们最差的学校相比也相差甚远。我认为从这个角度来看,成就极其巨大。第二个巨大成就是我们正在跟上教育现代化的步伐。2014年启动的高考综合改革和2017年开始的高中课程与教材改革实际上使我们的教育尤其是基础教育从工业时代迈向信息时代。例如,三年疫情防控期间全国的教育教学没有停摆,网络技术支撑了各个年级所有学生的线上教学,能够维持教育教学的正常运转,这是非常了不起的成就。也就是说,目前我们在线上教育方面已经打下了坚实基础,能够应对突发疫情的严重影响和自然灾害,目前全世界没有第二个国家能够实现如此大规模的线上教学。第三个巨大成就是课程教材改革对核心素养的重视,这表明我们正在稳妥地向教育现代化的方向发展。虽然与最先进的技术相比可能还存在差距,但这也是由客观情况决定的。我们的人口量巨大,惯性太大,比其他国家都要明显。例如,我们过去讨论芬兰教育,他们总人口只有500万,相当于上海人口的五分之一,还没有浦东新区的人口多。在这种比较小的范围内,工业化信息化往往更容易实现;而我们14亿人口的体量与芬兰完全不可同日而语[4]。所以,我认为我国的基础教育已经迈出坚实的一步,国家层面和地方层面都在积极进行人才培养探索,拥有一套基本适合中国国情的方案,在此基础上继续努力,就能进一步完善和做好拔尖创新人才培养选拔。访谈者:现代化强国建设与激烈的国际竞争也对我国拔尖创新人才培养提出了新的更高要求。面对挑战,您认为目前中学教育存在的主要问题有哪些?唐盛昌:首先是评价的问题。目前中国的高考以总分评价学生,这种评价模式在某种程度上导致了一些问题。一方面是抑制了学生的优势发挥,另一方面是更加凸显学习短板。例如你数学成绩不好,要提高成绩只有一个办法,就是把数学的短板补上。数学学不好的主要原因是兴趣不大,或者在数学领域的学习能力不强,如果不补全这个短板,你就无法考上理想的大学,而各科成绩加总的结果并不能凸显你的个性和特长。目前仅使用总分录取学生的国家不多,所以我们要借鉴一下其他发达国家的经验做法。例如,美国面向高校升学的基础测试一个是SAT考试,一个是ACT考试,还有面向母语非英语学生的托福考试(Test of English as a Foreign Language,TOEFL)。这些考试都不是由国家组织,而是第三方考试,由具有高度权威性的机构组织,但社会认可度很高。SAT和ACT的统考科目主要是英文和数学,证明学生个性特长的考试成绩则主要通过AP(Advanced Placement)考试体现。AP大概有30多门课程,学生可以随意选择,这是与高考相比最大的区别。我们是用一把尺子,也就是用高考总分衡量所有学生;美国不是一把尺子,而是多把尺子。除了统一的SAT或者ACT测试外,其他课程按照学生的兴趣爱好进行选择。这种差别背后隐藏的道理实际上是评价标准的差异,因为如果实行多元评价,是衡量学生的优势而不是短板。如果学校要开设满足多元评价的课程,那么课程的选择性就必须大幅度提高,相应地必然采取小班制,实际上走班制与小班制是联系在一起的。那么就产生了另外一个问题,不同考试的分数如何计算?目前我们采用的是不同科目的分数相加。但高度选择性的课程需要采用绩点制,采用小班教学,用这套体制作为支撑,才能实现多元选择下的多元评价。2014年开始我们进行了高考综合改革,这要求高中全面实施选课走班,意味着老师和教育设施的翻倍,成本非常高,因此小班制很难推行。我去过许多省市,他们普遍反映的困难就是师资的缺口,即高中无法为学生提供多元选择。选课走班包括两种情况:一种是学科选修,另一种是同一学科不同水平学习内容的选修。我们的老师习惯于按照高考水平要求所有学生,所以复习备考是按照高考的水平进行的,并没有为不同水平的学生提供选择。为什么竞争会很激烈?因为学业水平选择性考试也是服务于高考的,老师只会用高考的标准来要求不同水平的学生。其次是教学内容现代化的问题。比较一下,美国AP课程中的数学有50%左右的内容是涉及微积分和统计学的,其中微积分分为AB和BC两种,AB主要包括函数、图像、极限、导数和积分等内容;而BC增加了向量方程、极坐标方程、数列、经济模型、生物模型等。我国中学生目前学习的数学内容是适合工业时代的基础内容,但人类现在已经身处信息时代,仅仅学习初级数学方法是不够的,对于具有潜力的学生而言,微积分是数学的基础内容,如果被排斥在教学内容之外,实际上很多问题都无法解决。目前高中新课程从2017年开始已经向微积分方向发展,是个可喜的变化,还需要走得更远一些。最后是从教育体制角度而言,是全国一条线还是两条线的问题。美国的课程分为两类,一类是高中课程,不教授微积分,也没有微积分内容,大概一半的学校都是这样;另一半学校开设了AP课程,可以看作高中的高端课程。如果这些学校的学生在高中阶段不学微积分,就无法进入高水平研究型大学和跟上整个时代的形势。英国中学的体制是11年加2年,即11年中学教育加2年大学预科。中学教育有合格考试,考试结束后读大学预科的不是全部学生,大部分学生都解脱了,这种体制不安排全民参与高考。我国每年的高中毕业生有1000多万,参加高考的学生规模非常大。从教育体制的角度分析这些问题,我认为可以得到很多启发。四、拔尖创新人才早期培育链的构建策略访谈者:现在中央特别重视拔尖创新人才培养,近期出台的政策文件都提出这一方面的要求。请您结合多年教育经验,谈一谈中学和考试评价机构如何做好拔尖创新人才的培养与选拔?唐盛昌:原先我们认为拔尖创新人才的培养是大学的事情,与基础教育无关,现在所有人都认识到并非如此。仅仅把拔尖创新人才的早期培养前置到高中阶段还不够,实际上要放到初中阶段[5]。在基础教育中,拔尖创新人才培养按照什么思路进行?目前是以奥赛为主,我认为不算全部错误的思路,但肯定也不是最合适的方案。首先是数学,数学奥赛与其他几门学科的奥赛有所不同,因为其他几门奥赛并未受到更多限制。数学奥赛有个制约,即它采用初等数学方法解决问题,但是物理化学就可以使用微积分进行操作。数学奥赛基本不包含微积分,就是初等数学的内容,这与当前科技现代化发展的节拍相悖。如果仅以奥赛的标准为标杆,我认为拔尖创新人才的培养不可能成功。其次是既然应该从初中阶段就进行拔尖创新人才的早期培养,那么政策如何与此相适应?从考试机构的角度来看,中考和高考该如何鉴别出那些具有拔尖创新潜质的孩子?这需要突破许多观念上的障碍,包括考试的指导思想。我们经常提到考试不能超纲,实际上不超纲是在抑制拔尖创新人才的培养。例如,目前我担任华育中学的理事长,负责学生培养的大方向把握。十年前我曾经与华育的老师们讨论过初中的竞赛生培养,我告诉他们要按照国际奥赛的水平进行培养,不要人为设置障碍限制学生的成长。这十年他们一直按照这个方向在前进,近六年毕业的新高一学生中有132人获得五大学科竞赛一等奖,毕业生中有5人获得国际奥赛金牌,取得的成绩已经能说明一切。而且每届学生都是这么培养,基本没有特别加重负担,这证明了我们孩子的潜力。最近华育学生参加了丘成桐第二届国际数学竞赛,获得了团体第一名并包揽了个人前六名。这说明现在的初中孩子经过早期培养,已经达到高中学生中的最高水平。这是否已证明教育必须保底,但是不能封顶?再举一个例子,北大的竞赛非常多,中学生数学科学夏令营的未名奖就是其中之一。2024年全国有10名学生获得未名奖,其中华育初中的学生有4名。这说明有一批孩子在初中阶段真正拥有较强的天赋,他们的水平比我们期待的还高出许多。如果培养拔尖创新人才,聪明的孩子中有很多优秀的苗子,关键是我们能否发现,能否找到有效且合适的方法去培养。不能用教育中的某些条条框框抑制有天赋的学生发展,培养拔尖创新人才需要有另外一个人才培养通道。再次是如何保证学生在当前的考试体系中能够真正脱颖而出?我认为中考和高考必须进行深入的调查研究。高考这几年的改革成绩非常明显,原来学科的高考是基于学科知识掌握程度的测试,现在转变为基于学科知识的素养能力测试,考试的导向发生了改变。2017年高中新课标颁布,提出了学科核心素养的新概念,涉及多学科和跨学科。这不仅是基于单一学科的思考,也是对综合能力的思考;不仅仅是解题能力,更多的是对创造能力、创新能力和探究能力的关注[6]。如果高考按照现在的模式继续发展,就必然会出现另一项内容——基于核心素养的能力测试。现在基于课标内容的核心素养研究主要还是集中在学科层面,如果分析很多高校的入学面试,会发现实际上已经进入基于核心素养的能力测试阶段。目前在高考中,北京、上海、天津是全科自主命题,其他有自主命题任务的省(区、市)语数外三科都使用全国卷,其他选考科目自主命题。绝大部分省市选择语数外使用全国卷,证明这三门课程对所有学生的要求比较一致,这与国际相通,美国的ACT考试也是主要考阅读和数学。但是如果高考的其他考试科目仍然局限于六门到七门课程,那么将无法满足拔尖创新人才的培养需求。当今世界已经进入信息时代和智能时代,我们是否有可能在六门课程的基础上进一步深化改革,增加选修科目?语数外三科实现了全国统考,那么其他科目可以放到各省市、各个高校或者高校联盟进行,只要这个考试具有一定的社会权威性即可。据我所知,IB课程以及各个小科目共有197科,不同年份有所增加和变化。学生可以选择任何一科,选择度和自由度更大。自由度的优势与学生将来需要从事的专业相关,关联度更加匹配。学生的能力水平,包括我刚才提到的基于核心素养的能力水平,通过选择不同科目的组合,能够在一定程度上有所显示。例如,有学生想选修音乐,但高考中并没有这个选考科目。我对考取美国大学的学生做过分析,进入常青藤等名校的学生中,绝大部分人具备很高的艺术素养。如果我国的教育和考试现代化要深入推进,就需要进一步增加选择性。如果学生一整天的精力都放在应对考试上,就无法减轻负担,也谈不上发展兴趣。最后就是要发展自适应考试。我认为进入智能时代五年到十年以后,自适应考试将成为许多发达国家的考试常态和主要的考试形式。这种考试会根据学生的水平不断变化题目,测试结果更加精准,已经成为国际考试发展的主流。如果我国的专业化考试机构不探索采用这种模式,那么将跟不上时代节奏。比如美国的ACT考试是一个非常大范围的考试,从2024年开始实行全美范围内的机考,学生对于机考也已经非常熟悉和适应。但美国的考生人数比较少,我们需要比他们还要提高一个量级。他们人数最多的考试大概一两百万考生,我们动辄几百万、上千万。机考的组织需要大量高端科技支撑,并非仅仅是机房问题,更具挑战的是题库软件、网络平台支持。如果机考都考统一的题目那也比较简单,但自适应考试的开发难度就会大幅度提升。如果背后的理论和技术研究跟不上,那么我们的学生未来可能无法与国际接轨。五、结束语通过对唐盛昌校长进行专题访谈发现,构建拔尖创新人才早期培育链需要系统性的教育改革和创新。通过优化课程体系、创新教学方式、建立多元化评价体系等措施,使学校能为具有创新潜质的学生提供良好的发展平台。未来,基础教育阶段应进一步深化改革,完善拔尖创新人才早期培育机制,为我国创新驱动发展战略提供强有力的人才支撑。参考文献略