教育科学研究
EDUCATIONAL SCIENTIFIC RESEARCHS
徐光木 等:教育考试执法裁量基准问题探讨

2025-04-01

引用格式:徐光木, 黄健, 尤明青, 等. 教育考试执法裁量基准问题探讨[J]. 中国考试, 2025(3): 71-80.作 者徐光木,湖北师范大学经济管理与法学院副教授。黄健,湖北师范大学经济管理与法学院在读硕士。摘 要:宽严失当、同案不同罚等现象是当前教育考试执法中的突出问题,引发了社会广泛关注。执法裁量基准作为一种具体执法尺度和标准,能够弥补教育考试立法不足、防止执法擅权、量化执法标准和稳定执法结果预期。当前,我国教育考试执法裁量基准建设相对滞后,与法治政府建设要求相比尚有明显距离,具体表现为主体权限不够明确、程序不够规范、内容不够合理,需要从明确制定规则、规范制定程序、优化具体内容、提升实施效果等方面加以改进。同时,裁量基准并非万能之药,需要避免因过度基准化而沦为阻碍正常执法的桎梏。关键词:教育考试;考试执法;裁量基准;依法治考党的二十大报告指出,要深化行政执法体制改革,全面推进严格规范,公正文明执法,加大关系群众切身利益的重点领域执法力度,完善行政执法程序,健全行政裁量基准[1]。为贯彻这一决策部署,国务院办公厅印发《关于进一步规范行政裁量权基准制定和管理工作的意见》(以下简称《意见》),提出到2023年底前,行政裁量权基准制度普遍建立,基本实现行政裁量标准制度化、行为规范化、管理科学化的总体目标[2]。2023年以来,国务院各部委和各省(自治区、直辖市)陆续出台行政裁量权基准指导性文件,对本部门、地方行政裁量权的行使做出具体安排,教育行政裁量权基准制度也在酝酿中。教育考试执法作为教育行政执法的重要组成部分,其规范程度不仅关系到法治政府建设成效,也与教育行政裁量权基准制度的制定息息相关。开展教育考试执法研究,特别是深入研究教育考试执法裁量基准,已成为教育领域进行裁量权基准制度探索的一项重点课题,它能够为教育行政部门出台相关指导性文件和规范教育考试执法行为提供理论支撑。本文主要从教育考试裁量基准的概念内涵、发展现状、存在问题和对策建议四个方面进行讨论。一、教育考试执法裁量基准内涵(一)教育考试执法裁量基准的含义有法律就有裁量。由于法律要覆盖到社会生活的方方面面,故而不可能事无巨细、面面俱到,这为自由裁量权预留了空间。行政执法裁量权(又称自由裁量权)本质上是行政主体在基于对多元利益关系的审视和平衡后,针对具体情境采取决策行为的职权[3]。其对应的行为可以是作为或者不作为,评判其合理性应当考虑个案的具体情形,如行政相对人的行为时机、方式、程度等[4]。裁量权的意义在于克服立法中存在的粗疏,但在实际执法过程中又可能出现裁量权行使不当的问题,违背设定裁量权的规范目的。英国行政法学家威廉·韦德(William Wade)因此指出,所有的裁量权都可能被滥用,对每一项权力都应设置一定程度的法律限制[5]。教育考试执法亦是如此。当前,我国教育考试执法的依据涵盖法律和部门规章两个效力位阶:一是以《教育法》为代表的法律,对教育考试执法做出原则性、概览式规定,包括教育考试执法的主体、职权、方式等[6];二是以教育部颁布的《国家教育考试违规处理办法》(以下简称《办法》)为代表的行政法规规章,对教育考试执法的种类、情形、程序、救济等做出具体规定[7]。但这些法律和规定仍然不能完全排除自由裁量空间,如《教育法》第七十九条只是列举了考试作弊的五类情形,规定了五种处罚措施,对执法认定事实、选择处罚幅度预留了较大的裁量空间[6];《办法》虽然对《教育法》的若干条款进行了细化,但仍然不够具体,如第九条规定,有组织团伙作弊等四种情形之一的,可以视情节轻重,同时给予暂停参加该项考试一至三年的处理;情节特别严重的,可以同时给予暂停参加各种国家教育考试一至三年的处理[7]。对于团伙作弊的判断标准、团伙规模与处罚幅度的关系、情节特别严重的判断标准等执法层面的问题,《办法》并未涉及。此外,在考试资格确认、成绩评定、高等教育自学考试毕业资格认定等环节,也存在一定的裁量空间。为进一步规范教育考试执法行为,全面推进依法治考,防止执法宽严失当、同案不同罚等现象,根据《意见》要求制定教育考试执法裁量基准势在必行。《意见》指出,行政裁量权基准是行政机关结合本地区本部门行政管理实际,按照裁量涉及的不同事实和情节,对法律、法规、规章中的原则性规定或具有一定弹性的执法权限、裁量幅度等内容进行细化量化,以特定形式向社会公布并施行的具体执法尺度和标准[2]。可见,教育考试执法裁量基准作为一种具体执法尺度和标准,通过对法律法规规章中的原则性规定和具有一定弹性的执法权限、裁量幅度等内容进行情节细化、效果格化和程序制式化,实现教育考试执法裁量标准制度化、行为规范化、管理科学化,确保教育行政机关在具体行政执法过程中有细化量化的执法尺度目标。从制定主体上看,教育考试执法裁量基准一般应由教育行政部门制定,但教育考试机构也可在法律法规授权的范围内,并在教育行政部门的指导下制定相应的裁量基准;从制定程序上看,它需要履行相应程序并向社会公布;从效力位阶上看,它是对法律法规规章和上级规范性文件的具体解释和细化,不得逾越前者规定的幅度;从涉及范围看,以考试处罚为主,但也包括考试资格确认、考试成绩认定、考试监督检查、考试安全管理、考生权益保护等多个方面,详见表1。(二)教育考试执法裁量基准的功能当前,行政裁量基准已经在我国得到普遍应用,并在立法、执法、司法、守法等层面发挥作用,教育考试执法亦不应例外,理由包括以下四个方面。第一,教育考试执法裁量基准有助于弥补立法不足,提高考试立法的科学化水平。虽然《教育法》等相关法律法规在教育考试领域具有高位阶和高效力,但因其内容相对固定而不可避免地带来滞后效应和呈现抽象特征,使其难以应对复杂多变的现实情况,导致执行困难。在此背景下,教育考试执法裁量基准应运而生。它通过对法律条文进行细化和实操化处理,为执法提供明确标准,进而有助于正确处理稳定与变化之间的关系。具体来说,在教育考试执法实践中,由于法律语言的模糊性,以及对于“情节严重”等表述缺乏具体界定,导致执法人员拥有较大的自由裁量权,同时也给公众留下执法不够精确严谨的印象[8],甚至可能导致权力滥用。因此,出台教育考试执法裁量基准,有助于引导执法人员正确行使裁量权,有效弥补立法的不足,确保教育考试执法公平公正。第二,教育考试执法裁量基准有助于防止执法擅权,为考生权利提供额外保障。受传统行政管理思维的影响,一些教育考试执法人员超出立法本意,恣意对违纪和作弊的具体情形进行扩大化解释,或者不论作弊情形轻重与否,对作弊考生一律给予停考三年的处罚,导致考生的合法权益在不同程度上受到侵犯,对教育考试的公信力亦构成损害。教育考试执法裁量基准通过设定裁量标准、公示决策依据、明确裁量范围等措施,能够有效限制执法机关及其执法人员滥用自由裁量权,防止裁量中可能出现的同案异罚、因违反平等对待原则而损害实质正义等现象,有效实现前者的自我约束[9]。第三,教育考试执法裁量基准有助于量化司法标准,为司法审查提供参考。传统观念中,裁量不予审查是行政法的共识,行政执法裁量行为不受司法控制[10]。但这并不意味着行政执法裁量基准和司法不会产生联系,这种联系在教育考试类行政诉讼中有所体现。由于司法审查不可避免会涉及教育考试执法的尺度和标准,如果教育考试执法机关不制定裁量基准,就会产生对司法机关审查裁量权行使是否合理的质疑,进而引发司法干预行政的嫌疑。裁量基准的制定为法院提供了审查的客观标准[11],通过将教育考试执法机关的具体裁量行为转化为规范化文本,使司法机关可以将其作为司法审查时的参考,进一步促进司法公正和提高司法效率。第四,教育考试执法裁量基准有助于稳定结果预期,对行政相对人发挥教育作用。由于教育考试执法涉及对具体情形的深入分析和判断,教育考试执法人员需要在法律允许的范围内合理行使裁量权,这对其综合素质的要求极高。如果没有明确裁量基准,执法人员可能会受到个人理解、已有经验或情感等因素的影响,对相似案件或情形做出截然不同的处置。通过制定并公开裁量基准,执法过程变得更加公开透明,这既有利于提高教育考试执法的可预测性,增强结果预期的准确性,也使考生能够更清楚地了解执法依据和过程,提高执法决定的可接受度。通过公开裁量基准,使考生更易于接受处置结果的过程,这实际上也是一个普法教育的生动过程,可以提高裁量基准的制定质量以及为基准的实施营造良好的社会环境[12]。二、我国教育考试执法裁量基准制定现状(一)制定主体根据行政裁量基准一般理论,依法享有执法权的行政主体均有权制定行政裁量基准[13]。在我国,行政主体一般是政府行政机关,但少数经法律法规授权的其他社会组织也可被赋予行政主体地位。如《教育法》第二十一条规定,国家实行国家教育考试制度。国家教育考试由国务院教育行政部门确定种类,并由国家批准的实施教育考试的机构承办[6]。因此,教育考试机构是经法律授权的行政主体,依法享有教育考试执法裁量基准制定权。但由于我国尚未对行政执法裁量基准的制定主体做出统一限定,在实际操作中,各地有关裁量基准制定主体的规定有所不同,大致可以分为三类。一是上级行政机关具有制定行政裁量基准的指导权。例如,青海省规定省级行政机关有权制定行政裁量基准,下级机关需遵循上级机关制定的标准,或在上级机关仅进行原则性规定时,下级机关方可依此制定行政裁量基准[14]。二是上级行政机关具有制定行政裁量基准的优先权。如甘肃省规定,下级行政机关只能在上级行政机关对行政裁量基准进行制定后,方可制定对应基准,且必须与上级基准保持一致[15]。三是允许各行政机关结合实际制定裁量基准。如黑龙江省规定各级行政机关都有权力制定行政裁量基准,不同层级的行政机关可以根据各自职责制定相应的法律法规,其中包括行政裁量标准[16]。可见,除《教育法》和《办法》对我国教育考试执法裁量基准的制定主体做了一些限定外,各地还结合实际做出了一些个性化规定。(二)制定思路当前,我国国家层面和省级层面的教育考试执法机关均未针对教育考试执法领域制定明确的裁量基准。在此背景下,各省普遍选择将《办法》作为本区域内教育考试执法的基本依据。因此,《办法》在一定程度上承担着我国教育考试执法裁量基准的重要职责。通过深入剖析《办法》的文本内容,可以初步探索并理解我国教育考试执法裁量基准的制定思路和技术。首先,在裁量基准结构方面,我国教育考试执法裁量基准采用“违法情形列举+基准+适用指引”的思路。如《办法》第十条规定,考生有第八条所列行为之一的,应当终止其继续参加本科目考试,其当次报名参加考试的各科成绩无效;考生及其他人员的行为违反《中华人民共和国治安管理处罚法》的,由公安机关进行处理;构成犯罪的,由司法机关依法追究刑事责任[7]。其次,在细化裁量情节方面,主要采用“列举+兜底”的思路,即先列举常见违规和作弊行为,对于不能穷尽的,最后采用其他兜底。如《办法》第五条第九项、第六条第九项、第七条第五项、第八条第五项等均属于兜底条款。最后,在裁量效果设定方面,主要采用经验划分法。这种方法高度依赖执法人员的专业经验和主观判断能力,而非倚重于固定的技术框架,因而能够有针对性地提出具有普适性的关键指标和标准,确保执法的灵活性。如《办法》第九条第二款规定,视情节轻重,可同时给予停考一至三年,或者延迟毕业时间一至三年的处理[7],就是给专业经验发挥作用留有余地。(三)制定规范《教育法》《办法》的规定较为宏观和抽象,为裁量基准预留了大量空间。教育考试执法裁量基准不仅包括行政处罚,还应包括行政许可、行政确认、行政强制、行政检查等。但教育考试法律法规规章主要围绕考试行政处罚的主体、种类、情形和程序等做出规定,并未能实现对教育考试执法工作的全覆盖,从而形成“教育考试处罚=教育考试执法”的错误认识。因此,离开事实上的裁量基准,教育考试执法呈现的可能是八仙过海各显神通的场景。但在教育考试执法实践中,上述情况并未出现,主要原因是国家和省级教育考试执法机关在实际工作中普遍以正式或非正式方式制定了大量具有裁量基准性质或发挥裁量基准作用的材料(以下统称具有裁量基准性质的材料),以公告、通知、守则、工作提示等较为常见。例如,湖北省教育考试院在2023年高考前夕发布《考前提示》,强调考试过程中若发现手机,无论是否开机或使用,均按作弊论处;各科的选择题和非选择题都必须在专用的答题卡指定区域内作答,在试卷或草稿纸上作答的,答题一律无效[17];山东省教育招生考试院在《致2024年春季高考技能测试考生的一封信》中也指出,考试过程中考生如携带手机等具有发送或者接收信息功能的设备,无论使用与否,均将认定为考试作弊并受到严惩;试题、答题卡、草稿纸等均属于涉考材料,严禁以任何方式拍照传出或带离考场[18]。此外,省级教育考试机构印发的教育考试考务手册也是裁量基准的重要载体。这类手册不是正式文件,但在事实上发挥裁量基准的作用。因此,从形式上看,教育考试执法裁量基准是新生事物,但实际上教育考试执法机关已经进行了较长时间的实践探索,积累了比较丰富的经验。三、我国教育考试执法裁量基准存在的问题(一)主体不够明确在全国统一的教育考试执法裁量基准及其指导意见缺位的情况下,我国教育考试执法裁量基准呈现出各地各机构各自为政的复杂局面。一方面,从规范角度看,各级教育考试执法机关均未能制定出严格意义上的教育考试执法裁量基准,即缺乏以“裁量基准”明确命名的规范性文件。这反映出在教育考试执法裁量基准的制定过程中,缺乏明确的指导原则和统一标准,导致相关执法机关在裁量基准的命名和制定上呈现出较大随意性,进而影响了裁量基准的权威性和有效性。另一方面,从实证角度看,尽管尚未出台统一的教育考试执法裁量基准指导性文件,但在实际执法中,各级教育考试执法机关又在适时印发各种具有裁量基准性质的材料。这些材料在一定程度上为教育考试执法提供了依据和参考。但由于缺乏统一的制定标准、程序和必要的权威性,各地裁量基准在内容、标准和尺度上存在较大差异和不确定性。这不仅使不同地区、不同部门、不同考试的执法尺度和标准难以统一,影响了教育考试执法的水平公平,也容易激发社会矛盾,甚至滋生各种寻租行为,为不法分子提供可乘之机。例如,2011年某省教育考试院所属标准化考点越权制定事实上的裁量基准,对高考艺术类考生李某给予取消当年高考所有科目成绩的处罚,李某对处罚不服,遂对该标准化考场及教育考试院提起诉讼,法院最终做出责令教育考试院撤销处罚的判决,并提出关于完善行政处罚程序的若干司法建议[19]。这是裁量基准制定主体不明确情况下发生的典型案例。(二)程序不够规范行政裁量基准从性质上看,应当归为内部行政规范性文件。此类文件与一般意义上的行政规范性文件相对,是指上级行政机关对内部行政人员和下级行政机关的工作进行规范、指导和约束的行为准则[20]。根据这一定位,裁量基准的制定过程应严格遵循一系列法定程序,包括评估、征求意见、审核、审议及公布等;设计这些程序旨在确保制定行政规范性文件的程序正义,彰显裁量基准文本的合法性与合理性。然而,在教育考试执法实践中,裁量基准的制定鲜有能够完全履行上述程序者,体现出一定的随意性。以各省(市、区)在工作实践中发挥高考执法裁量基准作用的高等学校招生委员会发布的《关于做好普通高校招生工作的通知》为例,通常涵盖了考试、招生违规处理、信息公开、安全保密等执法事项,是教育考试执法的重要依据。然而,除了文件形成后根据《政府信息公开条例》进行公开发布外,并未看到有任何省份在文件制定过程中或公布前公开征求公众意见。例如,2020年浙江考生吴某曾以《2020年浙江省普通高校艺术类专业招生办法》在发布前未组织听证、公开征求意见等为由提起诉讼[21]。这反映出在裁量基准的制定过程中,存在明显的程序不规范问题。这不仅削弱了裁量基准的合法性和合理性基础,也影响了其在实际执法中的权威性和有效性。必要评估、征求意见等关键程序的缺乏,可能导致裁量基准内容与实际情况脱节,无法满足实际执法的需要;同时,也可能使公众对裁量基准的制定过程产生质疑,降低公众对教育考试执法工作权威性、专业性的认可。(三)内容不够合理裁量基准作为教育考试执法的重要依据,其内容的合理性直接关系到执法公平公正。当前我国教育考试执法裁量基准在内容上也存在一些问题,主要表现为情节细化考量因素单一和裁量阶次划分不科学。在情节细化方面,现行裁量基准往往过于简单粗糙、不够具体,未能充分考虑各种实际情况和个体差异。这种简单的处理方式无法有效应对教育考试中出现的多种违规作弊行为。例如,在涉及不同情节的违规作弊行为时,现行基准往往没有根据情节轻重进行细致区分,而是采取了一刀切的处罚方式。这种方式不仅可能导致处罚过重或过轻,影响执法的公正性和合理性,还可能因为模糊性和不确定性而给执法过程造成潜在风险,增加执法难度和不确定性。此外,在阶次划分方面,现行基准也缺乏科学性和规范性,主要表现为未能严格按照相关法规进行阶次划分,导致对不同情节和程度的违规作弊行为缺乏合理区分。例如,在作弊处罚方面,对于轻微、一般、严重等不同程度的违规作弊行为,基准往往没有明确的界定和区分,而是采取了一刀切的处罚方式;在评卷判分方面,对于美术类、主观题类试题等,基准往往不够科学或不具可操作性,容易导致执法过程中的不公平和不合理现象,损害考试公平性和公信力。近年来,各地因艺术类考试、主观题判分依据不合理或缺乏依据,处罚依据不充分等而引发的诉讼屡见不鲜。例如,浙江省美术高考生范某诉浙江省教育考试院案[22]、北京市硕士研究生入学考试考生任某诉北京教育考试院案[23],武某俊诉云南某大学行政处罚案[24]等,都与教育考试执法裁量基准内容不够合理和完善有关。四、完善教育考试执法裁量基准的建议举措(一)明确裁量基准的制定规则立法权限划分是立法体制的核心。行政立法作为执行性立法,同样应把权限划分摆在突出位置。没有行政裁量权,便没有裁量基准。针对当前教育考试执法裁量基准制定主体权限不明确的问题,应参照立法的宗旨和精神,对裁量基准的制定权限进行明确划分,形成层级裁量基准体系[25],即通过构建教育考试执法裁量基准的制定规则,使各级教育考试执法机关在制定裁量基准时有章可循、逐级递进。这是确保裁量基准合法、合理和科学的前提。首先,构建多层次制定体系是关键。省级以上教育考试执法机关因具备丰富的资源、人才和经验优势,应成为主导裁量基准制定的核心力量。同时,为确保基准的实操性,应吸纳基层教育考试执法人员参与制定过程,充分听取其实践经验与建议。其次,建立动态调整机制不可或缺。教育考试执法裁量基准的制定和执行是一个不断探索和完善的过程。在执行过程中,可能会遇到各种新的问题和挑战,需要根据实施过程中的具体情况,适时调整权限划分和基准内容,以达到通过增加动态要素形成要素间的协动机制来促进法律规范与现实相适应的目标[26]。这要求各级教育考试执法机关保持高度敏锐性和灵活性,及时收集和分析反馈信息,对基准进行必要的修订和完善。最后,强化监督问责机制是保障。通过强化监督问责,可以推动各级教育考试执法机关更加认真、负责地履行制定和执行裁量基准的职责,确保教育考试执法的公正性和权威性。(二)规范裁量基准的制定程序行政程序法具有公正价值、效率价值、秩序价值,其立法意义在于保障公民权利、提高行政效率[27],教育考试执法裁量基准亦不例外。如果抛弃提高行政效率这一要义,制定基准的必要性将被大大削弱。因此,提出规范裁量基准制定程序的建议,不是照搬照抄立法的程序性规定,而是结合教育考试执法的具体实际,对立法的程序性规定做出适当调整、简化,使之既符合立法精神,又契合教育考试工作实际。为实现合法、合理、科学制定教育考试执法裁量基准的目标,有三个环节需要重点考虑。一是评估论证。重点是评估该裁量基准的合法性、合理性,既应充分肯定裁量基准的积极意义,又应避免掉入“唯基准化”陷阱,导致基准成为教育考试执法活动正常开展的障碍。二是合法性审查。主要是依据《国务院办公厅关于全面推行行政规范性文件合法性审核机制的指导意见》[28]对各级教育考试执法机关制定的教育考试执法裁量基准进行审查,确保合法合规。三是公开发布。2021年修订的《中华人民共和国行政处罚法》明确规定行政处罚裁量基准应当向社会公布[29],因此除依法需要保密和不宜公开的文件资料外,教育考试执法裁量基准应主动予以公开。(三)优化裁量基准的具体内容优化裁量基准的选取与细化标准是确保教育考试执法公正、公平的关键。裁量情节作为影响最终处理决定的重要因素,必须予以全面考量。这要求教育考试执法机关在制定裁量基准时正确处理法定情节与酌定情节的关系,避免倚重单一因素导致决策偏颇。法定情节指法律法规明文规定教育考试执法机关在做出处理决定时必须予以考虑的情节,如是否非法获取考试试题或者答案、是否携带或者使用考试作弊器材(资料)、是否让他人代替自己参加考试或代替他人参加考试、是否组织团伙作弊、属于考试违纪还是作弊等,酌定情节则需基于一线执法经验灵活纳入考量。同时,法定情节与酌定情节应按比例原则合理裁量,确保裁量基准既具灵活性又不失原则性。例如,各地关于考生忘记携带身份证件的处理办法不尽一致,甚至出现因人而异的情况:有的考生直接被拒于考场外,有的考生被要求(请他人)将身份证件在考试结束前送至考场,还有的被要求在后续考试前带至考场即可等等。这些各不一致的处置办法给教育考试执法带来困扰,因此存在纳入裁量基准的必要。我国香港特别行政区考评局发布的《公正处理考试异常事件准则》将教育考试处罚种类按照情节轻重划分为警告、扣分、降低成绩等级、取消科目成绩、取消全部考试成绩五类;其相较于《办法》取消本科目考试成绩、取消全部考试成绩、取消考试资格三类,更加凸显比例原则。其中,扣分机制根据考生行为的危害程度、主观态度等情节扣除相应比例的分数作为处罚[30],具有一定借鉴意义。(四)提升裁量基准的实施效果提升教育考试执法裁量基准的实施效果是一项系统性任务,需要各方协作、共同完成,主要包括四个方面。一是加强培训与指导。实现教育考试执法人员培训和指导的全覆盖,提高相关人员熟练运用裁量权基准解决执法问题的能力,确保执法规范性和一致性。可通过定期举办培训班、研讨会等活动,使教育考试执法人员充分了解裁量基准的制定背景、内容和要求,掌握正确执法方法和技巧。二是强化监督与考核。聚焦主体的合法性、程序的正当性、内容的合理性,统筹基准制定的合规与灵活,统一和明确裁量基准的审查标准,做到审查标准不过细,范围不过度扩张[31]。应将裁量基准制定和管理工作纳入教育考试执法机关建设考评指标体系,通过定期检查和评估,确保裁量基准的有效实施,并对不符合要求的情况进行及时纠正。三是建立反馈与调整机制。定期收集和分析教育考试执法过程中的反馈意见,对执法裁量基准进行动态调整和优化,特别是为避免裁量怠惰、裁量僵化,要在裁量基准规范文本中合理设置逸脱条款[32]。四是注重运用现代科技手段。充分利用大数据、人工智能等技术对执法数据进行收集、分析和挖掘,为裁量基准的制定、实施和完善提供科学依据,从而达到提升裁量基准实施效果的目的。五、结束语中共中央、国务院印发的《法治政府建设实施纲要(2021—2025年)》提出,全面落实行政裁量权基准制度,细化量化本地区各行政执法行为的裁量范围、种类、幅度等并对外公布[33]。《教育强国建设规划纲要(2024—2035年)》进一步要求健全教育法律法规规章[34]。作为细化量化行政执法行为的重要抓手,行政裁量基准通过有效规范行政裁量权,可推动提升行政执法的质量和效能,切实维护人民群众合法权益[35]。教育考试执法裁量基准作为保障教育考试公平公正、提升教育考试执法效率的关键举措,其重要性毋庸赘言。通过精心构建制定规则、严格规范制定程序以及不断优化基准内容,能够确保教育考试执法裁量基准的合法性、合理性和科学性,从而为教育考试执法提供坚实的制度保障。同时,我们也应清醒地认识到,裁量基准并非万能之药,它既可以作为防范权力滥用的有效工具,也会由于过度裁量基准化而沦为执法工作正常开展的阻碍。因此,教育考试执法机关在探索制定裁量基准的过程中,应采取积极而审慎的态度。一方面,针对教育考试中呈现的地域间、不同考试间可能影响考试公平的差异性执法举措,应通过建立裁量基准进行积极干预,确保执法的统一性和公正性;另一方面,对于尚未对考试公平构成明显不利影响的执法举措,应遵守法律保留原则,即保留各级教育考试执法机关的自由裁量权和合理设置逸脱条款,以应对复杂多变的现实情况和防止行政权对立法权的僭越[36]。借助这种双向平衡,既能有效防止权力滥用,保障考试公平公正,又能确保执法工作弹性和效率,使之更加符合教育考试执法实际需要。参考文献略

王俊民 彭宗生:基于课程领域的批判性思维和创造性思维测评: 澳大利亚NAP-SL2023的经验及启示

2025-03-31

引用格式:王俊民, 彭宗生. 基于课程领域的批判性思维和创造性思维测评:澳大利亚NAP-SL2023的经验及启示, 2025(3): 81-91.作 者王俊民,重庆师范大学初等教育学院副教授。彭宗生,重庆师范大学初等教育学院在读硕士生。摘 要:批判性思维和创造性思维是学生核心素养的重要内容,也是拔尖创新人才必须具备的关键素质。如何测评批判性思维和创造性思维是推进义务教育改革和培养拔尖创新人才亟须解决的重要问题。澳大利亚NAP-SL2023项目将批判性和创造性思维融入国家科学素养测评项目,采用多种方式测评科学课程领域的批判性思维和创造性思维。该方案具有基于课程领域将两种思维整体性融入认知维度的特点,表现出思维测评情境化和基于特殊领域的趋势,在国际大规模学业测评项目中具有一定代表性。NAP-SL2023对我国基于课程领域开展批判性思维和创造性思维测评具有多方面的启示。关键词:澳大利亚;NAP-SL2023;批判性思维;创造性思维;科学素养测评引言2023年5月,教育部办公厅印发《基础教育课程教学改革深化行动方案》,要求以教学评价牵引基础教育课程教学改革,注重以核心素养立意的教学评价[1]。2024年3月,教育部部长怀进鹏在全国两会记者会上指出,培育和发展新质生产力,创新是核心要素,要通过教育来培养拔尖创新人才[2]。批判性思维和创造性思维是学生核心素养的重要内容,也是拔尖创新人才必须具备的关键素质。如何测评批判性思维和创造性思维是深化义务教育课程教学改革、培养拔尖创新人才亟须解决的重要议题,也是国内外学者关注的热门话题。在国际上,尽管不同学者对批判性思维和创造性思维的定义各有侧重,但典型的测评工具主要从两种思维的过程和核心特点出发进行测评[3]。例如,国际上使用较为广泛的托兰斯创造性思维能力测验(The Torrance Tests of Creative Thinking)主要通过言语测验、图形测验、声音和词测验开展创造性思维测评[4];加利福尼亚批判性思维技能测验(California Critical Thinking Skills Test)通过基于实例分析的标准化考试测查大学生和高中生的分析、评价、解释、演绎等思维能力;美国教育考试服务中心(ETS)编制的HEIghten批判性思维测试主要考查大学生的分析与综合能力[3]。这些测评工具虽然得到较为普遍的认可和应用,但存在独立于课程领域、与学科内容和学生日常生活脱节等现象,并可能导致思维训练的形式化、机械化和目的虚化等问题[5]。一些学者对一般性测评的局限性展开了反思性研究。例如,一些研究发现,将批判性思维拆解为不同维度进行独立测评可以有效测量知识和基本认知能力,但不适用于高阶综合能力的测评[6-7];由于创造力所需的知识结构、特质和技能在不同领域具有较大的差异[8],因此对创造力的研究应该从一般性转向特殊性领域[9]。一些学者或项目探索研制了基于特定领域的批判性和创造性思维测评工具。例如,蒂鲁内(Tiruned)等基于物理学电磁学知识开发了测评大学生物理批判性思维的测试[10];萨克(Sak)等基于生物、物理等五个科学学科开发了面向六年级学生的创造性科学能力测试(Creative Scientific Ability Test)[11];而PISA2021从文字表达、视觉表达、社会问题解决和科学问题解决四个维度测量学生的创造性思维水平[12]。上述测验或项目使批判性和创造性思维测评与学科内容和学生的日常生活相联系,探查特定情境下学生的高阶思维发展水平,得到了广泛应用。它们为基于课程领域,尤其是科学课程开展批判性和创造性思维大规模测评提供了新思路。我国心理学界较早关注批判性和创造性思维,测评工具中既有对西方测量工具的修订或改编,也有基于本土文化开发的针对性测评。例如,罗清旭对加利福尼亚批判性思维技能测验进行了翻译和修订[13],张德琇开发了面向小学生的创造性思维潜能测验[14],郑日昌和肖蓓苓[15]、骆方和孟庆茂[16]等都开发过面向中学生的创造性思维测评工具。这些工具被广泛应用于教育教学改革和创造性人才培养与评价等多个领域,进一步推动了我国早期的批判性和创造性思维研究。特殊领域的批判性思维和创造性思维测评在2000年以后才逐渐引起学界关注。近年来,有关创造力、批判性思维的研究工具和成果逐渐增多。其中,申继亮、胡卫平、林崇德编制的青少年科学创造力测验具有良好的信效度[17],先后被改编、施测于土耳其、马来西亚等国家的中小学生,在国际上具有一定的影响力;彭运石、王玉龙从模型建构、测评工具研制及应用等方面,对社会科学、自然科学等多个领域的创造性人格进行实证研究[18];殷莉莉在借鉴加利福尼亚批判性思维技能测验的基础上,结合化学学科知识开发了化学批判性思维测试[19];胡欣阳、姚晓红基于科学课程领域开发了高中生批判性思维测评工具并进行实证研究[20-21]。综合来看,有关批判性、创造性思维的测评研究正从关注一般性转向强调特殊领域,基于课程领域开发情境性测评工具已经成为国际研究的新趋势。然而,现有研究和项目主要将批判性思维和创造性思维进行独立测评,且多局限于小规模或小范围测评,在国家课程、大规模学生学业测评项目中的应用还十分有限,相关研究结果和结论尚不充分,实践经验还比较缺乏。在学科课程领域,如何将两种思维融入具体课程并开展科学评价还是一个具有挑战性的任务。2023年,澳大利亚国家测评项目(National Assessment Program,NAP)首次将批判性思维和创造性思维融入科学素养测评项目进行考查,为基于课程领域的批判性思维和创造性思维大规模测评开辟了新的实践路径[22]。本文以澳大利亚2023年NAP科学素养测评项目(NAP-Science Literacy 2023,NAP-SL2023)为研究对象,对其批判性和创造性思维(critical and creative thinking,CCT)测评框架、测评方式、试题及显著特征等进行深入分析,以期对我国学生核心素养发展背景下的批判性和创造性思维测评开展提供参考借鉴。一、NAP-SL2023项目概述NAP-SL是由澳大利亚课程、评估和报告管理局(Australian Curriculum, Assessment and Reporting Authority, ACARA)开发和管理的全国性科学素养测评项目,属于抽样性监测。该项目每三年开展一次,自2018年开始测评对象为六年级和十年级学生,主要目的是监测学生的科学素养发展情况。2019年12月,澳大利亚全国教育委员会发布了《爱丽斯泉(姆帕恩特韦)教育宣言》[The Alice Springs(Mparntwe)Education Declaration,以下简称《教育宣言》],其远景目标是将澳大利亚课程打造成为世界一流水平[22]。作为国家课程实施效果监测的一部分,NAP-SL2023通过监测学生的科学素养进步状况以评价《教育宣言》目标的达成情况。因此,NAP-SL2023测评框架设计的主要依据是国家课程《澳大利亚课程:科学》[The Australian Curriculum: Science,以下简称《科学课程》]。图1为NAP-SL2023项目的基本框架,主要由内容维度和认知维度构成[22]。其中,内容维度包括《科学课程》中的内容领域(content domain)、关键概念(key ideas)、跨学科优先事项(cross-curriculum priorities)、通用能力(general  capabilities)四部分内容,由于后三者具有跨学科性质,主要通过融入内容领域的方式进行间接考查,但通用能力也可以与认知维度对应进行考查。(一)内容领域内容领域是《科学课程》的核心内容,包括科学理解(science understanding)、作为人类活动的科学(science as a human endeavour)和科学探究(science inquiry)三个维度,每个维度都以核心概念(core concepts)的形式呈现具体内容,见表1。科学理解指应用科学知识解释和预测现象,并将这些知识应用于新的情境中,包括生物、化学、物理、地球与宇宙科学四个学科分支的十个核心概念。作为人类活动的科学指科学的本质,包括科学的本质和发展、科学的应用与影响两个子维度共五个核心概念。科学探究关注科学家研究自然世界的不同方式,并基于证据提出解释,包括提问与预测、计划与实施、处理数据和构建模型及分析、评价、交流五个二级维度共六个核心概念。NAP-SL2023将NAP-SL2018测评框架中的科学探究技能改为科学探究,意在强调科学探究包括技能和认知两个方面[22]。(二)认知维度认知维度在NAP-SL2018中已经提出,旨在明确学生作答过程中的思维技能,其设计主要依据学生应用科学知识、科学探究的方式及认知复杂性,同时借鉴包括布卢姆教育目标分类学在内的认知理论框架,以及澳大利亚课程中关于批判性和创造性思维认知过程的描述。与NAP-SL2018相同,NAP-SL2023中的认知维度包括了解和应用程序,推理、分析和评价,综合与创造三个方面,并明确描述了批判性和创造性思维与认知维度的对应关系,为其融入科学素养测评提供了框架。(三)关键概念、跨学科优先事项和通用能力NAP-SL2023将关键概念、跨学科优先事项和通用能力作为与内容领域并列的内容维度列入测评框架,这一维度具有跨学科性或通用性,因此其测评主要通过内容领域实现。关键概念本质上是科学课程领域的跨学科概念,具体包括模式、秩序和组织,形式与功能,稳定与变化,比例与测量,物质与能量,系统等六个关键概念,主要基于科学理解进行考查。跨学科优先事项属于科学与人文的融合,包括土著和托雷斯海峡岛民历史和文化、澳大利亚与亚洲的交往、可持续性三个方面,主要基于三大内容领域进行考查。通用能力指澳大利亚国家课程提出的七种通用能力,分别是读写、计算、数字素养、批判性和创造性思维、伦理理解、跨文化理解、个人与社会能力(相当于我国的核心素养),主要通过学科课程教学实现。NAP-SL2015和NAP-SL2018都曾经尝试将通用能力融入科学素养测评,但最终只是作为间接内容在试题和背景材料以及科学探究考查过程中有所呈现[23]。NAP-SL2023首次将批判性和创造性思维这一通用能力作为重点内容纳入科学素养测评。二、NAP-SL2023批判性和创造性思维的界定及其与认知维度的关系(一)批判性和创造性思维的界定澳大利亚课程、评估和报告管理局2024年发布的测评报告指出,批判性思维涉及学生分析和评估可能性、构建和评估论点以及使用信息、证据和逻辑得出合理结论和解决问题;创造性思维要求学生产生新的想法,考虑不同的解释和可能性,并将知识和技能转移到新的和不熟悉的环境中[24]。这与澳大利亚官方课程网站对批判性和创造性思维的界定基本一致。该课程网站将批判性思维和创造性思维整合为一个通用能力,即批判性和创造性思维,包括探究(inquiring)、生成(generating)、分析(analysing)和反思(reflecting)四个连续要素,其在科学素养测评框架中的体现见表2[25]。由表2可以看出,批判性思维和创造性思维相互交织,共同体现在四个要素中。虽然创造性思维主要体现在生成要素中,但在探究和反思中也有一定的体现,如创造性地提出问题和探索概念。从科学课程的视角来看,批判性和创造性思维的四个要素在结构上的连续性与科学探究的要素具有对应关系。批判性和创造性思维嵌入提问和预测、制订计划和实施探究、分析和评估证据以做出决策和得出结论等科学探究要素;创造性思维使个人新的想法得到发展,是科学理解发展的内在本质[26]。这就将批判性和创造性思维与科学探究过程中的思维活动、科学理解等联系起来,为科学素养测评中考查批判性和创造性思维提供可能。(二)批判性和创造性思维与认知维度的关系NAP-SL2023认为,批判性和创造性思维的各个方面都源于科学探究和科学思维中固有的重要认知技能,因此,批判性和创造性思维通过认知维度整合到NAP-SL2023项目,同时与科学探究和科学思维紧密联系。NAP-SL2023列出了三个认知维度的具体内容以及对应的批判性和创造性思维要素或子要素,表3仅列出推理、分析和评价认知维度对应的具体内容。可以看出,推理、分析和评价维度包括比较、对比和分类、表征等七个认知领域,每个认知领域对应批判性和创造性思维的一至三个要素。例如,表征对应批判性和创造性思维的探究和反思两个要素,并明确说明对应的子要素。由此,当科学素养测评考查认知维度相关内容时,实际上也就对应地考查了批判性和创造性思维。综合来看,澳大利亚课程对批判性和创造性思维的界定以及NAP-SL2023的认知维度建构使科学素养测评中考查批判性和创造性思维成为可能,为基于课程领域测评批判性和创造性思维评价提供了新路径,并可融入教师的课堂教学。(三)批判性思维和创造性思维作为整体进行测评的合理性NAP-SL2023将批判性思维和创造性思维作为整体并转化为认知维度融入中小学生科学素养测评项目,与澳大利亚国家课程的设计及其对通用能力的界定紧密相关。首先,两者的高相关性决定其可以作为整体进行测评。从哲学或心理学的角度看,批判性思维旨在分析问题,创造性思维旨在解决问题,两者既相互关联,又在问题解决过程中交替进行[27]。有研究提出,批判性思维是创造性思维的基础和前提[28]。实证研究发现,创造性思维和批判性思维在解决问题中具有互补作用,都是创新的关键要素[29-30],在非常规问题解决过程中,两种思维的相关系数更高[31],表明两者在问题解决过程中进行整体组合评价具有合理性。澳大利亚国家课程指出,虽然批判性思维和创造性思维不能互换,但它们密切相关,都是学生应对21世纪复杂环境、社会和经济压力必须具备的核心能力[25]。从通用能力在课程领域的体现来看,批判性思维和创造性思维被嵌入到科学探究的过程中,也体现了两种思维在问题解决过程中的相互关联。其次,澳大利亚国家课程设计及其对通用能力的界定需要将两者统合测评。将两种思维融入课程领域开展测评在国内外研究中虽有先例,但将两者作为认知维度融入学科素养测评还较为少见。美国哲学会于1990年发布的批判性思维德尔菲报告得到广泛认可,报告指出批判性思维可分为认知技能和人格倾向两个方面[32]。目前,学者们已就批判性思维认知技能的存在及其内涵达成共识,包括分析论据、主张或证据、归纳或演绎推理、判断或评价、作出决策或解决问题等[33]。该共识在澳大利亚通用能力批判性和创造性思维的要素中得以充分体现,且较好地对应了澳大利亚科学素养测评的认知维度,尤其是推理、分析和评价。针对创造性思维,有研究从过程视角出发,认为创造性思维涉及批判性思维的客观分析[34]、建立联系[35]、形成想法或假设、验证假设、交流结果、修改或重新验证假设[36]等多个思维过程,在澳大利亚通用能力批判性和创造性思维的生成要素中得以体现,较好地对应了澳大利亚科学素养测评的认知维度,尤其是综合与创造维度。综合来看,NAP-SL2023更多关注批判性思维认知技能和创造性思维过程,因而能很好地将两者进行整合并作为认知维度融入测评框架。三、NAP-SL2023批判性和创造性思维的测评试题设计澳大利亚NAP-SL2023已实现基于计算机的测评全覆盖,利用新技术手段使图片、动画、音频、视频以及其他网络媒体资源等都成为可能的背景素材,不仅扩大了材料选择范围,而且拓展了评价的内容范围和题型,拓宽了试题的任务复杂度,使以往难以考查的过程性能力和难以捕捉的思维变化得以呈现,极大地丰富了批判性和创造性思维的测评空间。(一)测评形式NAP-SL2023的测评形式包括基于计算机的客观测试、探究任务和问卷调查。六年级学生完成客观测试和探究任务限时60分钟,十年级学生限时75分钟,调查问卷没有严格的时间限制,计划用时约为20分钟[24]。客观测试主要以试题单元的形式呈现,即围绕一个情境素材设计1~5个小题,考查所有内容维度。为了拓宽情境素材、评估内容以及学生作答时所需的认知复杂度范围,NAP-SL2023继续加强信息技术在测评中的应用,主要包括:1)更多采用视频或动画来呈现背景素材及相关题目信息,减少学生的阅读负担;2)将多种信息来源或媒体数据视为评估科学与社会之间互动的情境素材;3)采用预测—观察—解释的模式,要求学生对某个事件做出预测,观察令他们惊讶的视频或动画,最后补充或改变他们的观点。信息技术增强的测评手段使学生在与现实世界相关的真实情境下解决问题,为客观考查学生的批判性和创造性思维提供了更多空间。探究任务也是基于计算机完成,侧重于无法在较短的任务或项目中有效或高效考查的科学探究要素。NAP-SL2023加强对控制变量以外的其他科学探究方法考查,如观察、分类、模式识别和建模等,极大地拓展了认知维度的考查范围,使批判性和创造性思维的评价更加全面和深化。学生问卷主要调查学生对科学本质的理解和科学态度相关信息,同时了解其校内外科学学习经历,涵盖作为人类活动的科学、学生的科学参与度、科学的教学与学习三个主要方面。NAP-SL2023特别新增了批判性和创造性思维相关内容,包括学校教学中对学生批判性和创造性思维的培养、解决问题时的自我效能感、校外活动对学生批判性和创造性思维的影响、学生对批判性和创造性思维价值的态度,以及学生参与批判性和创造性思维活动的情况。(二)测评题型为了充分考查学生的认知维度及批判性和创造性思维,NAP-SL2023主要采用建构类题型和中等约束题型,同时保留了一定的开放题。其中,建构类题型要求学生通过生成一个回答做出反应,如填空、填表、简答等;中等约束题型介于高度约束的选择类题和完全开放题之间,既能较大限度地考查学生的认知水平,又能实现计算机系统自动评分,如交互式匹配选择(选择单词填空)、交互式匹配拖放(选择文本或图像拖放)、下拉菜单选择等。(三)试题样例分析以NAP-SL2023的一道科学试题[24]为例,分析其如何在科学素养测评中实现对批判性和创造性思维的考查,该题同时面向六年级和十年级学生。试题单元:分解土壤中含有一种被称为“分解者”的生物,指以动植物等生物的遗体、残骸、粪便等为食的生物,它们能分解不同的物质。“分解者”包括:1)食用以上物质的昆虫和蠕虫等动物;2)真菌和细菌,他们会分泌化学物质在体外分解以上物质。图2的土壤中含有分解者。能被分解者分解的物质被称为可生物降解物质。一组同学想要研究以下每种材料(见图3)的可生物降解性,他们计划将大小相似的材料碎片同时埋在潮湿的土壤中。问题1:同学们决定通过记录每种材料的观察结果来收集数据,其中一名同学希望每小时记录一次观察结果。但在这个探究任务中,这个时间间隔不合理,请你说明原因。(1分)问题2:确定一个适当的时间间隔来记录每种材料的观察结果并说明理由。(2分)问题3:同学们在透明的塑料片上打印边长5毫米的网格。在12周后,探究即将结束前,网格塑料片被放置在每种材料上,同学们数出材料分解的方块数量。下列表格(表4)显示了探究结果。在探究之前,同学们预测食物会比其他材料更容易被生物降解。同学们的预测正确吗?请根据探究结果用证据支持你的观点。(2分)具体而言,问题1和问题2要求学生批判性地思考收集准确数据的方法、识别提议方法的不足之处,并提出更有效的替代方案。考查的内容维度为科学探究的计划与实施,对应的认知维度为推理、分析和评价。从批判性和创造性思维的视角来看,这两个问题分别考查探究和生成两个要素,问题1对应子要素为识别、处理和评估信息,问题2对应子要素思考替代方案。题型均为建构类试题,具有一定的认知复杂度。问题3要求学生批判性地分析给定的数据表格,判断探究结果是否支持预测。根据数据表格,食物确实比某些非食物物品(例如塑料和铝箔)更容易生物降解,但一些非食物材料(如纸板)也更易于生物降解。因此,如果学生只是简单地认为预测正确或不正确,表明他处理复杂数据的能力还有待提高,只能获得部分分数。问题3考查的内容维度为“科学探究的处理数据和构建模型及分析”,对应的认知维度为“推理、分析和评价”。从批判性和创造性思维的视角来看,问题3主要考查批判性思维,题型为建构类试题,具有较大的认知复杂度。四、启示当前,我国正在积极推进核心素养导向的基础教育课程改革,批判性思维和创造性思维以学科核心素养形式被融入学科课程内容。例如,《义务教育科学课程标准(2022年版)》将科学思维作为核心素养维度之一,包括模型构建、推理论证和创新思维三个方面[37],主要对应批判性和创造性思维的内容。借鉴澳大利亚NAP-SL2023项目基于科学素养测评考查学生批判性和创造性思维的经验做法,对于我国开展相关领域的评价工作具有以下三个方面启示。第一,立足学生核心素养发展目标,构建基于课程领域的显性化思维测评体系。当前,我国虽然强调发展学生的批判性思维和创造性思维,但从课程设计来看,并没有明确批判性思维和创造性思维的内涵、关系及其在学科课程的表现形式。以义务教育阶段的科学课程为例,虽然科学思维是批判性思维和创造性思维的集中体现,但学科视角下的教学与测评更加关注模型建构等子要素,忽视问题解决过程中的思维连贯性,从而导致无法从整体上把握批判性思维和创造性思维,也不利于复杂情境下的高阶思维能力教学与评价。立足学生核心素养发展目标,在国家课程中应明确界定批判性思维和创造性思维,并将其与学科课程标准的核心素养维度进行对应,使其在具体课程领域进一步显性化。此外,在科学教育等学科质量监测框架中基于问题解决过程构建连贯的思维测评框架,使其在学科素养测评中显性化,更好地引导学科教学关注批判性和创造性思维。第二,兼顾拔尖创新人才选拔和培养的需要,建立学生批判性和创造性思维的评价体系。拔尖创新人才培养是当前我国教育强国建设的一项重要任务,批判性和创造性思维是拔尖创新人才必须具备的关键素质,也是基础教育阶段人才早期识别与培养的重要指标。现阶段,我国还没有构建起系统的批判性和创造性思维教学与评价体系,不利于收集思维发展的相关证据以支持拔尖创新人才的早期识别与培养。在此基础上,一方面要基于具体的学科课程领域构建测评框架和情境化试题,以清晰地探究学生在特殊领域中两种思维的发展水平;另一方面,要采用国际公认或基于本土文化开发的一般性思维测评工具收集反映学生一般性思维的数据,整合测评数据系统刻画学生两种思维的发展全貌。第三,响应教育评价数字化转型发展要求,应用新技术手段创新试题情境及评价方式。随着人工智能技术的飞速发展,教育评价与人工智能深度融合已成为教育评价改革的主流趋势,人机交互的情境化试题将成为批判性和创造性思维测评的重要方式,基于计算机交互任务的创新思维能力测评研究[38]近年来相继出现。今后一段时期,批判性和创造性思维测评可基于人工智能等新技术手段,应用多种形式的背景素材,丰富试题情境,创新评价方式,积极开发基于本土文化背景的人机交互试题,从而实现对思维过程的深度考查。参考文献略

国家义务教育质量监测结果区域应用的现实困境与纾解进路

2025-03-26

★原载《教育测量与评价》(双月刊)2024年第6期作者简介王庆如/深圳市教育科学研究院副研究员,博士。张海洋/深圳市罗湖区教育质量监测中心正高级教师。【摘  要】国家义务教育质量监测是推动义务教育高质量发展的重要手段,也是建设教育强国的重要保障。随着国家义务教育质量监测的深入推进,如何有效落实监测结果的区域应用,如何推进监测赋能教育高质量发展,已经成为当下教育质量监测工作必须面对的重要课题。聚焦“谁来用”“用什么”“怎么用”等痛点问题,回归国家义务教育质量监测设计的基本逻辑,并在借鉴国际教育质量监测结果应用经验的基础上,从建立多元主体协同机制、促进监测的延伸与下移、构建“3456”应用模式等方面着力,推动国家义务教育质量监测结果区域应用体系的构建。【关键词】国家义务教育质量监测;监测结果区域应用体系;“3456”应用模式;“实证+”赋能;教育高质量发展国家义务教育质量监测紧密围绕落实立德树人根本任务,扭转唯分数、唯升学等不科学的教育评价导向,引导聚焦教育教学质量、遵循教育规律,以全面客观的监测数据支撑教育决策、服务改进教育教学管理,促进培养德智体美劳全面发展的社会主义建设者和接班人。[1]它是推动义务教育高质量发展的重要手段,也是建设教育强国的重要保障。自2015年全面启动以来,国家义务教育质量监测工作在全面诊断省级义务教育质量状况、服务国家教育决策等方面发挥了积极作用。但在区域层面如何用好监测结果指导教育教学改进、助力教育教学质量提升,依然是一个需要不断探索的课题。本文聚焦国家义务教育质量监测,深入探讨监测结果区域应用的困境及其破局之道。一、国家义务教育质量监测结果区域应用面临的困难和问题国家义务教育质量监测结果的区域应用,始终存在“谁来用”“用什么”“怎么用”等痛点。这些痛点深刻揭示了当前教育质量监测中存在的困难和问题。一是不够重视。目前,各地义务教育质量监测更多地停留在教育督导这条线上,从组织实施到结果应用都很难走出这个范围,这在很大程度上是因为教育质量监测工作尚未得到足够重视,相关教育部门、学校和教师对监测结果并未完全接纳,在监测结果应用过程中往往被动参与,甚至存在一定的应对或抵触情绪。二是不够了解。义务教育质量监测结果目前仅报告至区(县)层面,且监测工具对外严格保密,很多管理人员、教研人员以及教师既不清楚监测的具体目标和内容,也不了解监测指标和要求,无法对结果报告数据进行深入挖掘,也就难以发挥教育质量监测对日常教育教学行为的引领作用。三是缺乏有效落实。对于由谁来统筹落实教育质量监测的结果应用,虽然不同地方都有自己的做法,但仍存在工作目的不明确、职能分工不清晰、工作推进无抓手以及跟进落实不到位等问题,监测结果的应用难以有效落实。四是协同乏力。义务教育质量监测属于综合性监测,涉及学生发展、课程教学、教师发展、教育管理以及资源建设多个领域,需要相关业务部门和行政部门共同参与。但在实际开展过程中,往往是督导或监测部门在唱“独角戏”,呈现“一方搭台,大家看戏”的局面。五是赋能作用被忽视。虽然监测本身不能提升教育质量,但监测结果能为改进教育教学提供依据,从而助力教育教学的质量提升。但当前各地监测结果的应用很难落实到学校和课堂,始终存在“最后一公里”的问题,难以赋能教育质量的不断提升和可持续发展。二、国家义务教育质量监测结果区域应用的逻辑推演与归因分析国家义务教育质量监测的实施主体是政府督导部门,通过抽取能代表各省(区、市)教育质量状况的样本进行质量监测,形成国家、省(区、市)和参测区(县)的监测报告,并通过各种保密措施保障数据的客观性。然而受质量监测目的指向的清晰度、参与主体的适切性、抽测样本的代表性、报告解读的可行性和保密要求等因素的影响,各地在应用监测结果时难以完全了解监测指标、要求等,难以调动各部门积极参与,难以对监测结果原始数据做进一步分析挖掘。1 目的因素分析国家义务教育质量监测代表国家意志,以“推动落实立德树人根本任务,促进义务教育质量提升”为目的,其结果主要应用于服务国家教育决策咨询、督促省级教育问题整改、支撑县域教育督导评估、引领地区教育质量提升等4个方面[1],但对如何将监测结果落实应用到地(市)、区(县)和学校教育教学实践的改进,《国家义务教育质量监测方案(2021年修订版)》中却未有提及,需做进一步探索。2 主体因素分析国家义务教育质量监测由各级政府教育督导部门统筹组织,具体业务工作由各级教育质量监测中心负责落实。在监测结果应用上,主张各地建立省级统筹、区(县)为主的监测结果应用制度,并提出由教育督导部门牵头,加强与有关部门协同联动,积极探索适合本地区的监测结果应用模式。这里比较容易混淆的问题是,把监测组织实施与结果应用工作两者的主体等同起来。如此一来,监测就较难走出教育督导的工作圈了。我们必须清楚,监测组织实施的主体是各级督导部门,监测结果应用的主体是教育部门和学校等。[2]因此,监测结果应用必须多主体,即由各级教育督导部门牵头,有关部门和学校积极联动并主动赋能。3 样本因素分析国家义务教育质量监测以省域为单位,抽取样本在省级层面具有较好的代表性,但因样本区(县)的抽取不考虑覆盖每一个地(市),故不能较好反映地(市)、区(县)全面教育情况;加之样本学校因抽取学生数量少也不能精准反映学校具体教育情况。如,广东每年仅抽样18个区(县),考虑到抽取的区(县)要反映全省平均教育水平,故不会将样本数平均分配给各区(县)。因此,地(市)、区(县)和学校在应用国家义务教育质量监测结果时会受掣肘。4 报告因素分析国家义务教育质量监测根据目的、内容和阅读对象的不同,主要研制形成国家监测报告、省级监测报告、区(县)诊断报告、政策咨询报告等,以供各级政府、教育部门以及学校使用或参考。事实上,这些报告在使用的针对性上都有所欠缺,故国家特别倡导在进行结果应用时加强数据分析和挖掘,并组织好各级分层分类结果的反馈。但从目前情况来看,质量监测的原始数据、具体工具、专业人员等都还很缺乏,给各级反馈、解读监测结果带来了困难。5 保密因素分析开展国家义务教育质量监测需要营造一个客观真实的监测环境,需要从关注数据走向关注数据背后的事实和原因。因此,它非常重视保密,既不向外界公开监测工具,也不向各级教育部门提供原始数据。但我们都知道,监测具有引导、诊断和改进等功能。如果不知道监测工具和监测原始数据,就很难发挥监测对教育教学的引导作用,很难做好对监测结果的分析挖掘,很难有效落实监测结果的区域应用。这就导致质量监测工作与教育教学实践难以有效建立连接,更难以相互印证。三、国际视域下教育质量监测结果应用的启示与破题国家义务教育质量监测对深化课程改革、落实“双减”和“五项管理”、推动区域义务教育优质均衡发展等发挥了一定作用,但将监测结果应用到省、市、区(县)和学校的路径还不成熟,区域义务教育质量监测体系还没有形成,监测结果区域应用机制还不够健全。自20世纪60年代国际教育成就评价协会发起第一次国际数学和科学测评后,教育质量监测逐渐进入人们视野,监测结果也在国际和参测国家或地区得到广泛应用。[3]国际上的经验和做法对我国国家义务教育质量监测结果区域应用体系的整体建构具有启发意义。1强化统筹,推进部门协同联动目前,各国各地区都重视教育质量监测结果应用的政府统筹,注重调动各个部门主动参与和协同联动,全面、系统、整体推进监测结果应用工作。如,我国香港地区2001年参加国际阅读素养进展测试(PIRLS),在参与的35个国家和地区中成绩排名第十四,这个结果引起了香港社会和教育界对学生阅读的广泛关注。香港特区政府提出了“阅读特别任务计划”行动,并将其列入教育四大关键项目之一,要求教育统筹委员会、教育统筹局、语文教育及研究常务委员会等部门协同联动,还出台了一系列阅读政策、文件和方案,开展了一系列教师培训和研讨活动,为提升学生阅读素养提供了有力保障。此后,香港地区在PIRLS 2006测试中排名第二,在PIRLS 2011测试中名列榜首。香港的做法就是由政府统筹,教育行政部门、业务部门和学术机构协同联动,“一盘棋”推动监测结果应用工作,这是值得我们内地参考借鉴的好思路。2走向学校,推动监测结果应用落地许多国家强调监测结果走进学校和课堂,让教育质量监测回归教育发生的地方,并真正为教育教学发展提供数据支撑。如,芬兰有一套全面的教育质量监测体系,涵盖学生的学业成绩、学习态度、学校环境等,如果监测发现某些地区或学校的学生在特定学科上表现较弱,国家会增加对这些地区或学校的投入和支持;美国全国性和州级的教育质量监测并存,收集的数据包括学业成就、毕业率、不同种族和不同社会经济地位学生的成绩差距等,监测结果为学校改进计划和个性化教育提供了支持;日本在就全国学力调查发布的监测结果报告中,详细呈现了从国家到学校等各个层面的学生测试结果,对所有测试题目的属性和学生作答情况进行分析并提出了具体建议,对各个层级做好教育教学改进发挥了重要的指导作用。3助力发展,发挥实证赋能作用目前,各国都重视教育质量监测结果应用的赋能作用,将监测结果作为教育治理、行政决策和业务指导的参考。如,在PISA 2000测试中,德国的阅读、数学、科学3个学科的分数均低于OECD平均水平,这对德国教育系统乃至整个德国社会产生了极大的冲击和影响。德国政府立即行动,采取了一系列教育教学改革措施,包括开展学制改革、扩建全日制学校、研制教育标准以及推动课程改革等,不断推动德国教育教学质量提升,终于在PISA 2012测试中实现了阅读、数学、科学3个学科全部明显高于OECD平均水平的目标。德国的经验告诉我们,监测结果为国家教育教学改革提供依据,可以帮助政府部门围绕实证结果重建国家教育教学新体系,不断打破影响教育教学发展的滞后因素,建立适应新时代发展需要的体制机制。四、国家义务教育质量监测结果区域应用体系的整体建构要突破当前国家义务教育质量监测结果区域应用的局限,需坚持“国家、省、市、区、校”五位一体的理念,遵循各级监测结果应用相互贯通衔接的原则,推动义务教育质量监测结果区域应用的整体构建。因此,本研究根据国家义务教育质量监测结果应用的思维逻辑[4],围绕如何破解监测结果应用中“谁来用”“用什么”“怎么用”等问题,探索建立国家义务教育质量监测结果区域应用体系的基本模型。(见图1)图1 国家义务教育质量监测结果区域应用体系建构的思路与模型1 谁来用:建立多元主体协同机制国家义务教育质量监测内容的覆盖领域,决定了监测结果应用的关联主体。监测内容涉及学生发展质量、各学科领域的课程或教育活动开设、学生学业负担、教学条件保障、教师配备、教育教学、学校管理以及区域教育管理情况等,监测结果应用必然与教育各个部门、学校以及师生紧密相关。(见图2)                                                                                图2 国家义务教育质量监测结果                                                                                区域应用体系的多元主体构成(1)督导统筹。监测是由教育督导部门统筹组织实施的,监测结果应用当然也需由其统筹落实。而且督导部门在政府各部门、教育各部门、区校等之间起着链接的“纽带”作用,说明其本身就具有良好的工作统筹优势和条件。因此,教育督导部门尤其要从整体上部署监测结果应用工作,研制监测结果应用工作方案,组织开展监测结果应用研讨,跟踪检查监测结果应用成效,宣传推广监测结果应用成果,使监测结果应用工作成体系、聚焦点并有抓手。(2)监测支撑。监测结果数据贯穿于监测结果应用过程,也是牵引教育教学改进的线索。作为实施监测的主要部门,各地教育质量监测中心不应只是结果数据的生产者,还应是落实数据应用的支撑者。因此,他们必须围绕结果解读、问题梳理、专项调研、数据应用和效果监测等积极开展工作,切实发挥数据分析、数据挖掘、数据管理和数据赋能的作用,为推进监测结果有效应用提供数据支撑。(3)全体参与。对于监测结果的有效应用,各教育部门、学校不能做旁观者,而应该积极主动去了解、参与并担起责任,注意将监测结果与教育教学工作结合起来,并使其成为一种专业上的自觉行为。在面对监测结果数据时,要树立正确的数据观,建立科学的数据思维,提升数据分析的素养,做好对数据内涵的深入挖掘。在教育教学工作上,要打破经验主义的惯性,充分尊重客观事实,通过数据循诊把脉,有针对性地实施和行动,全面提升教育教学的质量和效益。2 用什么:促进监测的延伸与下移国家义务教育质量监测的设计定位是面向全国,了解省级义务教育质量情况,为国家教育政策的制定和调整提供支撑。因此,国家义务教育质量监测结果数据为国家教育决策提供参考是足够的,但要为各级教育教学改进提供依据却远远不够,必须探索义务教育质量监测的下移,即在国家义务教育质量监测基础上,探索将监测延伸至区(县)、学校和师生[5],切实为各级落实监测结果应用提供数据参考和依据。(见图3)                                                                              图3 国家义务教育质量监测结果区域应用体系的监测延伸思路(1)监测延伸到区(县)。国家义务教育质量监测可以监测到样本区(县),但样本区(县)只是部分代表且不是固定监测对象,因此无法对区(县)教育质量进行全面、稳定的跟踪监测。目前,各地都在积极探索将监测延伸到区(县)。如,广西通过委托服务的方式,借助国家义务教育质量监测,对全部区(县)进行全面监测;广东建立了全省义务教育质量监测方案,借助第三方专业机构的力量,对全省所有区(县)进行跟踪监测;江苏苏州、浙江温州等地由监测部门牵头,实现对全市所有区(县)的常态化监测;等等。各地经验显示,由省级教育部门统筹,参考国家义务教育质量监测的做法,结合各省(区、市)的实际情况,开展全部县域义务教育质量监测,可以为落实监测结果的县域应用提供有力支撑。(2)监测延伸到学校。监测延伸到区(县)为区(县)掌握教育质量情况提供了依据,但区(县)监测报告依然不能反映学校情况,尤其是不能反映每一所学校的情况,因此很难将监测结果应用落实到学校层面。可建立监测结果区域应用专项调研制度,全面摸排学校情况并查找问题产生的原因,切实将监测结果应用落实到各个学校。具体做法是:对区域报告进行分析挖掘,梳理监测结果中发现的问题和不足,建立区域共性问题清单,通过访谈、文献研究等方式吃透问题,在此基础上围绕问题研制出学生、教师以及管理人员调查问卷,开展面向义务教育阶段全部学校、全部4年级和8年级师生的问卷调查,最后形成区域和学校调研结果诊断报告,并分层分类开展报告反馈和解读工作。(3)监测延伸到师生。学校要基于调研结果诊断报告把脉全校总体情况,并针对学校存在问题开展全面深入调研,从教与学层面查摆问题产生的根源,从而对症下药解决具体问题,最终提升教育教学质量。特别是,学校要借监测结果应用之机,将解决诊断报告中发现的问题作为学校阶段性攻坚工程,形成攻坚策略,集合校内外资源和力量推进攻坚工作,不断改进问题,提升质量,形成成果乃至打造特色。3 怎么用:构建问题引领、任务驱动的结果应用模式国家义务教育质量监测结果区域应用是一项系统工程,需要将监测结果应用工作要素化、流程化和模式化[6],提高监测结果应用的有序性、系统性和有效性。要尊重监测结果区域应用的基本规律,立足“问题导向、任务驱动”,以“三个融合”为路径,以“四个联动”为机制,以“五个步骤”为流程,以“六个落实”为策略,构建问题引领、任务驱动的“3456”应用模式,切实解决监测结果应用“怎么用”的问题。(见图4)图4 国家义务教育质量监测结果                                                                               区域应用体系的“3456”应用模式(1)思路:坚持问题导向,谋划监测整改。监测结果的有效应用,源于对监测报告数据的深度挖掘,落实在对所发现问题的深入解读与探索上,最后转化为教育教学改进的行动。因此,收到监测报告后,有关部门或单位要对报告进行全面分析,透过监测报告数据揭示区域义务教育质量状况。按照“对比找优势、对焦找差距、对标找空间”3个维度,从“学生、教师、学校、家长”4个层面,全面梳理区域义务教育质量的成绩和不足。国家义务教育质量监测结果区域应用要坚持以“问题导向”为思路,将问题清单作为整改的线索,全面谋划监测结果应用实施方案,并责任到人。(2)路径:坚持有机融合,部署监测整改。要坚持“教学测评”一体化监测整改思想,建立监测结果应用与教育教学常规相互融合的工作思路[7],切实提高监测结果应用的针对性和有效性。可以建立“三个融合”监测结果应用工作路径。其基本内容包括:一是与区域教育融合,区域负责监测整改的全面统筹,将监测整改方案融入年度区域教育工作,实现区域监测整改常态化推进;二是与学校教育融合,学校是落实监测整改的主阵地,将监测整改方案融入年度学校教育工作,可以提高学校教育教学工作的针对性和有效性;三是与学科教育融合,学科教育是监测整改的落脚点,将监测整改方案融入年度学科教学工作,可充分发挥监测的诊断、改进和质量提升功能。(3)机制:坚持有效联动,统筹监测整改。监测结果应用涉及多个层面,需要实现部门之间的有效联动,为落实监测结果应用工作注入活力。可建立“四个联动”监测结果应用工作机制。其基本内容包括:一是建立内外联动机制,推动与区域外监测部门、学术研究组织、专业监测机构的研讨交流;二是建立部门联动机制,推动教育行政、教育督导、质量监测和教研训等科室的有效协同;三是建立上下联动机制,推动区域部署、学校管理和学科教研的有效协同;四是建立校内联动机制,推动学校管理、德育、教学及培训等工作的有效协同。比如,深圳市罗湖区就建立了“党建+四位一体”部门联动工作机制,形成了联席会议、协同工作、联合工作等工作方式,增强了部门协同联动的工作意识,发挥了各部门在监测结果应用上的主动性。(4)流程:坚持任务驱动,推进监测整改。可按照“督导统筹,监测支撑,部门协同,学校落地”的工作职能,落实基于“任务驱动”的项目制工作方式,建立“五个步骤”监测结果应用工作流程。第一步是解读报告,查摆问题。通过分析数据、查摆问题以及梳理问题清单,分层分类召开区(县)、学校及学科层面的报告解读会。第二步是深入调研,归因分析。要求开展学校样本调研活动,准确把握问题形成原因,形成区校两级调研结果诊断报告。第三步是制定方案,落实整改。在深入调研的基础上,研究制定区域、学科和学校问题整改方案,跟进了解学校整改落实情况。第四步是交流研讨,跟踪督导。围绕整改问题,积极开展课题研究、专题研讨和经验交流等活动,把监测结果应用纳入经常性督导内容。第五步是总结提炼,推动发展。重视整改经验积累,总结提炼整改成果,跟踪检查问题整改成效,引导学校逐步形成办学特色。        (5)策略:坚持实证支撑,落实监测整改。要创新“实证+”监测结果应用工作方法[8],不断推动教育教学从基于经验转向基于实证,切实让教育质量监测结果应用回归教育教学实践。可建立“六个落实”监测结果应用工作策略。一是“实证+施策:发挥督导部门统筹协调作用”,督导部门做好监测整改工作的全面规划、部署、组织、协调和落实,为推动整改工作提供政策、制度和财力支持;二是“实证+监控:发挥监测部门数据支撑作用”,监测部门负责开展监测结果应用专项调研,为推进落实监测结果应用提供数据支撑,对教育教学整改效果进行跟踪和检查;三是“实证+治理:发挥行政部门协同共建作用”,教育、督导、体艺卫、财务、人事等行政部门积极推动,建立与监测、研训、学校等业务部门的联动机制,使监测结果应用工作成为一个系统工程;四是“实证+研训:发挥研训部门专业引领作用”,研训部门做好监测整改项目的设计、研究、实践和总结,将监测整改与学科研训有机融合在一起,从专业上指导教育教学改进,推动教育教学质量提升;五是“实证+办学:发挥全区学校积极效能作用”,全区学校要积极配合监测整改项目工作,聚焦在监测中发现的具体问题,推动落实教育教学问题的整改;六是“实证+育人:发挥全体师生主动担当作用”,引导广大师生积极参与整改工作,并将整改转化为师生的行为自觉,推动师生不断发展、进步和自我超越。五、国家义务教育质量监测结果应用的价值取向与实践反思1 教育质量监测重在落实结果应用近年来,随着教育质量监测越来越受重视,各种质量监测活动也纷纷开展起来。殊不知,只想通过大量监测来评估教育教学质量,而不重视落实监测结果的应用,这是非常不科学也不切实际的短视行为。当前各地在结果应用上的办法还不多,结果应用工作还不能有序组织起来,结果数据和报告被尘封的现象依然存在。不重视结果应用的监测,就会让监测效益大打折扣。在质量监测的制度设计上,建议把监测组织实施和结果应用放在一起全盘考虑,做到在监测组织实施和结果应用上共同发力。2 监测结果应用可转化为生产力质量监测本身不能直接提质增效,而且大量的监测可能会影响教育教学秩序,增加教育教学工作压力,弄不好会给教育教学带来负面影响,甚至破坏整个教育生态。但科学的监测结果可以为教育教学改进提供依据,从而提高教育教学的针对性和有效性。也就是说,监测结果的有效应用可以转化为教育发展的生产力。因此,在质量监测结果应用上,要重视做好“国家、省、市、区(县)、校”各级统筹衔接,建立上下融通的义务教育质量监测结果应用体系,切实将结果应用落实到学校、课堂等教学一线,同时避免重复、多头监测评价情况的发生,不断提高结果应用的效率、质量和影响。3 监测结果应用指向高质量发展在监测结果应用中,一定要看到教育质量的发展和进步。或者说,追求教育质量的发展和进步,是推进落实监测结果应用的努力方向。如果只考虑质量监测工作本身,而不去关心教育质量发展,就难以真正做好质量监测。仅有“监测人”在探讨结果应用,仅有“监测人”在呼吁用好结果数据,无疑不应该成为教育质量监测的现实走向。在推进监测结果应用过程中,需要全体教育人共同树立质量发展意识,推动“监测人”与“被监测人”双向奔赴,通过共商、共研和共建的结果应用机制,打造教育与测评一体化的生态体系,切实发挥质量监测的助力和赋能作用。教育质量监测要遵循从教育中来又回到教育中去的原则,倾向于在教育内部构建教育质量监测结果区域应用体系,这样做无疑有利于发挥教育部门在监测结果应用上的主动性。同时,监测结果应用需要政府部门多方支持,由各级教育行政部门对接政府其他部门推动落实,或者由教育督导部门联系各地政府教育督导委员会予以解决。参考文献:

宋时春、郝志军:课程综合化的内涵演进、育人追求与操作路径

2024-09-30

在发展素质教育、落实立德树人根本任务的进程中,新时代的学校教育需要聚焦人才培养的重大需求,充分发挥课程的育人价值,全面实现课程的整体育人功能。为此,新一轮义务教育课程修订紧跟时代发展步伐,推动育人方式变革,把课程综合化作为本次课程修订的突出亮点和重要追求,致力于培养学生的核心素养。作为当前课程研究领域的基本课题之一的课程综合化是课程理念不断演进的结果,在课程育人领域有着特定的育人追求。深入探讨课程综合化的理论旨趣及其现实路径,对于深入落实本次新课程改革具有重要的指导和实践意义。一、课程综合化的内涵演进从历史发展的视角来看,人们对课程综合化的探索经历了不同的发展阶段,在每个阶段课程综合化的表现也有所不同,折射出人们对课程育人功能的认识的不断加深。如果说古代社会的课程(如“六艺”“七艺”)是一种原始形态的综合,那么19世纪初赫尔巴特(Friedrich Herbart)则首次明确提出课程综合化的设想并予以系统论证;而20世纪初杜威(John Dewey)基于实用主义哲学系统阐述了经验主义课程的思想并予以实践,把课程综合化推向新的高度,也为当今“核心课程观”“融合课程观”奠定了基础。(一)古代社会对课程综合化的初步探索在我国古代社会,尽管很早就有了正规的学校教育,但并没有形成现代意义上的学科课程形式,古人将教育内容进行大致的划分,以迎合当时人才培养的需要,由此形成了宽泛意义上的课程。我国传统思想注重整体性思维,古代的教育思想也体现出浓厚的整体主义的色彩。例如,“子以四教,文、行、忠、信”(《论语·述而》),这里的“文”,就是综合了诗、书、礼、乐的内容,所谓“兴于诗,立于礼,成于乐”。(《论语·泰伯》)孔子在教育学生时推崇的“文、行、忠、信”,是从整体上融合了有助于思想言行和道德人格发展的相关内容,以实现培养“谦谦君子”这一目标。显然,这是一种整体主义的视野,是从人的整体发展的角度作出的教育安排。从这一传统来看,我国古代的课程从一开始就强调综合,并没有进行精细的学科划分。古希腊对课程问题的探讨也由来已久。公元前5世纪至公元前4世纪活跃在古希腊的“智者学派”是西方最早的一批职业教师,他们知识渊博、能言善辩,以教授年轻人为业。为了教授论辩术,他们提出了“三艺”(即文法、修辞、逻辑);后来柏拉图在此基础上又增加了“四艺”(即算术、几何、天文、音乐),由此形成了古代西方“七艺”课程的传统。但需要注意的是,这些课程门类背后缺少清晰的学科逻辑,因此这些分化了的课程并不代表现代意义上的分科课程。无论东方还是西方,在科学文化知识相对不发达、学科尚未精细划分的古代社会,以综合化的课程形态实施教育是必然的选择。(二)赫尔巴特的课程统合论19世纪德国教育家赫尔巴特第一次明确提出课程综合化问题并对之进行了系统的理论论证,其理论依据是“统觉论”。所谓“统觉”(the law of appreciation),是指个体在原有观念基础上,把一些分散的感觉刺激纳入意识之中,吸收、融合、同化新观念并构成观念体系的过程。赫尔巴特指出:“按照某些规律在意识中出现的较弱的观念,对于观念团起着刺激的作用,并且被观念团吸收和占有(统觉),好像是在新感官印象中发生的那样。”新旧观念通过“统觉”的作用,进行重新联合,形成更广泛、更完善的观念,最后才保持在人的心灵中。赫尔巴特根据统觉论和观念说,从教学方法的角度把教学活动分为单纯提示的教学、分析教学和综合教学。他认为只有综合教学能够承担教育所要求的建立整个思想体系的任务。综合教学能够将个别的观念联合为一般的概念,然后通过更高级的综合,让一般观念与课程总体内容建立关联,使每一个观念团联系得更为紧密和有系统,最后通过实际联系,充实、完善和巩固既有的观念体系。后来,赫尔巴特的学生齐勒(Tuiskon Ziller)继承并发展了赫尔巴特提出的关于课程综合化的观点,他认为可以借助多学科的内容而实现道德和宗教意志的陶冶这一主要教育目的;另一位赫尔巴特思想的追随者赖因(Wilhelm Rein)接受了齐勒的“中心统合论”,将培养学生情操的学科作为课程统合的中心,围绕这一中心将技能类学科、语言类学科和自然科学类学科组织起来。这个学派从赫尔巴特那里继承了“兴趣”“统觉”等概念,在当时的社会情境中强调儿童经验与文化知识的统整,引领了当时的教育改革,形成了独具特色的“赫尔巴特运动”。(三)杜威关于综合课程的主张20世纪初,为了实现学校生活与自然生活、社会生活的融合,进步主义教育运动的代表人物杜威提出了以烹饪、缝纫和木工为主要内容的“主动作业”。杜威之所以选择“主动作业”作为活动课程的主要形态,是因为它不仅符合经验的本质,能够促进儿童的生长,而且符合民主社会对学校教育的需要,也是实现儿童与社会、学校教育与社会生活、直接经验与间接经验、心理与逻辑、课程与教学相统一的方法和途径。主动作业的特征和作用表现为三个方面:主动作业符合经验生长的心理学需要;主动作业具有积极的社会价值;主动作业是把儿童引入正式课程的媒介。“主动作业”使儿童重演了人类历史的发展,为真正理解人类历史发展提供了起点。在主动作业中,当儿童运用工具和材料解决问题的时候,他们真正懂得了自然原材料的机械原理,并获得科学的洞察力和品格的训练。绘画和音乐等艺术也通过主动作业而变得具有生命力,并使作业更有深度和丰富性。杜威的很多教育思想尤其他关于“主动作业”的思想为今后课程综合化的理论与实践发展奠定了重要基础。(四)当代课程综合化的进展概况20世纪中后期以来,世界有影响的综合课程理论主要有社会改造主义的“核心课程观”和人本主义的“融合课程观”。改造主义者倡导以有争议的或者人们困惑的社会现实问题为核心对学校课程进行综合,试图在解决问题的过程中使各门学科中与问题相关的知识得到整合。它倡导实现学校课程综合化,提出在中等学校开发和设置广域课程,主要涵盖三个领域:人文科学领域,主要包括艺术和文学;人的研究领域,主要包括社会学、政治学和伦理学;自然科学领域,主要包括物理、化学、生物学等。改造主义认为,学校的课程和教学方法要根据社会的长远目标进行改造,并主张建构以社会问题为核心的学校核心课程体系。人本主义教育思潮盛行于20世纪六七十年代的美国。人本主义者追求一体化的课程,反对片面追求知识传授、课程内容条块分割、组织方式单一的课程。因为只有一体化的课程才能培养出整体的人,才能使学生的知识学习与情感体验相统一,才能使学生的思维活动与情感活动和实践活动相统一。人本主义关于课程提出了一系列主张,如课程的出发点和归宿是学生的价值、尊严和个性;主张整体论和有机论,即自然、社会、个体是有机统一的完整的连续体,部分内在于整体,整体又内在于部分,部分与部分之间及部分与整体之间是动态生成的关系,等等。二、课程综合化的育人追求课程是学校育人的载体,丰富课程形式、灵活调整课程的设计和实施方式等其实都是为了更好地发挥课程的育人功能。总体而言,课程综合化在三个方面努力实现育人价值:基于整体主义视野,注重“整体育人”;基于人本主义视野,强调“综合育人”;基于建构主义视野,主张“个性化育人”。这三种追求从不同的角度揭示了课程综合化的育人功能,由此体现出其内在的教育价值。(一)基于整体主义视野,课程综合化注重“整体育人”整体主义理论是人们处理个人与群体、个人与社会关系的观点,指出世界不是随意分割的,而是一个有机的整体。古希腊的苏格拉底和柏拉图认为教育是在重塑人的心灵,追求的是生命内心的和谐和心灵的美善,从而开启了整体主义思想的先河。到了近代,卢梭(Jean - Jacques Rousseau)认为教育的最终目的是培养“自然人”,教育应该遵循自然规律,必须以理解和尊重内在的自然为起点,具有整体主义的特点。19世纪末、20世纪初的进步主义教育运动认为在任何时候都不能忽视儿童生活的整体性,同时要把儿童看作一个整体的有机体来对外界作出正确反应,这无疑为现代整体主义思想的发展作出了很大贡献。儿童生活的整体性与儿童经验的整体性要求教育要成为儿童在生活中不断成长的过程,这一要求包含着杜威教育哲学几个相互联系的基本原理。一是“教育即生长”的原理,杜威认为生长或者发展的生长,不仅指身体的生长,而且还是智力和道德的生长,可见生长意指儿童的整体发展。教育即生长,表明儿童的整体发展本身就是教育的目的。二是“教育即生活”的原理,它与“教育即生长”这一原理紧密相连,生活就是发展,不断发展,不断生长就是生活。儿童的生活与成人的生活是连续的,而不是割裂的。可以说,杜威教育哲学为整体思维提供了非常重要的基础。整体主义“强调事物内部要素及其与外部环境之间的关联,借助其他事物才能界定自身”。根据课程综合化的主张而开展的课程设计、课程实施与评价都体现了整体主义的观点,并最终服务于培养德智体美劳全面发展的人。(二)基于人本主义视野,课程综合化强调“综合育人”人本主义强调人的自我实现和自我价值,是一种追求人的自我表达、发展的文化观和社会思潮。人本主义心理学认为人的内在动机、本能需求、价值观和自我意识等才是应该研究的对象,反对行为主义只研究零碎的、片面的人类行为,而不研究整个人。其主要代表人物之一罗杰斯(Carl R. Rogers)认为教育的目的是培养完整的人,帮助学生达到自我实现。人的学习潜能是与生俱来的,多数意义学习是从做中学的,学习中同时运用理智和情感是最持久和深刻的。人本主义体现出自由性、以学习者为中心、自我发展性等特点。自由性是指学生在学习中有自由选择的权利,在自由选择中培养其责任感并养成健康人格。以学习者为中心是指相信学习者具有自我发展的潜能,必须尊重和重视学习者的需要、情感、意愿和价值,应该建立和谐融洽的师生关系。自我发展性是指儿童的自我最初不易察觉,只能在良好的环境和引导下才能发现,从而走向独立和创造。在课程综合化的实践中,人本主义的这些观点已成为课程设计的基本原则,突出以学生发展为中心、促进学生自我价值的实现是其基本追求。(三)基于建构主义视野,课程综合化主张“个性化育人”建构主义认为,“学习的本质是一个积极自主的建构过程。在学习过程中,人脑不是被动地学习和接受输入的信息,而是主动地对输入的信息进行选择、加工和处理,通过新知识与原有的旧知识和经验相互作用、改造、充实,来建构新的理解。”它强调学习者主动发现问题、分析和整理问题,并将新知识与原有知识和经验建立联结,进行意义建构。“知识是由认知主体积极建构的,建构是通过新旧经验的互动而实现的;认知的功能是适应,它应有助于主体对经验世界的组织”。建构主义理论揭示了人的学习的主动性和经验性,指出知识的学习不是被动地接受,而是要积极地建构。儿童的学习是一种建构性的学习,经验在其中扮演了重要的意义。教师应当把学习者原有的知识经验作为新知识的生长点,引导帮助学生在原有经验的基础上对知识进行自我意义建构从而生长出新的知识经验。建构主义必然要求学校提供适合于学生经验发展的教育,这为学校课程综合化实施提供了一定的理论支撑。“建构主义学习与探究为课程整合提供了哲学基础。”课程综合化强调教师与学生参与课程的主体性、经验性和意义性,强调要充分尊重学生已有的知识和文化基础,关注学生的个性化学习经历,这背后有着建构主义思想的考量。三、课程综合化的操作路径从理论上看,课程综合化倡导知识融合和经验整合,弱化甚至打破了学科之间的隔阂,为学生综合运用各学科的知识解决具体问题提供了机会,其育人价值毋庸置疑。但在实践中,课程综合化的实践操作相对复杂,明确其操作路径显得尤为必要。在课程设计层面,课程综合化的实践有三种基本的取向,即基于知识的关联与统合实现课程综合化、基于经验的分化与重组实现课程综合化、基于社会生活的整合与意义建构实现课程综合化。(一)课程综合化的设计思路1.基于知识的关联与统合实现课程综合化作为理性的动物,人类一直在研究知识并不断拥有更多的知识。而学校教育是培养人才的机构,在设置课程时必然涉及理解知识、选择知识并组织和传播知识等问题。当然,发展到今天人类所接触和拥有的知识已经浩如烟海,因此,在不同时期人类都在努力对知识进行梳理、分类和归纳,由此形成了不同类型的知识领域。例如,英国教育学家赫斯特(Paul Hirst)认为,基于人类所拥有的内在理性,可以将知识区分为七类:逻辑—数学、自然科学、文学、伦理学、美学、宗教和哲学。在他看来,知识是理解人类经验的复杂方式,不同类型的知识之间是存在关联的。“由于不同的知识形式之间的复杂关系,知识形式并非只有差异,它们也有许多共同之处;并且,一种知识形式常常会使用其他知识形式的成果”,因此他认为博雅教育才应该是教育的核心。尽管赫斯特对知识进行了分类,似乎是强化了知识的学科划分,但这种分类其实又是建立在不同学科知识的内在联系基础之上的,因为知识之间普遍存在关联性。类似的理解构成了当下知识观的主流,也正因如此不少西方学者在思考课程问题时强调知识的关联,正如有学者指出的:“课程整合指的是将课程计划中所有类型的知识和经验进行关联……‘整合’强调来自知识领域的话题和主题的横向联系。”基于知识之间的相互关联性,可以打通学科界限,将相关学科的知识予以整合和重组,从而实现课程的综合化。2.基于经验的分化与重组实现课程综合化在课程研究领域,“经验”是一个特定的术语,这个术语能够广为人知并在课程综合化领域拥有强大的解释力,无疑应该归功于杜威。杜威从实用主义哲学的角度出发,认为人的学习活动不是被动地接受外部信息,而是要通过操纵环境去检验假设,从而更好地适应环境并作出恰当的行为,因此个体与环境的相互作用至关重要,他用“经验”一词来描述这种相互作用。在他看来,“经验”包括两个方面:一个是主动的方面,就是要去尝试、去实验;另一个是被动的方面,就是要承受结果,就是要理解行为带来的后果。杜威旗帜鲜明地提出:“教育就是经验的改造或改组,既能增加经验的意义,又能提高指导后来经验进程的能力。”杜威所说的“经验”除了学生的生活经验之外也包含了人类的种族经验,也就是各种文化要素,具体表现为各种学科知识。学科知识强调经验的分化,分科学习就是为了掌握这些分化了的经验和知识,但它和学生的经验之间是存在矛盾的。因为分科学习是基于知识的分类和管理而进行的,而学生的经验则是具有整体性和无序性。显然,要解决学生的本性和知识之间的矛盾,就必须让学校课程与儿童当下的经验相关联,对相关经验进行重组。课程综合化的任务就在于协调经验的分化与重组问题,既反映种族经验的内在系统性,又能满足学生经验的个体性和整体性发展。那么,基于学生经验的整合从而开发出相应的课程就成为课程综合化的另一重要做法,譬如中小学校开设的综合实践活动课程以及一些课外活动、社团活动等。3.基于社会生活的整合与意义建构实现课程综合化学校教育是社会生活的特定领域,社会生活为学校教育的开展提供了基本的教育情境,因此社会生活是课程设计必须考虑的基本要素。泰勒(Ralph W.Tyler)在他著名的“泰勒原理”中就提出,当代社会生活是课程目标的三个基本来源之一,“利用从当代社会生活的研究中获得的资料,作为提出各种可行的教育目标的一个来源,是值得去做的”。但是,社会生活纷繁复杂,它具有明显的多元性特征,因此又对课程设计提出了很大的挑战。为解决这一问题,泰勒还把当代社会生活划分为七个基本的领域:健康、家庭、娱乐、职业、宗教、消费、公民。从社会生活的这种多元性来看,学校课程必然需要在一定程度上进行整合才能符合社会生活的本来面貌,才能与这种多元性相一致,这是课程综合化的又一个基本逻辑。此外,人们参与各种社会活动的最终追求无疑就是存在体验和意义建构,那么学校课程就需要为完满人格的发展和意义建构做准备。显然,分科课程根据学科逻辑对知识和经验的整体进行了分割,不利于整体性的意义建构,因此必然需要综合课程的关照,由此课程综合化就具有了现实的合理性。例如,美国课程学者比恩(James A.Beane)提出了课程的“社会统整”,主张“课程应环绕着个人和社会的议题加以组织,并由师生协同合作计划和实施,而投入于知识的统整”。20世纪80年代以来,欧美国家流行的一门理科课程—STS(Science、Technology & Society),即科学、技术和社会,就是将“社会”这一维度纳入科学课程开发的范畴,结合一些重大的社会问题(如环境污染、生态失衡、温室效应等)阐述科学技术的原理和知识,在科学教育领域产生了很大影响。(二)新一轮义务教育课程修订中课程综合化的实践—以跨学科主题学习为例跨学科主题学习指的是从发展学生综合素养的角度出发,设计相关的主题鲜明的学习任务,使该任务有机整合两个或两个以上学科的知识与技能,由此形成的学习方式和课程形式。在《义务教育课程方案(2022年版)》中,有多处提到“跨学科主题学习”,例如,“设立跨学科主题学习活动,加强学科间相互关联,带动课程综合化实施,强化实践性要求。”“原则上,各门课程用不少于10%的课时设计跨学科主题学习。”跨学科主题学习成为实现课程综合化的重要途径。跨学科主题学习的设计是为了改变单一的学科教学,但并不是取消学科,而是突出以某一学科为主整合其他相关学科知识。学科知识、原理和方法是跨学科教学的起点,跨学科主题学习不仅不忽视学科思维,反而尤其强调基于学科思维和深化科学思维。只有根植于学科思维,才能真正形成跨学科理解;脱离学科的跨学科,结果只能带来浅表式学习,使学生的学习简单化和常识化。因此,“要处理好学科课程与跨学科课程的关系,要将实施好学科课程作为优化课程结构的基本前提,跨学科主题课程要基于主题统领学科课程,超越学科课程,但又不能取代学科课程。”跨学科主题学习是一种实践学习,而不是对不同学科书本知识的学习,是采用参观、体验、动手操作等方式展开对现实问题的探究性学习。跨学科主题学习又是一种综合学习,它打破学科界限,超越书本知识,强调与学生真实生活相联系、与社会实践相联系,强调学生在真实生活中提出问题、分析并解决问题,体现出学习的综合性。跨学科主题学习还是一种提高学习者认知能力的深度学习,它强调运用不同学科的知识、观念、方法去分析和解决问题,从而形成新的观念、新的理解,符合深度学习的特征。开展跨学科主题学习有助于破解分科主义教学的弊端。分科对于提高教学效率、帮助学生建立学科认知结构有着重要作用,但单纯的学科知识无法应对复杂多变的真实情景,甚至分科主义也带来一些弊端,比如导致学生的学习被动机械、浅层次学习、学习效果差等。在现有教学中,部分学科也在尝试强化教学与实际的联系,但这种联系往往属于蜻蜓点水。跨学科主题学习突出了跨学科、多学科的优势,是解决上述困境的一个有效手段。跨学科主题学习符合人的整体发展和全面发展的需要。一个完整的人的生活是不分科的,只有跨学科主题学习才有利于我们培养完整的人。此外,促进学生的全面发展是我国既定的教育方针,除了德智体美劳等各个领域均衡发展之外,全面发展的人也必然是能够整合不同学科知识、拥有综合素养的,显然跨学科主题学习有助于实现这一培养目标。跨学科主题学习是应对日益复杂的社会问题的需要。当今社会复杂多变,人的生存与发展面临越来越多的挑战,而要迎接这些未知的挑战,解决现实中复杂的问题,单靠单一的学科已无法实现,必须进行跨学科的学习,综合运用多种学科知识方法去解决问题。与此同时,能解决复杂问题的具有创新性思维和批判性思维的人才能适应这个日益复杂的社会,而跨学科主题学习有利于培养学生面对复杂环境解决复杂问题的能力。总之,课程综合化问题是世界范围内课程研究的重要领域,挖掘其内在的育人价值并拓展其内涵是当今时代的新课题。尤其是在我国大力倡导“五育融合”的观念背景下,课程综合化带来的育人效果日益得到认可。作为教育工作者,既要深刻理解课程综合化是什么,更要知道应该怎样做,才能更好地落实立德树人根本任务,实现综合育人。 来源|《中国教育学刊》2024年第7期作者|宋时春,中国教育科学研究院课程与教学研究所副研究员;郝志军,中国教育科学研究院课程与教学研究所所长、研究员。 (免责声明:本文转载于《中国教育科学研究院官网》,版权归属于原作者,文中观点与本栏目无关,如涉侵权,联系立删!)

王学男、李永智:人工智能与教育变革

2024-09-30

一、引言自2022年11月30日ChatGPT正式发布以来,生成式人工智能在短短不到两年的时间内,实现了从开放式文字对话交互到文生图、文生视频,再到多模态交互的人机互动技术的飞速突破,其发展速度远超人类对其的思考与应对速度。这种强烈的不确定性和未知性,促使人类愈发重视人工智能的迭代及其引发的社会变革。教育,这个历来被视为慢变量且最为稳定的领域,如今却被广泛认为是最直接、最快速受到人工智能影响乃至冲击的领域之一。因此,秉持理性开放、客观严谨的态度,结合唯物史观视角,审视和分析人工智能与教育变革的真实发展水平,以及二者之间的内在关联和作用机制,将为人工智能赋能教育高质量发展提供基础性的观点和视角。二、理性看待当前生成式人工智能发展的水平以ChatGPT为代表的生成式人工智能凭借其强大的自然语言处理能力,通过开放式对话的方式完成信息检索、问题解答、内容创作、代码生成等复杂任务,其能力越发接近人类智能,甚至是对人类智能的扩展和部分替代。目前的“智能涌现”得益于数据的丰富、算力的提升、开源环境的活跃和多模态大模型的优化等的共同推动。但究其本质,它并不是一个新技术,仍然是人工智能发展过程中的阶段性产物,尚未在技术层面上发生突破性的质变。人工智能发展的历史虽然不长,但如果要客观评估当前人工智能发展的真实水平和未来趋势,需要将当前技术爆发的奇点置于人工智能发展历史和科技革命的脉络中去思考,才能勘破人工智能对教育的影响与挑战。(一)人工智能发展的三个阶段1950年,著名的图灵测试标志着人工智能的伊始。1956年,达特茅斯会议正式提出了“人工智能”这个概念,标志着人工智能学科的诞生。历经近70年的发展历程,人工智能学科内部的研究领域经历了多次分化与融合。在历经了因应用不充分、算力受限以及资助匮乏所导致的两次著名的“人工智能寒冬”之后,如今,该学科再次迎来了突飞猛进的发展阶段。按照智能程度来划分,可将人工智能分为计算智能、感知智能和认知智能三大阶段。第一个阶段是计算智能(Computational Intelligence)阶段(1950年—2000年),即机器对信息进行存储和计算。第二个阶段是感知智能(Perceptual Intelligence)阶段(2000年—2021年),即机器通过传感器捕获到物理世界的信号,理解一些直观的物理世界,高效地完成“看”和“听”的相关工作。第三阶段是认知智能(Cognitive Intelligence)阶段(2022年至今),即机器具备了像人类一样的思考和学习能力,并且能够自主做出决策并采取行动。这一阶段主要是以ChatGPT的发布为标志。但科学界普遍认为,人工智能尚未到达到这一阶段,目前仍处于探索初期。(二)人工智能发展的三个趋势在人工智能发展的历程中,主要存在两条路径:一条是通过符号推理,以模型学习驱动的数据智能,称为“符号主义”(Symbolicism),主张人工智能应该模仿人类的逻辑方式获取知识。另一条是通过神经网络,以认知仿生驱动的类脑智能,称为“连接主义”(Connectionism),奉行基于大数据和训练学习知识,主张模仿人类的神经元,用神经网络的连接机制实现人工智能。在人工智能发展的历程中,符号主义与连接主义两大流派经历了兴衰交替的过程,每次的兴盛都是不同的技术路线和发展模式发挥了重要的推动作用,不仅塑造了人工智能的理论基础和技术实现方式,也反映着科学家们在理解和模拟人类智能方面的不懈努力。随着人们对人工智能认知的成熟度越来越高,“连接主义”的发展路径进步速度将会越来越平缓,而“符号主义”将会再次兴盛。即便是连接主义的代表人物杨立昆、李飞飞、Geoffrey Hinton等人也都表达过当前的技术路线无法制造有感知能力的AI的观点。基于此,本文初步判断人工智能未来发展有以下三大趋势:一是从认知大模型向多模态大模型演进。传统的AI模型专注于处理来自单一模态的信息,主要侧重于理解和生成自然语言。而多模态大模型可以处理文本、图像、音频、视频和代码等多种数据类型,以促进内容合成任务的完成并整合多种信息源。人类智能和学习进化是天然多模态的,人拥有眼、耳、口、鼻、舌、肢体,人工智能的学习也可以更加还原人类学习多感官触发的真实情境。二是从通用大模型向“大小联动”深化应用。AI模型的算力增长、算法效率优化呈现新“摩尔定律”,模型性能随着模型规模、数据规模和算力规模等因素的增大而提升,呈现出幂律分布的特征,已成为大模型走向行业深度应用、创造价值的实际阻碍。小模型可以通过知识蒸馏从大模型中学习。同时,小模型又可以反哺大模型,提升大模型的训练精度。因此,大小模型协同联动,才是降低训练成本和应用成本,提升灵活性、适用性和效率的有效方法。三是从语言智能到具身智能(Embodied AI)实体转向。在现有的大模型应用中,多是在原有流程中嵌入AI工具,使其效率提高,并没有在底层逻辑和原生层面上产生具有创新价值的应用。脱虚向实的转向,为开发和应用拥有自主性和自适应性的人工智能体(AI Agent)提供了机会。要想创建一个能够在真实世界中工作的人工智能体,仅在文字环境中训练是不够的,必须具备对真实世界物理属性的感知能力。以GPT-4o为代表的生成式人工智能技术,不仅可以实现数字空间和物理空间的人机交互,而且还能提供情绪价值,这也表明情感计算是人工智能未来研究的重点方向之一。(三)人工智能发展的现实水平:通用人工智能与人类智慧仍有质的差别当前,人们对人工智能可以提供情绪价值、认知机制、协同价值的交互水平的惊叹,主要源于人们对它初始的预期较低,仍停留在固定、机械的机器人对话或Alpha Go人机围棋大战阶段。事实上,现阶段人工智能的真实发展水平距离通用人工智能还很远,仍与人类有很大差距,有质的差别,特别是在高阶认知和社会情感方面。朱松纯院长在2024年全国两会“委员通道”接受采访时指出,“通用人工智能的‘通用’,在学术上有特定的含义。一般来说,在日常的物理和社会场景中,人工智能要满足三个基本条件:第一,它必须能够完成无限的任务,而不是像过去那样只能完成人定义的有限几个任务;第二,要在场景中主动地、自主地发现任务,做到‘眼里有活’;第三,它要有自主的价值来驱动,而不是被动地被数据所驱动”。当前,尽管ChatGPT、Claude-3、文心一言、讯飞星火等生成式人工智能应用在国内外被公认为较为成功,但它们仍未完全达到通用人工智能的标准,也不具备与人类等值的能力。它在数据处理、记忆、基于组合的创造力、速度和精确度等基础认知方面远超人类,但缺乏人类的情感理性、价值体系、认知和推理能力以及从0到1的创新创造力。大模型在模拟真实世界方面,不管是通过外部信息编码,还是依靠内在的第一性原理(即尺度定律,Scaling Laws),都有显著的不足,表现在强烈依赖数据、模型不可解释、缺乏常识理解等方面,如果能在未来几年内解决这些问题,那么大模型的智能水平有望进一步提升,从而更好地融入社会应用。三、生成式人工智能在教育变革中的技术限度目前,生成式人工智能虽然仍属于弱人工智能,但是它的迭代速度和表现水平已经远远超出我们原来的预期。从教育的视角出发,分析生成式人工智能的技术限度,将打破以往技术发展与教育变革研究的宏大叙事或微观论证的局限性,以复杂性思维来科学分析、理性质疑人工智能影响教育的当下与未来。发展人工智能、训练大模型与教育孩子具有同构性。本文将着重以教育的要素和环节为逻辑脉络,从结构对比、逻辑对比、符号编码、内容分析、交互机理、培养模式六个方面展开论述。(一)结构对比:大模型与大脑所谓人工智能,实质上是对人脑组织结构与思维运行机制的模仿,是人类智能的物化。让人类的心智在计算系统中重现,对大脑的模拟是其中的关键。GPT-3的大语言模型已经具有1750亿个参数,GPT-4则达到1.8万亿个参数,一次的训练成本为6300万美元。在语言智能的发展过程中,模型功能越来越强,泛化能力越来越好,任务解决能力也就越强。大模型试图通过不断增加参数的数量,来实现最大可能地模拟人类大脑的神经元,以此实现接近人类智慧的复现。但人类大脑中有数以亿计的神经元,神经元之间还有连接的突触,人脑大概有800~1000亿个神经元,它们之间的连接突触数目在100万亿。神经元通过电信号相互通信,组成了复杂的网络,直至今天,人类也未完全了解其运行原理。冯·诺意曼早在《计算机与人脑》中就提出,“同样容积的神经元比人造元件能完成更多的运算,能同时处理更多的信息,记忆容量也大得多,每个神经元的准确度较低,但其综合后的可靠性比较高”。也就是说,如果人脑是有机联结的,那么人工智能就是机械联结的,其内在的丰富性和复杂度不可同日而语。按照计算机学科的发展趋势,再过几年,大模型的参数就有可能达到人脑百万亿级的规模。根据幂律定律可知,合理地分配模型参数和训练数据大小,可以在有限的预算内或者预期的计算速度内,尽可能获得效果优良的模型。但模型参数与模型智能程度不是简单的线性关系,大模型和人脑的感知、认知、推理、创新的机理并不一样。因此,一味地追求模型参数并不能实现完全模拟人类智慧的性能,也未必是大模型未来的发展趋势。(二)逻辑对比:概率推理与概念推理概率推理和决策理论为人工智能系统提供了重要的思维方式和决策依据。通过建立贝叶斯网络和使用强化学习等技术,人工智能系统能够利用过去的经验和观察结果进行决策,提高决策的准确性和效率。因此,目前基于概率推理的人工智能存在先天的技术局限。一方面,人工智能基于概率推理,人类智慧基于概念推理,二者之间有质的区别。概率推理是基于已有的信息和数据进行计算,由此获得最大的可能性。概念推理,属于形式逻辑,是基于概念——这一人类思维活动的抽象符号化产物,通过语言表示对某些实体或现象的理解、归纳或分类,反映人们对于事物的认知和理解的高阶思维形式。在计算机语言没有突破冯·诺意曼结构和二进制逻辑时,它把所有的运算存储最后都变成一种加减的关系,仍然是在低阶维度上的无限展开。生成式人工智能尚未突破概率推理的计算模式,只不过是在大数据、大算力、大模型的支撑下,加之人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)使得机器根据不确定的信息做出决定时,进行的推理实现了最大概率的可能性和最接近人类思考的结果。大模型无法运用一套算法解决各种问题,人工智能只能应对确定性指令。但人脑可以面对不同问题场景,可以同时执行不同任务,任意切换,从而应对不确定性。由此可见,人工智能目前停留在逻辑推理、概率推理、因果推理的低阶思维阶段,尚无法展现高维的人类智慧。另一方面,生成式人工智能很难突破线性的、片段的因果逻辑链,也无法根据多样性的社会文化与伦理,实时生成真实、具体的实践内容。但这并不代表它生成的内容不具有创造力,恰恰是由于缺乏逻辑体系、伦理规范的约束和实践检验而“太富创造力”,经常导致“知识幻想”的情况发生。从工程实践的角度来看,生成式人工智能完全可能会产生我们意想不到的智慧。但从知识生成的实效性来看,生成式人工智能的知识创造是通过对过去的大数据进行训练实现概率推理,仿佛是“用后视镜在开车”。麦克卢汉曾将“后视镜效应”生动地解释为“借助固有的经验解决问题的方法,透过后视镜看现在,我们倒退着步入未来”。这与人类真实的教育场景还有着本质差别。孩子的教育、人类的学习,都是在真实的师生互动或实践劳动的情境中,边行动、边建构中培养素养,是对人类智慧结晶的科学知识体系和当下现实生活中不断产生的新经验的结合。(三)符号编码:语言编码与隐性知识语言是人类特有的一种符号系统,是以语音为物质外壳,以语义为意义内容的词汇材料和语法组织规律的体系。语言本身就是一种编码。因此,教育的内容能否被编码和解码,成为“可说”与“不可说”的关键区分。1958年,迈克尔·波兰尼在《人的研究》一书中最早提出,人类的知识分为显性知识和隐性知识(也称缄默知识)两种,通常被描述为知识的,即以书面文字、图表或数字公式加以表述的,只是一种类型的知识;还有一种知识是不能系统表述的,像我们在做某事的行动中所拥有的知识。他指出,与显性知识相比,隐性知识的重要特征在于:第一,就是能通过语言、文字或符号进行逻辑的说明;第二,就是不能通过学校教育、大众传媒等进行传递;第三,不能加以“批判性反思”。由此可见,以自然语言理解与处理、机器学习为核心的人工智能的发展,其核心在于可编码、可建构逻辑的语料及其数据信息。大语言模型的智能正是基于语言文字可以被记录、编码、传播的显性知识,但作为另一种类型存在的隐性知识却被忽略了。因为各种类型的编码在内涵表达和意义建构上都具有一定的局限性,文本表达的有限性限制着多模态大模型的智能程度的发展,由于多次编码及其转化会使信息多重过滤和衰减。正如维特根斯坦所言,“语言给思想穿上了衣服,从这件衣服的外表形式人们不能推断出它所遮盖的思想的形式”。语言是人类思维和交流的工具,但语言的表达能力是有限的,无法完全捕捉和描述现实世界的复杂性。语言既是思维的脚手架,也是思维的桎梏。而在人类的学习和进化发展中,往往是隐性知识所占比例更大,意义更为重要,也更具挑战性,如分辨光谱上的颜色、用手感觉材料的颗粒度等非语言类的知识与技能。人工智能面对原理类知识、程序类方法、价值类知识的力不从心;面对生成性教学、情感性教学、实践性教学的无能为力。这类知识和教学不易“言传”,更适合“身教”,只有在做中学,在丰富、复杂、精密的多感官互动中学,才能在身、心、脑、体之间建立真正的联结。另外,即使把经验用语言文字表达出来,但对于接受者来说,它也失去了大部分情境信息和背景信息。当接受者以自己的角度来理解时,它已经丧失了所有的精微之处(相对于表达者而言)。因此,以大语言模型为底层核心技术的人工智能,其实只是注入了人类可以用语言文字或者其他符号编码、计算的显性知识,其基于自监督的语言模型无法获得关于真实世界的知识,其本质是“压缩”。(四)内容分析:海量数据与高质量数据尽管科学研究领域和市场行业人员对于人工智能领域的诸多问题尚未达成明确的共识,但对数据质量是下一阶段大模型能力涌现的关键似有共识。在大模型的生产关系中,数据是生产资料,算力是生产力,算法是生产工具。以ChatGPT为代表的生成式人工智能是劳动密集型、技术密集型和资本密集型技术与产业的结合。原因就在于绝大部分的算力都用在预训练上,主要用于数据收集与清洗;除此之外,细颗粒度、高质量的数据标注也是人力集中的重要工作,而大量的基础工作都是为了高质量数据的获取。关于数据量(Training Tokens)和模型参数量(Parameters)对于模型的影响,OpenAI于2020年曾通过扩大模型参数的方式,提升了大模型的智能水平。但最终被DeepMind得出的结论改变,即在有限算力资源的情况下,更多、更好的训练数据比一味提升模型参数规模更重要。在我们的传统认知里,普遍认为我国在人工智能发展的新浪潮中具有海量数据的比较优势。但现实并非如此,特别是在教育领域里,高质量的可用数据问题更为突出。虽然我们有着全世界最大规模的教师和学生数量,并且他们还会在日常的教育教学管理中源源不断地产生新的数据,但实际上目前可用的高质量数据主要来自书籍、新闻、科学论文等静态沉淀的专业文本。这些数据对于大模型的优化和深化应用,如从大模型走向行业垂类模型,是远远不够的。因为互联网可获取的免费公开数据缺乏深度和精度,无法满足专业性强、精准度高的教育垂类模型。虽然我国已经拥有了海量的教育大数据,包括多模态的教学数据,但其中高质量、结构化、可计算的有效数据并不多。主要问题在于,数据标准不全面和不统一、数据采集覆盖面窄、模型构建专业性不足、应用服务单一机械(主要聚焦于适应性教学、题库类)、开放共享尚未形成和隐私保护有待完善等。特别是教学环境、教学过程中的标准和数据,这些标准的缺失都极大地限制着教育大数据的发展和积累。因此,挖掘已有数据背后的价值,加强未来数据管理,明确行业标准,建立数据使用规则,确保大模型训练有充足、准确的专业数据,才是生成式人工智能赋能教育的基本前提。(五)交互机理:强化反馈与教学互动在信息处理上,基于人类反馈是大模型“智慧”提升的关键所在。人类反馈强化学习是生成式人工智能领域的新训练范式,它通过人类反馈来指导智能系统的行为。过去几年,各种大语言模型(Large Language Model,LLM)根据人类输入提示(Prompt)生成多样化文本,主要是依赖上下文的逻辑和概率推理,因此,存在一定的偏误性。但通过RLHF,在一般文本数据语料库上训练的语言模型能和复杂的人类价值观对齐,让生成式人工智能更具“人性化”。正是人类智慧的反馈与调优,使得人工智能更接近人类智慧。课堂教学也是一个有目的、有方向的、完整有序的复杂信息传递系统,教学反馈作为贯穿教学过程的必要环节,教师可通过时时反馈以调整优化教学策略,从而适应学生的学习行为。对于教学反馈而言,准确性、针对性、指导性、激励性、适时性、多样性、交互性是其核心特征。由此可见,教学反馈与RLHF具有同样的执行机理。(六)培养模式:多模态输入与全面发展在信息输入上,多模态的信息类型是输入有效性和丰富性的前提条件。通过结合不同类型的数据,大模型可以更好地理解和预测复杂的现实世界问题。目前,大多数模型都是通过训练单独的模块,将不同模态转化为语言文本,然后将它们拼接在一起以达到近似多模态,不足之处在于没办法在多模态空间进行深层复杂推理。而原生多模态则在技术上更进一步,具有处理不同形式数据(语言+听力+视觉)的能力,一开始就在不同模态上进行预训练,利用额外的多模态数据进行微调以提升有效性。正如教育领域中的具身学习理论,基于视觉、听觉、感觉、触觉等多感官的信息输入和学习者、技术、环境三者之间多模态交互的学习环境,实现大脑多区域的激活,通过深度学习的发生以达到最佳的学习效果。对于大模型的训练亦如培养模式的价值取向,即选择素质教育还是应试教育的问题。如果选择单一维度、单一模态的“刷题”强化训练,大模型在某些方面的智能会在短期内快速提升,但很快到达瓶颈。如果选择全面发展、多模态的素质教育,那么大模型的迭代速度较之前者会慢一些,但是智能程度的上限则会更高。因为通识是专识的基础,恰恰先发展通用认知能力,才有可能发展专业认知能力,大模型也是如此。教育领域更要谨防高分低能的“书呆子”大模型进入应用市场。四、以人工智能撬动教育变革人工智能不仅是科学问题,也是教育问题,更是社会问题。如果人类文明想要传承发展,那么主动面对人工智能是我们必须走出的一步。但总体而言,人们对于人工智能的影响,存在高估短期效果、低估长远效果的倾向。因此,必须从当前采取措施,客观理性地看待人工智能的发展并作出研判。当下,第三波人工智能的兴起不是来自学术界,而是来自企业界的催促和市场化的倒逼。从本质来看,这并不是人工智能领域发生了新的技术突破,而是随着教育数字化的普及和转型,时代发展的必然趋势和旺盛需求所催生的结果。(一)人工智能对教育的影响从长远来看,人工智能对教育发展的影响,应优先重点考虑以下三个方面:一是价值理性。今天的教育者或许无法精准预测未来复杂交织的影响因素,特别是人工智能这个正在巨变的因素,促使群体智慧、人工智能、社交网络对人们决策的影响更为深度地融入了我们的生活。人工智能的能力主要来自人工智能学习的人类大规模数据,数据中有能帮助我们解决问题的关键线索和事实,也有人类社会中的偏见、歧视、敌对和仇恨。人工智能在没有伦理安全、道德框架约束时,学习人类数据的同时也学习了人性的弱点,人工智能向人类提供服务时,也潜移默化地隐含了偏见等。因此,有意识地培养受教育者形成适应未来社会的价值观和是非判断能力,使其无论面临多么复杂难测的境遇,都能用坚定的价值理性作出独立判断,并妥善地加以应对。二是伦理道德。要重视建构机器智能高度发展后的社会伦理道德体系。目前,人工智能大模型在未来扮演的角色主要是三种:工具、伙伴或者敌人,不同的社会文化对它的定位也不尽相同。日本的“人工智能原则”强调,未来人工智能可能扮演社会的准成员,甚至是人类伙伴的角色;并规定,如果未来AI发展到准成员或人类伙伴阶段,它们需要遵守人类社会的伦理道德规范以及为人工智能制定的伦理道德规范。而在西方科幻电影和小说中,人工智能扮演了很多反派角色,是人类的敌人。人工智能大模型在未来究竟扮演何种角色,如何与人类和自然和谐共处,更好地辅助人类,都应率先思考。碳基生命的奥秘解密和在此原理基础上建立的人造智能体(硅基生命)是否会演化成为具有自主价值和生命成长性的机器体,也应该成为未来人工智能关注的方向。我们应该持有开放的态度,坚守人工智能为人类社会发展服务的初心,将其建立在人类伦理道德规约之下。同时,人类伦理道德体系也须随着文明形态的变化而实现相应的进步。教育的首要责任就是通过培养未来社会的合格公民,为建设面向智能社会的伦理道德体系发挥重要作用。三是人才培养。在未来的智能社会中,人工智能体与人类、自然、社会是否能够和谐共生,不是取决于人工智能,而是取决于人类对待人工智能的认知与态度是否能够加速演化。因此,教育要转向对受教育者创新思维等高阶能力的培养。未来社会需要大量具备人机协同能力的高水平人才,创新思维、计算思维和情感能力等高阶能力将成为人类的关键竞争力。为了应对人工智能时代新的挑战,各国应重新审视学校教育体系的价值,反思应“培养什么人”以及“如何培养”的问题。人们认识到,与以往任何历史时期相比,当下都更需要凸显人的价值和凝聚人的力量,以抵御不安和恐惧,区分人与机器、人与人工智能的差别。面对充满不确定性的后真相世界,教育不应只关注教会学生什么,而应帮助他们摆脱“工具人”,塑造“完整人”,激发他们的主体性和内驱力,培养他们独立思考和可持续发展的自主学习力。“五育”并举,全面发展,都与人的情感紧密相关。因此,培育机器智能无法具备的社会情感等是未来教育的关键内容和目标。从中短期来看,人工智能给教育带来了六个方面的影响。一是影响培养目标。为应对人工智能带来的长远挑战,教育要根据未来社会需要调整人才培养目标,以发展学生的核心素养为导向,培育学生终身发展和适应社会发展所需的正确价值观、必备品格和关键能力。二是影响学习方式。人工智能可以助力实现个性化的学习路径,提供智能化助学辅导,还可以通过虚拟现实技术和增强现实技术为学习者营造更逼真的学习情境,模拟那些无法在真实世界呈现的科学实验,等等。三是影响教学方式。通过人工智能,人类可以消解大规模教学和因材施教在实践中的两难困境,兼顾促进教育公平和提升教育质量,促进实现更好的教与学。四是影响师生关系。以前教师是课堂上的学术权威,而现在的学生使用ChatGPT、Sora等工具,即时获取的知识可能比教师能提供的还多。当师生关系不再单纯围绕知识传授而构建时,如何更好地发挥引导、激励和示范作用,如何重新诠释言传身教、保持师道尊严,对教师来说是一种挑战。五是影响教育内容。教材中的机械记忆内容将大幅度减少,给深度学习、认知创新和实践性学习留出了空间。另外,要注意防范通用人工智能潜在的意识形态风险。预训练数据蕴含的意识形态偏向将潜移默化地影响受教育者。六是影响教育管理。教育管理中的人工智能应用已相对成熟,技术促进了教育管理高效化、精细化、科学化,在我国各地已形成诸多优秀案例,积累了丰富经验。同时,还需要继续探索教育管理数据的集成应用,提升数据治理水平,并加强数据安全监管。(二)教育如何积极应对人工智能的挑战当下,生成式人工智能的诞生,已经将技术作用的对象从人的体力向人的脑力转移,从人的身体向人的智慧、意识延伸。人类作为主体性存在的独有特征——思维方式都将受到挑战。我们必须重新思考教育,使其向促进人类意识的觉醒和技能的提升转型,以此维护人类的价值与自由。当前,生成式人工智能依靠数据驱动的实现方法是不是最优路径,有待进一步确认。大模型基于概率推理的天然技术缺陷和资源损耗的制约,一味地追求参数的增多及模型变大是没有价值的。当数据驱动的红利消耗殆尽时,是否存在第三条道路,是否会产生新的研究范式或技术路线。对此,我们应该持有质疑和理性的态度。从大处着眼,从小处着手。在教育生态体系的复杂元素中,从以下三个问题入手最为紧要,也最具指导意义。第一,当我国传统教育优势将被人工智能大幅削弱时,更应注重学生哪些素养与能力的培养?第二,随着生成式人工智能技术的发展,如何处理新型的师生关系?第三,人工智能改变了知识生产和传播的方式,在此背景下,教学模式与教育信息化时代有何质的不同?1.注重学生的高阶思维培养人工智能时代,育人目标和模式从知识本位、学科本位走向素养本位,即查即用类知识的习得将更多由人工智能辅助完成。学生接受的不仅仅是海量的确定性信息,更是真假难辨、良莠不齐的生成式内容,这对提高学生的数字素养与技能这一未来必备的基本素养提出了要求。如果说信息化时代,我们要求学生要有发现问题和解决问题的能力,那么人工智能时代,我们则要求学生具有提出问题的能力,甚至要提出有质量、有逻辑、开放性的问题。提出好的问题,才是人类与人工智能良好协作的开始。目前,生成式人工智能生成的内容大概是人类常识的均值水平,如果想让它接近或达到峰值水平,则需要良好的提示词(Prompt)。这其中就蕴含了比较、分析、应用、迁移、综合、评价等高阶思维,而传统的记忆、检索、计算等初级思维则逐渐被人工智能替代。科技将人的一部分功能强化、延伸,就会相应地导致另一部分功能的弱化、萎缩,造成人类智慧懒惰(Intellectual Laziness)。脑神经科学和相关实验多次证明,历史上的技术和工具在不断地塑造着人类的大脑,脑神经元之间的突触连接会根据我们的思维习惯重新组合,互联网时代让信息过剩、生成式人工智能让知识不断创造,但是人类的思考会变得浅薄。互联网和多元刺激的富媒体可以让大脑的前额叶区不断兴奋,但是负责深度思考的海马体却在此过程中未被激活,这就会鼓励人类个体的智慧懒惰,因为好奇心和探索的愿望是需要鼓励和奖赏的,而“走捷径”是人类与生俱来的本性,这可能会使人类经历集体降智。当下,人工智能给我们带来的巨大威胁并不是代替人类的工作,而是人类会陷入人工智能的强大功能“陷阱”,习惯于机器提供的解决方案,而放弃自主思考。人类一旦习惯了轻松获得,不再进行独立思考,完全把思考交给机器,交给人工智能,那将是对人类最大的威胁所在。因此,教师需要回归教育初心,擅用互动启发式教学法,更加注重师生之间、生生之间的问答互动,重点在于学生的思维发展、情感发展与道德发展,而不仅仅是课堂教学流程上的效率提高或者教学内容的容量增大,避免其误用导致教育内卷的加剧。这就要求教师不断提高数字素养与技能,了解生成式人工智能的内容生成和输出的基本原理,在教育教学中客观理性地对待和适度应用。当下,我们再谈“互动启发式教学法”,是智能时代对教学法的一种复归。这是对中西方教育理念的一种创新性实践。苏格拉底提倡的“问答式”教学,是指他在教授某个知识点时,并不是直接告诉学生,而是先向学生提出问题,让学生回答,如果学生回答错了,他也并不直接纠正,而是提出另外的问题引导学生思考,从而一步步地得出正确的结论。苏格拉底将其称之为“产婆术”,其教学法则是为思想接生,是引导人们产生正确的思想。孔子在《论语·述而》中的“不愤不启,不悱不发。举一隅不以三隅反,则不复也”,强调了其启发式教学的思想和方法。朱熹在《论语集注》中对此解释为“愤心求通而未得之意,悱者,口欲言而未能之貌。启,谓开其意。发,谓达其辞。”在朱熹看来,愤悱之境是认知水平,而启发则是开意达辞的方法。简言之,我国优秀传统文化中的启发式教学,更注重在学生主动思考的基础上进行问答式的教学。当生成式人工智能走进教育现场时,融合中西文化精髓的“互动启发式教学法”,更加注重“启”和“互动”,即通过师生双向有效提问的互动方式,启发学生进行深度学习,培养学生的高阶思维。其特征是问题化、强交互、强反馈,只有真正触发学生深度思考的问题并及时给予正向反馈,才能刺激大脑皮层,促进大脑活跃。而当学生完成某个预期目标后,大脑会产生奖励系统,同时分泌多巴胺、去甲肾上腺素、内啡肽,让学生从精神上感受到愉悦和快乐。学生自主学习的真正发生,是脱离物质奖励和功利目的的单纯的学习专注,具体包括三个特点:第一,教师的启发工作必须建立在学生积极思考的前提下,学生的思考可以通过学生提出问题的方式来体现;第二,从传统课堂教学中的教师单向提问为主,转变为多主体交互、多轮次问答的师生、生生教学互动;第三,教师的教学设计目标要合理,遵循“最近发展区”原理,并强调及时的正向反馈。互动启发式教学法并不是某一种具体的教学方法的代名词,而是一种教学理念,一种教学的指导思想,它可以体现为一种教学方法,也可以是多种教学方法的整合。2.着力构建新型师生关系教师如何适应新型教学关系中的角色,教师如何开展人机协作教学,以及如何关注师生的数字道德问题等,都是构建新型师生关系的重要内容。通过将优秀教师的素质结构进行解构,并将这些素质通过预训练模型赋能机器,力求打造与优秀教师“同质”的虚拟教师。传统“以教为主、以师为主”的师生关系会被弱化甚至消失,同时“以学为主、以生为主”的新型师生关系会逐渐产生。单向传输的二元主体的师生关系,将转变为多向互动的“师—机—生”三元主体关系,形成新的育人生态,将“机”视为新主体的原因就在于,其智能性、交互性的不断发展迭代了传统机器教学的机械化、程序化。教师将从“知识的守门人”转变为“学习的编舞者”。首先,应更加注重对学生情感、态度、价值观的引导。未来新型的师生关系需要更具有情感性和互动性,未来的人类教师需要学会和机器共处,让“机师”为我所用,需要更具有亲和力和共情力,能够走进学生的心灵世界,需要将教育变成“艺术”。其次,逐渐成为知识生产者、学习促进者和成长引导者。教师将越来越起到导师般的作用,引导学生寻找正确的学习目标、科学的学习方法与高效的学习路径,提醒或约束他们形成自律的学习习惯,为学生的综合实践与社会体验提供情感支持。让人师与“机师”的协作在各自优势发挥的基础上充分展开。人师的优势主要包括对学生社会情感能力的支持,教师自身的世界观、人生观与价值观对学生的影响与塑造,对不同领域的知识进行跨学科交叉融合的能力等。智能技术相比以往信息技术所特有的智能优势,可以解决学习者学习需求差异化的识别困境、认知障碍内隐性的辅助困境和学习路径多样化的适配困境,使得精准教学的实现成为可能。因此,“机师”的优势在目前主要集中于知识的大量储备、近乎无限量的计算和对解决问题范式的记忆,并且在交互过程中永远“耐心”且个性化地对待每个学生。3.创新探索智能时代教学模式的变革如何科学认识当前人工智能技术的发展及其对教育的影响,需要教育界进行深入研究。目前的技术还没有成熟到可以系统、全面、准确地应用于教学当中,过度强调人工智能技术在教育教学微观环境中的应用,恐怕还为时尚早。教师首先要认识到当前技术的局限性。相对于人类智慧而言,生成式人工智能目前并没有关于“能力界限”的判断,对于无法回答的问题,它会依据概率给出答案,这其中可能往往包含着错误信息。师生都需要安全、有效和恰当地使用人工智能,教育应帮助每个学生为用好生成式人工智能技术或未来其他技术做好准备。在这种情况下,教师应该注重引导学生加强对生成式人工智能技术的本质认知与初步应用,强调在理性判断的前提下与新技术“接触”。再者,人工智能教育较之教育信息化教学,有着质的差别。在教学中,师生与生成式人工智能的思维链式对话是与过去的计算机辅助教学和使用数字化教育资源平台等完全不一样的体验。它在教育主体、资源供给、内容生产、交互方式上都有质的不同,但并不是在教育教学流程中某个环节的效率提高、某个资源的供给丰富,而是在教育信息化基础上的一次迈向教育数字化、智能化的系统性跃迁,是驱动教育在底层逻辑上的创新和对教育本质的更好实现。例如,教师在教学过程中,可以通过生成式人工智能技术产生一些必要的图文故事或视频等内容开展探究活动,提升其教学设计能力与教学组织能力,增强课堂互动性,但并不是把新技术作为一种主要教学手段。人工智能技术是深化教育数字化转型中的过程性路径和重要的驱动力,因此,要加快数字时代的教育新形态“五新”体系的转型与应用,它蕴含公平、包容、可持续、终身化的教育理念,塑造“人人皆学、处处能学、时时可学”的高质量个性化终身学习体系;构建以数据驱动大规模因材施教为核心的教学模式;创新素养导向、能力为重的教育内容;推进管理精细化、服务精准化、决策科学化的教育治理。通过智能技术突破现有路径依赖,真正系统性地赋能教育变革,实现教育高质量发展。来源|《电化教育研究》2024年第8期作者|王学男(1984—),中国教育科学研究院数字教育研究所副研究员,博士,主要从事教育学原理、教育政策研究。李永智为通信作者,中国教育科学研究院院长。(免责声明:本文转载于《中国教育科学研究院官网》,版权归属于原作者,文中观点与本栏目无关,如涉侵权,联系立删!)