首页    >    教育资讯
国家义务教育质量监测结果区域应用的现实困境与纾解进路

2025-03-26

★原载《教育测量与评价》(双月刊)2024年第6期作者简介王庆如/深圳市教育科学研究院副研究员,博士。张海洋/深圳市罗湖区教育质量监测中心正高级教师。【摘  要】国家义务教育质量监测是推动义务教育高质量发展的重要手段,也是建设教育强国的重要保障。随着国家义务教育质量监测的深入推进,如何有效落实监测结果的区域应用,如何推进监测赋能教育高质量发展,已经成为当下教育质量监测工作必须面对的重要课题。聚焦“谁来用”“用什么”“怎么用”等痛点问题,回归国家义务教育质量监测设计的基本逻辑,并在借鉴国际教育质量监测结果应用经验的基础上,从建立多元主体协同机制、促进监测的延伸与下移、构建“3456”应用模式等方面着力,推动国家义务教育质量监测结果区域应用体系的构建。【关键词】国家义务教育质量监测;监测结果区域应用体系;“3456”应用模式;“实证+”赋能;教育高质量发展国家义务教育质量监测紧密围绕落实立德树人根本任务,扭转唯分数、唯升学等不科学的教育评价导向,引导聚焦教育教学质量、遵循教育规律,以全面客观的监测数据支撑教育决策、服务改进教育教学管理,促进培养德智体美劳全面发展的社会主义建设者和接班人。[1]它是推动义务教育高质量发展的重要手段,也是建设教育强国的重要保障。自2015年全面启动以来,国家义务教育质量监测工作在全面诊断省级义务教育质量状况、服务国家教育决策等方面发挥了积极作用。但在区域层面如何用好监测结果指导教育教学改进、助力教育教学质量提升,依然是一个需要不断探索的课题。本文聚焦国家义务教育质量监测,深入探讨监测结果区域应用的困境及其破局之道。一、国家义务教育质量监测结果区域应用面临的困难和问题国家义务教育质量监测结果的区域应用,始终存在“谁来用”“用什么”“怎么用”等痛点。这些痛点深刻揭示了当前教育质量监测中存在的困难和问题。一是不够重视。目前,各地义务教育质量监测更多地停留在教育督导这条线上,从组织实施到结果应用都很难走出这个范围,这在很大程度上是因为教育质量监测工作尚未得到足够重视,相关教育部门、学校和教师对监测结果并未完全接纳,在监测结果应用过程中往往被动参与,甚至存在一定的应对或抵触情绪。二是不够了解。义务教育质量监测结果目前仅报告至区(县)层面,且监测工具对外严格保密,很多管理人员、教研人员以及教师既不清楚监测的具体目标和内容,也不了解监测指标和要求,无法对结果报告数据进行深入挖掘,也就难以发挥教育质量监测对日常教育教学行为的引领作用。三是缺乏有效落实。对于由谁来统筹落实教育质量监测的结果应用,虽然不同地方都有自己的做法,但仍存在工作目的不明确、职能分工不清晰、工作推进无抓手以及跟进落实不到位等问题,监测结果的应用难以有效落实。四是协同乏力。义务教育质量监测属于综合性监测,涉及学生发展、课程教学、教师发展、教育管理以及资源建设多个领域,需要相关业务部门和行政部门共同参与。但在实际开展过程中,往往是督导或监测部门在唱“独角戏”,呈现“一方搭台,大家看戏”的局面。五是赋能作用被忽视。虽然监测本身不能提升教育质量,但监测结果能为改进教育教学提供依据,从而助力教育教学的质量提升。但当前各地监测结果的应用很难落实到学校和课堂,始终存在“最后一公里”的问题,难以赋能教育质量的不断提升和可持续发展。二、国家义务教育质量监测结果区域应用的逻辑推演与归因分析国家义务教育质量监测的实施主体是政府督导部门,通过抽取能代表各省(区、市)教育质量状况的样本进行质量监测,形成国家、省(区、市)和参测区(县)的监测报告,并通过各种保密措施保障数据的客观性。然而受质量监测目的指向的清晰度、参与主体的适切性、抽测样本的代表性、报告解读的可行性和保密要求等因素的影响,各地在应用监测结果时难以完全了解监测指标、要求等,难以调动各部门积极参与,难以对监测结果原始数据做进一步分析挖掘。1 目的因素分析国家义务教育质量监测代表国家意志,以“推动落实立德树人根本任务,促进义务教育质量提升”为目的,其结果主要应用于服务国家教育决策咨询、督促省级教育问题整改、支撑县域教育督导评估、引领地区教育质量提升等4个方面[1],但对如何将监测结果落实应用到地(市)、区(县)和学校教育教学实践的改进,《国家义务教育质量监测方案(2021年修订版)》中却未有提及,需做进一步探索。2 主体因素分析国家义务教育质量监测由各级政府教育督导部门统筹组织,具体业务工作由各级教育质量监测中心负责落实。在监测结果应用上,主张各地建立省级统筹、区(县)为主的监测结果应用制度,并提出由教育督导部门牵头,加强与有关部门协同联动,积极探索适合本地区的监测结果应用模式。这里比较容易混淆的问题是,把监测组织实施与结果应用工作两者的主体等同起来。如此一来,监测就较难走出教育督导的工作圈了。我们必须清楚,监测组织实施的主体是各级督导部门,监测结果应用的主体是教育部门和学校等。[2]因此,监测结果应用必须多主体,即由各级教育督导部门牵头,有关部门和学校积极联动并主动赋能。3 样本因素分析国家义务教育质量监测以省域为单位,抽取样本在省级层面具有较好的代表性,但因样本区(县)的抽取不考虑覆盖每一个地(市),故不能较好反映地(市)、区(县)全面教育情况;加之样本学校因抽取学生数量少也不能精准反映学校具体教育情况。如,广东每年仅抽样18个区(县),考虑到抽取的区(县)要反映全省平均教育水平,故不会将样本数平均分配给各区(县)。因此,地(市)、区(县)和学校在应用国家义务教育质量监测结果时会受掣肘。4 报告因素分析国家义务教育质量监测根据目的、内容和阅读对象的不同,主要研制形成国家监测报告、省级监测报告、区(县)诊断报告、政策咨询报告等,以供各级政府、教育部门以及学校使用或参考。事实上,这些报告在使用的针对性上都有所欠缺,故国家特别倡导在进行结果应用时加强数据分析和挖掘,并组织好各级分层分类结果的反馈。但从目前情况来看,质量监测的原始数据、具体工具、专业人员等都还很缺乏,给各级反馈、解读监测结果带来了困难。5 保密因素分析开展国家义务教育质量监测需要营造一个客观真实的监测环境,需要从关注数据走向关注数据背后的事实和原因。因此,它非常重视保密,既不向外界公开监测工具,也不向各级教育部门提供原始数据。但我们都知道,监测具有引导、诊断和改进等功能。如果不知道监测工具和监测原始数据,就很难发挥监测对教育教学的引导作用,很难做好对监测结果的分析挖掘,很难有效落实监测结果的区域应用。这就导致质量监测工作与教育教学实践难以有效建立连接,更难以相互印证。三、国际视域下教育质量监测结果应用的启示与破题国家义务教育质量监测对深化课程改革、落实“双减”和“五项管理”、推动区域义务教育优质均衡发展等发挥了一定作用,但将监测结果应用到省、市、区(县)和学校的路径还不成熟,区域义务教育质量监测体系还没有形成,监测结果区域应用机制还不够健全。自20世纪60年代国际教育成就评价协会发起第一次国际数学和科学测评后,教育质量监测逐渐进入人们视野,监测结果也在国际和参测国家或地区得到广泛应用。[3]国际上的经验和做法对我国国家义务教育质量监测结果区域应用体系的整体建构具有启发意义。1强化统筹,推进部门协同联动目前,各国各地区都重视教育质量监测结果应用的政府统筹,注重调动各个部门主动参与和协同联动,全面、系统、整体推进监测结果应用工作。如,我国香港地区2001年参加国际阅读素养进展测试(PIRLS),在参与的35个国家和地区中成绩排名第十四,这个结果引起了香港社会和教育界对学生阅读的广泛关注。香港特区政府提出了“阅读特别任务计划”行动,并将其列入教育四大关键项目之一,要求教育统筹委员会、教育统筹局、语文教育及研究常务委员会等部门协同联动,还出台了一系列阅读政策、文件和方案,开展了一系列教师培训和研讨活动,为提升学生阅读素养提供了有力保障。此后,香港地区在PIRLS 2006测试中排名第二,在PIRLS 2011测试中名列榜首。香港的做法就是由政府统筹,教育行政部门、业务部门和学术机构协同联动,“一盘棋”推动监测结果应用工作,这是值得我们内地参考借鉴的好思路。2走向学校,推动监测结果应用落地许多国家强调监测结果走进学校和课堂,让教育质量监测回归教育发生的地方,并真正为教育教学发展提供数据支撑。如,芬兰有一套全面的教育质量监测体系,涵盖学生的学业成绩、学习态度、学校环境等,如果监测发现某些地区或学校的学生在特定学科上表现较弱,国家会增加对这些地区或学校的投入和支持;美国全国性和州级的教育质量监测并存,收集的数据包括学业成就、毕业率、不同种族和不同社会经济地位学生的成绩差距等,监测结果为学校改进计划和个性化教育提供了支持;日本在就全国学力调查发布的监测结果报告中,详细呈现了从国家到学校等各个层面的学生测试结果,对所有测试题目的属性和学生作答情况进行分析并提出了具体建议,对各个层级做好教育教学改进发挥了重要的指导作用。3助力发展,发挥实证赋能作用目前,各国都重视教育质量监测结果应用的赋能作用,将监测结果作为教育治理、行政决策和业务指导的参考。如,在PISA 2000测试中,德国的阅读、数学、科学3个学科的分数均低于OECD平均水平,这对德国教育系统乃至整个德国社会产生了极大的冲击和影响。德国政府立即行动,采取了一系列教育教学改革措施,包括开展学制改革、扩建全日制学校、研制教育标准以及推动课程改革等,不断推动德国教育教学质量提升,终于在PISA 2012测试中实现了阅读、数学、科学3个学科全部明显高于OECD平均水平的目标。德国的经验告诉我们,监测结果为国家教育教学改革提供依据,可以帮助政府部门围绕实证结果重建国家教育教学新体系,不断打破影响教育教学发展的滞后因素,建立适应新时代发展需要的体制机制。四、国家义务教育质量监测结果区域应用体系的整体建构要突破当前国家义务教育质量监测结果区域应用的局限,需坚持“国家、省、市、区、校”五位一体的理念,遵循各级监测结果应用相互贯通衔接的原则,推动义务教育质量监测结果区域应用的整体构建。因此,本研究根据国家义务教育质量监测结果应用的思维逻辑[4],围绕如何破解监测结果应用中“谁来用”“用什么”“怎么用”等问题,探索建立国家义务教育质量监测结果区域应用体系的基本模型。(见图1)图1 国家义务教育质量监测结果区域应用体系建构的思路与模型1 谁来用:建立多元主体协同机制国家义务教育质量监测内容的覆盖领域,决定了监测结果应用的关联主体。监测内容涉及学生发展质量、各学科领域的课程或教育活动开设、学生学业负担、教学条件保障、教师配备、教育教学、学校管理以及区域教育管理情况等,监测结果应用必然与教育各个部门、学校以及师生紧密相关。(见图2)                                                                                图2 国家义务教育质量监测结果                                                                                区域应用体系的多元主体构成(1)督导统筹。监测是由教育督导部门统筹组织实施的,监测结果应用当然也需由其统筹落实。而且督导部门在政府各部门、教育各部门、区校等之间起着链接的“纽带”作用,说明其本身就具有良好的工作统筹优势和条件。因此,教育督导部门尤其要从整体上部署监测结果应用工作,研制监测结果应用工作方案,组织开展监测结果应用研讨,跟踪检查监测结果应用成效,宣传推广监测结果应用成果,使监测结果应用工作成体系、聚焦点并有抓手。(2)监测支撑。监测结果数据贯穿于监测结果应用过程,也是牵引教育教学改进的线索。作为实施监测的主要部门,各地教育质量监测中心不应只是结果数据的生产者,还应是落实数据应用的支撑者。因此,他们必须围绕结果解读、问题梳理、专项调研、数据应用和效果监测等积极开展工作,切实发挥数据分析、数据挖掘、数据管理和数据赋能的作用,为推进监测结果有效应用提供数据支撑。(3)全体参与。对于监测结果的有效应用,各教育部门、学校不能做旁观者,而应该积极主动去了解、参与并担起责任,注意将监测结果与教育教学工作结合起来,并使其成为一种专业上的自觉行为。在面对监测结果数据时,要树立正确的数据观,建立科学的数据思维,提升数据分析的素养,做好对数据内涵的深入挖掘。在教育教学工作上,要打破经验主义的惯性,充分尊重客观事实,通过数据循诊把脉,有针对性地实施和行动,全面提升教育教学的质量和效益。2 用什么:促进监测的延伸与下移国家义务教育质量监测的设计定位是面向全国,了解省级义务教育质量情况,为国家教育政策的制定和调整提供支撑。因此,国家义务教育质量监测结果数据为国家教育决策提供参考是足够的,但要为各级教育教学改进提供依据却远远不够,必须探索义务教育质量监测的下移,即在国家义务教育质量监测基础上,探索将监测延伸至区(县)、学校和师生[5],切实为各级落实监测结果应用提供数据参考和依据。(见图3)                                                                              图3 国家义务教育质量监测结果区域应用体系的监测延伸思路(1)监测延伸到区(县)。国家义务教育质量监测可以监测到样本区(县),但样本区(县)只是部分代表且不是固定监测对象,因此无法对区(县)教育质量进行全面、稳定的跟踪监测。目前,各地都在积极探索将监测延伸到区(县)。如,广西通过委托服务的方式,借助国家义务教育质量监测,对全部区(县)进行全面监测;广东建立了全省义务教育质量监测方案,借助第三方专业机构的力量,对全省所有区(县)进行跟踪监测;江苏苏州、浙江温州等地由监测部门牵头,实现对全市所有区(县)的常态化监测;等等。各地经验显示,由省级教育部门统筹,参考国家义务教育质量监测的做法,结合各省(区、市)的实际情况,开展全部县域义务教育质量监测,可以为落实监测结果的县域应用提供有力支撑。(2)监测延伸到学校。监测延伸到区(县)为区(县)掌握教育质量情况提供了依据,但区(县)监测报告依然不能反映学校情况,尤其是不能反映每一所学校的情况,因此很难将监测结果应用落实到学校层面。可建立监测结果区域应用专项调研制度,全面摸排学校情况并查找问题产生的原因,切实将监测结果应用落实到各个学校。具体做法是:对区域报告进行分析挖掘,梳理监测结果中发现的问题和不足,建立区域共性问题清单,通过访谈、文献研究等方式吃透问题,在此基础上围绕问题研制出学生、教师以及管理人员调查问卷,开展面向义务教育阶段全部学校、全部4年级和8年级师生的问卷调查,最后形成区域和学校调研结果诊断报告,并分层分类开展报告反馈和解读工作。(3)监测延伸到师生。学校要基于调研结果诊断报告把脉全校总体情况,并针对学校存在问题开展全面深入调研,从教与学层面查摆问题产生的根源,从而对症下药解决具体问题,最终提升教育教学质量。特别是,学校要借监测结果应用之机,将解决诊断报告中发现的问题作为学校阶段性攻坚工程,形成攻坚策略,集合校内外资源和力量推进攻坚工作,不断改进问题,提升质量,形成成果乃至打造特色。3 怎么用:构建问题引领、任务驱动的结果应用模式国家义务教育质量监测结果区域应用是一项系统工程,需要将监测结果应用工作要素化、流程化和模式化[6],提高监测结果应用的有序性、系统性和有效性。要尊重监测结果区域应用的基本规律,立足“问题导向、任务驱动”,以“三个融合”为路径,以“四个联动”为机制,以“五个步骤”为流程,以“六个落实”为策略,构建问题引领、任务驱动的“3456”应用模式,切实解决监测结果应用“怎么用”的问题。(见图4)图4 国家义务教育质量监测结果                                                                               区域应用体系的“3456”应用模式(1)思路:坚持问题导向,谋划监测整改。监测结果的有效应用,源于对监测报告数据的深度挖掘,落实在对所发现问题的深入解读与探索上,最后转化为教育教学改进的行动。因此,收到监测报告后,有关部门或单位要对报告进行全面分析,透过监测报告数据揭示区域义务教育质量状况。按照“对比找优势、对焦找差距、对标找空间”3个维度,从“学生、教师、学校、家长”4个层面,全面梳理区域义务教育质量的成绩和不足。国家义务教育质量监测结果区域应用要坚持以“问题导向”为思路,将问题清单作为整改的线索,全面谋划监测结果应用实施方案,并责任到人。(2)路径:坚持有机融合,部署监测整改。要坚持“教学测评”一体化监测整改思想,建立监测结果应用与教育教学常规相互融合的工作思路[7],切实提高监测结果应用的针对性和有效性。可以建立“三个融合”监测结果应用工作路径。其基本内容包括:一是与区域教育融合,区域负责监测整改的全面统筹,将监测整改方案融入年度区域教育工作,实现区域监测整改常态化推进;二是与学校教育融合,学校是落实监测整改的主阵地,将监测整改方案融入年度学校教育工作,可以提高学校教育教学工作的针对性和有效性;三是与学科教育融合,学科教育是监测整改的落脚点,将监测整改方案融入年度学科教学工作,可充分发挥监测的诊断、改进和质量提升功能。(3)机制:坚持有效联动,统筹监测整改。监测结果应用涉及多个层面,需要实现部门之间的有效联动,为落实监测结果应用工作注入活力。可建立“四个联动”监测结果应用工作机制。其基本内容包括:一是建立内外联动机制,推动与区域外监测部门、学术研究组织、专业监测机构的研讨交流;二是建立部门联动机制,推动教育行政、教育督导、质量监测和教研训等科室的有效协同;三是建立上下联动机制,推动区域部署、学校管理和学科教研的有效协同;四是建立校内联动机制,推动学校管理、德育、教学及培训等工作的有效协同。比如,深圳市罗湖区就建立了“党建+四位一体”部门联动工作机制,形成了联席会议、协同工作、联合工作等工作方式,增强了部门协同联动的工作意识,发挥了各部门在监测结果应用上的主动性。(4)流程:坚持任务驱动,推进监测整改。可按照“督导统筹,监测支撑,部门协同,学校落地”的工作职能,落实基于“任务驱动”的项目制工作方式,建立“五个步骤”监测结果应用工作流程。第一步是解读报告,查摆问题。通过分析数据、查摆问题以及梳理问题清单,分层分类召开区(县)、学校及学科层面的报告解读会。第二步是深入调研,归因分析。要求开展学校样本调研活动,准确把握问题形成原因,形成区校两级调研结果诊断报告。第三步是制定方案,落实整改。在深入调研的基础上,研究制定区域、学科和学校问题整改方案,跟进了解学校整改落实情况。第四步是交流研讨,跟踪督导。围绕整改问题,积极开展课题研究、专题研讨和经验交流等活动,把监测结果应用纳入经常性督导内容。第五步是总结提炼,推动发展。重视整改经验积累,总结提炼整改成果,跟踪检查问题整改成效,引导学校逐步形成办学特色。        (5)策略:坚持实证支撑,落实监测整改。要创新“实证+”监测结果应用工作方法[8],不断推动教育教学从基于经验转向基于实证,切实让教育质量监测结果应用回归教育教学实践。可建立“六个落实”监测结果应用工作策略。一是“实证+施策:发挥督导部门统筹协调作用”,督导部门做好监测整改工作的全面规划、部署、组织、协调和落实,为推动整改工作提供政策、制度和财力支持;二是“实证+监控:发挥监测部门数据支撑作用”,监测部门负责开展监测结果应用专项调研,为推进落实监测结果应用提供数据支撑,对教育教学整改效果进行跟踪和检查;三是“实证+治理:发挥行政部门协同共建作用”,教育、督导、体艺卫、财务、人事等行政部门积极推动,建立与监测、研训、学校等业务部门的联动机制,使监测结果应用工作成为一个系统工程;四是“实证+研训:发挥研训部门专业引领作用”,研训部门做好监测整改项目的设计、研究、实践和总结,将监测整改与学科研训有机融合在一起,从专业上指导教育教学改进,推动教育教学质量提升;五是“实证+办学:发挥全区学校积极效能作用”,全区学校要积极配合监测整改项目工作,聚焦在监测中发现的具体问题,推动落实教育教学问题的整改;六是“实证+育人:发挥全体师生主动担当作用”,引导广大师生积极参与整改工作,并将整改转化为师生的行为自觉,推动师生不断发展、进步和自我超越。五、国家义务教育质量监测结果应用的价值取向与实践反思1 教育质量监测重在落实结果应用近年来,随着教育质量监测越来越受重视,各种质量监测活动也纷纷开展起来。殊不知,只想通过大量监测来评估教育教学质量,而不重视落实监测结果的应用,这是非常不科学也不切实际的短视行为。当前各地在结果应用上的办法还不多,结果应用工作还不能有序组织起来,结果数据和报告被尘封的现象依然存在。不重视结果应用的监测,就会让监测效益大打折扣。在质量监测的制度设计上,建议把监测组织实施和结果应用放在一起全盘考虑,做到在监测组织实施和结果应用上共同发力。2 监测结果应用可转化为生产力质量监测本身不能直接提质增效,而且大量的监测可能会影响教育教学秩序,增加教育教学工作压力,弄不好会给教育教学带来负面影响,甚至破坏整个教育生态。但科学的监测结果可以为教育教学改进提供依据,从而提高教育教学的针对性和有效性。也就是说,监测结果的有效应用可以转化为教育发展的生产力。因此,在质量监测结果应用上,要重视做好“国家、省、市、区(县)、校”各级统筹衔接,建立上下融通的义务教育质量监测结果应用体系,切实将结果应用落实到学校、课堂等教学一线,同时避免重复、多头监测评价情况的发生,不断提高结果应用的效率、质量和影响。3 监测结果应用指向高质量发展在监测结果应用中,一定要看到教育质量的发展和进步。或者说,追求教育质量的发展和进步,是推进落实监测结果应用的努力方向。如果只考虑质量监测工作本身,而不去关心教育质量发展,就难以真正做好质量监测。仅有“监测人”在探讨结果应用,仅有“监测人”在呼吁用好结果数据,无疑不应该成为教育质量监测的现实走向。在推进监测结果应用过程中,需要全体教育人共同树立质量发展意识,推动“监测人”与“被监测人”双向奔赴,通过共商、共研和共建的结果应用机制,打造教育与测评一体化的生态体系,切实发挥质量监测的助力和赋能作用。教育质量监测要遵循从教育中来又回到教育中去的原则,倾向于在教育内部构建教育质量监测结果区域应用体系,这样做无疑有利于发挥教育部门在监测结果应用上的主动性。同时,监测结果应用需要政府部门多方支持,由各级教育行政部门对接政府其他部门推动落实,或者由教育督导部门联系各地政府教育督导委员会予以解决。参考文献:

宋时春、郝志军:课程综合化的内涵演进、育人追求与操作路径

2024-09-30

在发展素质教育、落实立德树人根本任务的进程中,新时代的学校教育需要聚焦人才培养的重大需求,充分发挥课程的育人价值,全面实现课程的整体育人功能。为此,新一轮义务教育课程修订紧跟时代发展步伐,推动育人方式变革,把课程综合化作为本次课程修订的突出亮点和重要追求,致力于培养学生的核心素养。作为当前课程研究领域的基本课题之一的课程综合化是课程理念不断演进的结果,在课程育人领域有着特定的育人追求。深入探讨课程综合化的理论旨趣及其现实路径,对于深入落实本次新课程改革具有重要的指导和实践意义。一、课程综合化的内涵演进从历史发展的视角来看,人们对课程综合化的探索经历了不同的发展阶段,在每个阶段课程综合化的表现也有所不同,折射出人们对课程育人功能的认识的不断加深。如果说古代社会的课程(如“六艺”“七艺”)是一种原始形态的综合,那么19世纪初赫尔巴特(Friedrich Herbart)则首次明确提出课程综合化的设想并予以系统论证;而20世纪初杜威(John Dewey)基于实用主义哲学系统阐述了经验主义课程的思想并予以实践,把课程综合化推向新的高度,也为当今“核心课程观”“融合课程观”奠定了基础。(一)古代社会对课程综合化的初步探索在我国古代社会,尽管很早就有了正规的学校教育,但并没有形成现代意义上的学科课程形式,古人将教育内容进行大致的划分,以迎合当时人才培养的需要,由此形成了宽泛意义上的课程。我国传统思想注重整体性思维,古代的教育思想也体现出浓厚的整体主义的色彩。例如,“子以四教,文、行、忠、信”(《论语·述而》),这里的“文”,就是综合了诗、书、礼、乐的内容,所谓“兴于诗,立于礼,成于乐”。(《论语·泰伯》)孔子在教育学生时推崇的“文、行、忠、信”,是从整体上融合了有助于思想言行和道德人格发展的相关内容,以实现培养“谦谦君子”这一目标。显然,这是一种整体主义的视野,是从人的整体发展的角度作出的教育安排。从这一传统来看,我国古代的课程从一开始就强调综合,并没有进行精细的学科划分。古希腊对课程问题的探讨也由来已久。公元前5世纪至公元前4世纪活跃在古希腊的“智者学派”是西方最早的一批职业教师,他们知识渊博、能言善辩,以教授年轻人为业。为了教授论辩术,他们提出了“三艺”(即文法、修辞、逻辑);后来柏拉图在此基础上又增加了“四艺”(即算术、几何、天文、音乐),由此形成了古代西方“七艺”课程的传统。但需要注意的是,这些课程门类背后缺少清晰的学科逻辑,因此这些分化了的课程并不代表现代意义上的分科课程。无论东方还是西方,在科学文化知识相对不发达、学科尚未精细划分的古代社会,以综合化的课程形态实施教育是必然的选择。(二)赫尔巴特的课程统合论19世纪德国教育家赫尔巴特第一次明确提出课程综合化问题并对之进行了系统的理论论证,其理论依据是“统觉论”。所谓“统觉”(the law of appreciation),是指个体在原有观念基础上,把一些分散的感觉刺激纳入意识之中,吸收、融合、同化新观念并构成观念体系的过程。赫尔巴特指出:“按照某些规律在意识中出现的较弱的观念,对于观念团起着刺激的作用,并且被观念团吸收和占有(统觉),好像是在新感官印象中发生的那样。”新旧观念通过“统觉”的作用,进行重新联合,形成更广泛、更完善的观念,最后才保持在人的心灵中。赫尔巴特根据统觉论和观念说,从教学方法的角度把教学活动分为单纯提示的教学、分析教学和综合教学。他认为只有综合教学能够承担教育所要求的建立整个思想体系的任务。综合教学能够将个别的观念联合为一般的概念,然后通过更高级的综合,让一般观念与课程总体内容建立关联,使每一个观念团联系得更为紧密和有系统,最后通过实际联系,充实、完善和巩固既有的观念体系。后来,赫尔巴特的学生齐勒(Tuiskon Ziller)继承并发展了赫尔巴特提出的关于课程综合化的观点,他认为可以借助多学科的内容而实现道德和宗教意志的陶冶这一主要教育目的;另一位赫尔巴特思想的追随者赖因(Wilhelm Rein)接受了齐勒的“中心统合论”,将培养学生情操的学科作为课程统合的中心,围绕这一中心将技能类学科、语言类学科和自然科学类学科组织起来。这个学派从赫尔巴特那里继承了“兴趣”“统觉”等概念,在当时的社会情境中强调儿童经验与文化知识的统整,引领了当时的教育改革,形成了独具特色的“赫尔巴特运动”。(三)杜威关于综合课程的主张20世纪初,为了实现学校生活与自然生活、社会生活的融合,进步主义教育运动的代表人物杜威提出了以烹饪、缝纫和木工为主要内容的“主动作业”。杜威之所以选择“主动作业”作为活动课程的主要形态,是因为它不仅符合经验的本质,能够促进儿童的生长,而且符合民主社会对学校教育的需要,也是实现儿童与社会、学校教育与社会生活、直接经验与间接经验、心理与逻辑、课程与教学相统一的方法和途径。主动作业的特征和作用表现为三个方面:主动作业符合经验生长的心理学需要;主动作业具有积极的社会价值;主动作业是把儿童引入正式课程的媒介。“主动作业”使儿童重演了人类历史的发展,为真正理解人类历史发展提供了起点。在主动作业中,当儿童运用工具和材料解决问题的时候,他们真正懂得了自然原材料的机械原理,并获得科学的洞察力和品格的训练。绘画和音乐等艺术也通过主动作业而变得具有生命力,并使作业更有深度和丰富性。杜威的很多教育思想尤其他关于“主动作业”的思想为今后课程综合化的理论与实践发展奠定了重要基础。(四)当代课程综合化的进展概况20世纪中后期以来,世界有影响的综合课程理论主要有社会改造主义的“核心课程观”和人本主义的“融合课程观”。改造主义者倡导以有争议的或者人们困惑的社会现实问题为核心对学校课程进行综合,试图在解决问题的过程中使各门学科中与问题相关的知识得到整合。它倡导实现学校课程综合化,提出在中等学校开发和设置广域课程,主要涵盖三个领域:人文科学领域,主要包括艺术和文学;人的研究领域,主要包括社会学、政治学和伦理学;自然科学领域,主要包括物理、化学、生物学等。改造主义认为,学校的课程和教学方法要根据社会的长远目标进行改造,并主张建构以社会问题为核心的学校核心课程体系。人本主义教育思潮盛行于20世纪六七十年代的美国。人本主义者追求一体化的课程,反对片面追求知识传授、课程内容条块分割、组织方式单一的课程。因为只有一体化的课程才能培养出整体的人,才能使学生的知识学习与情感体验相统一,才能使学生的思维活动与情感活动和实践活动相统一。人本主义关于课程提出了一系列主张,如课程的出发点和归宿是学生的价值、尊严和个性;主张整体论和有机论,即自然、社会、个体是有机统一的完整的连续体,部分内在于整体,整体又内在于部分,部分与部分之间及部分与整体之间是动态生成的关系,等等。二、课程综合化的育人追求课程是学校育人的载体,丰富课程形式、灵活调整课程的设计和实施方式等其实都是为了更好地发挥课程的育人功能。总体而言,课程综合化在三个方面努力实现育人价值:基于整体主义视野,注重“整体育人”;基于人本主义视野,强调“综合育人”;基于建构主义视野,主张“个性化育人”。这三种追求从不同的角度揭示了课程综合化的育人功能,由此体现出其内在的教育价值。(一)基于整体主义视野,课程综合化注重“整体育人”整体主义理论是人们处理个人与群体、个人与社会关系的观点,指出世界不是随意分割的,而是一个有机的整体。古希腊的苏格拉底和柏拉图认为教育是在重塑人的心灵,追求的是生命内心的和谐和心灵的美善,从而开启了整体主义思想的先河。到了近代,卢梭(Jean - Jacques Rousseau)认为教育的最终目的是培养“自然人”,教育应该遵循自然规律,必须以理解和尊重内在的自然为起点,具有整体主义的特点。19世纪末、20世纪初的进步主义教育运动认为在任何时候都不能忽视儿童生活的整体性,同时要把儿童看作一个整体的有机体来对外界作出正确反应,这无疑为现代整体主义思想的发展作出了很大贡献。儿童生活的整体性与儿童经验的整体性要求教育要成为儿童在生活中不断成长的过程,这一要求包含着杜威教育哲学几个相互联系的基本原理。一是“教育即生长”的原理,杜威认为生长或者发展的生长,不仅指身体的生长,而且还是智力和道德的生长,可见生长意指儿童的整体发展。教育即生长,表明儿童的整体发展本身就是教育的目的。二是“教育即生活”的原理,它与“教育即生长”这一原理紧密相连,生活就是发展,不断发展,不断生长就是生活。儿童的生活与成人的生活是连续的,而不是割裂的。可以说,杜威教育哲学为整体思维提供了非常重要的基础。整体主义“强调事物内部要素及其与外部环境之间的关联,借助其他事物才能界定自身”。根据课程综合化的主张而开展的课程设计、课程实施与评价都体现了整体主义的观点,并最终服务于培养德智体美劳全面发展的人。(二)基于人本主义视野,课程综合化强调“综合育人”人本主义强调人的自我实现和自我价值,是一种追求人的自我表达、发展的文化观和社会思潮。人本主义心理学认为人的内在动机、本能需求、价值观和自我意识等才是应该研究的对象,反对行为主义只研究零碎的、片面的人类行为,而不研究整个人。其主要代表人物之一罗杰斯(Carl R. Rogers)认为教育的目的是培养完整的人,帮助学生达到自我实现。人的学习潜能是与生俱来的,多数意义学习是从做中学的,学习中同时运用理智和情感是最持久和深刻的。人本主义体现出自由性、以学习者为中心、自我发展性等特点。自由性是指学生在学习中有自由选择的权利,在自由选择中培养其责任感并养成健康人格。以学习者为中心是指相信学习者具有自我发展的潜能,必须尊重和重视学习者的需要、情感、意愿和价值,应该建立和谐融洽的师生关系。自我发展性是指儿童的自我最初不易察觉,只能在良好的环境和引导下才能发现,从而走向独立和创造。在课程综合化的实践中,人本主义的这些观点已成为课程设计的基本原则,突出以学生发展为中心、促进学生自我价值的实现是其基本追求。(三)基于建构主义视野,课程综合化主张“个性化育人”建构主义认为,“学习的本质是一个积极自主的建构过程。在学习过程中,人脑不是被动地学习和接受输入的信息,而是主动地对输入的信息进行选择、加工和处理,通过新知识与原有的旧知识和经验相互作用、改造、充实,来建构新的理解。”它强调学习者主动发现问题、分析和整理问题,并将新知识与原有知识和经验建立联结,进行意义建构。“知识是由认知主体积极建构的,建构是通过新旧经验的互动而实现的;认知的功能是适应,它应有助于主体对经验世界的组织”。建构主义理论揭示了人的学习的主动性和经验性,指出知识的学习不是被动地接受,而是要积极地建构。儿童的学习是一种建构性的学习,经验在其中扮演了重要的意义。教师应当把学习者原有的知识经验作为新知识的生长点,引导帮助学生在原有经验的基础上对知识进行自我意义建构从而生长出新的知识经验。建构主义必然要求学校提供适合于学生经验发展的教育,这为学校课程综合化实施提供了一定的理论支撑。“建构主义学习与探究为课程整合提供了哲学基础。”课程综合化强调教师与学生参与课程的主体性、经验性和意义性,强调要充分尊重学生已有的知识和文化基础,关注学生的个性化学习经历,这背后有着建构主义思想的考量。三、课程综合化的操作路径从理论上看,课程综合化倡导知识融合和经验整合,弱化甚至打破了学科之间的隔阂,为学生综合运用各学科的知识解决具体问题提供了机会,其育人价值毋庸置疑。但在实践中,课程综合化的实践操作相对复杂,明确其操作路径显得尤为必要。在课程设计层面,课程综合化的实践有三种基本的取向,即基于知识的关联与统合实现课程综合化、基于经验的分化与重组实现课程综合化、基于社会生活的整合与意义建构实现课程综合化。(一)课程综合化的设计思路1.基于知识的关联与统合实现课程综合化作为理性的动物,人类一直在研究知识并不断拥有更多的知识。而学校教育是培养人才的机构,在设置课程时必然涉及理解知识、选择知识并组织和传播知识等问题。当然,发展到今天人类所接触和拥有的知识已经浩如烟海,因此,在不同时期人类都在努力对知识进行梳理、分类和归纳,由此形成了不同类型的知识领域。例如,英国教育学家赫斯特(Paul Hirst)认为,基于人类所拥有的内在理性,可以将知识区分为七类:逻辑—数学、自然科学、文学、伦理学、美学、宗教和哲学。在他看来,知识是理解人类经验的复杂方式,不同类型的知识之间是存在关联的。“由于不同的知识形式之间的复杂关系,知识形式并非只有差异,它们也有许多共同之处;并且,一种知识形式常常会使用其他知识形式的成果”,因此他认为博雅教育才应该是教育的核心。尽管赫斯特对知识进行了分类,似乎是强化了知识的学科划分,但这种分类其实又是建立在不同学科知识的内在联系基础之上的,因为知识之间普遍存在关联性。类似的理解构成了当下知识观的主流,也正因如此不少西方学者在思考课程问题时强调知识的关联,正如有学者指出的:“课程整合指的是将课程计划中所有类型的知识和经验进行关联……‘整合’强调来自知识领域的话题和主题的横向联系。”基于知识之间的相互关联性,可以打通学科界限,将相关学科的知识予以整合和重组,从而实现课程的综合化。2.基于经验的分化与重组实现课程综合化在课程研究领域,“经验”是一个特定的术语,这个术语能够广为人知并在课程综合化领域拥有强大的解释力,无疑应该归功于杜威。杜威从实用主义哲学的角度出发,认为人的学习活动不是被动地接受外部信息,而是要通过操纵环境去检验假设,从而更好地适应环境并作出恰当的行为,因此个体与环境的相互作用至关重要,他用“经验”一词来描述这种相互作用。在他看来,“经验”包括两个方面:一个是主动的方面,就是要去尝试、去实验;另一个是被动的方面,就是要承受结果,就是要理解行为带来的后果。杜威旗帜鲜明地提出:“教育就是经验的改造或改组,既能增加经验的意义,又能提高指导后来经验进程的能力。”杜威所说的“经验”除了学生的生活经验之外也包含了人类的种族经验,也就是各种文化要素,具体表现为各种学科知识。学科知识强调经验的分化,分科学习就是为了掌握这些分化了的经验和知识,但它和学生的经验之间是存在矛盾的。因为分科学习是基于知识的分类和管理而进行的,而学生的经验则是具有整体性和无序性。显然,要解决学生的本性和知识之间的矛盾,就必须让学校课程与儿童当下的经验相关联,对相关经验进行重组。课程综合化的任务就在于协调经验的分化与重组问题,既反映种族经验的内在系统性,又能满足学生经验的个体性和整体性发展。那么,基于学生经验的整合从而开发出相应的课程就成为课程综合化的另一重要做法,譬如中小学校开设的综合实践活动课程以及一些课外活动、社团活动等。3.基于社会生活的整合与意义建构实现课程综合化学校教育是社会生活的特定领域,社会生活为学校教育的开展提供了基本的教育情境,因此社会生活是课程设计必须考虑的基本要素。泰勒(Ralph W.Tyler)在他著名的“泰勒原理”中就提出,当代社会生活是课程目标的三个基本来源之一,“利用从当代社会生活的研究中获得的资料,作为提出各种可行的教育目标的一个来源,是值得去做的”。但是,社会生活纷繁复杂,它具有明显的多元性特征,因此又对课程设计提出了很大的挑战。为解决这一问题,泰勒还把当代社会生活划分为七个基本的领域:健康、家庭、娱乐、职业、宗教、消费、公民。从社会生活的这种多元性来看,学校课程必然需要在一定程度上进行整合才能符合社会生活的本来面貌,才能与这种多元性相一致,这是课程综合化的又一个基本逻辑。此外,人们参与各种社会活动的最终追求无疑就是存在体验和意义建构,那么学校课程就需要为完满人格的发展和意义建构做准备。显然,分科课程根据学科逻辑对知识和经验的整体进行了分割,不利于整体性的意义建构,因此必然需要综合课程的关照,由此课程综合化就具有了现实的合理性。例如,美国课程学者比恩(James A.Beane)提出了课程的“社会统整”,主张“课程应环绕着个人和社会的议题加以组织,并由师生协同合作计划和实施,而投入于知识的统整”。20世纪80年代以来,欧美国家流行的一门理科课程—STS(Science、Technology & Society),即科学、技术和社会,就是将“社会”这一维度纳入科学课程开发的范畴,结合一些重大的社会问题(如环境污染、生态失衡、温室效应等)阐述科学技术的原理和知识,在科学教育领域产生了很大影响。(二)新一轮义务教育课程修订中课程综合化的实践—以跨学科主题学习为例跨学科主题学习指的是从发展学生综合素养的角度出发,设计相关的主题鲜明的学习任务,使该任务有机整合两个或两个以上学科的知识与技能,由此形成的学习方式和课程形式。在《义务教育课程方案(2022年版)》中,有多处提到“跨学科主题学习”,例如,“设立跨学科主题学习活动,加强学科间相互关联,带动课程综合化实施,强化实践性要求。”“原则上,各门课程用不少于10%的课时设计跨学科主题学习。”跨学科主题学习成为实现课程综合化的重要途径。跨学科主题学习的设计是为了改变单一的学科教学,但并不是取消学科,而是突出以某一学科为主整合其他相关学科知识。学科知识、原理和方法是跨学科教学的起点,跨学科主题学习不仅不忽视学科思维,反而尤其强调基于学科思维和深化科学思维。只有根植于学科思维,才能真正形成跨学科理解;脱离学科的跨学科,结果只能带来浅表式学习,使学生的学习简单化和常识化。因此,“要处理好学科课程与跨学科课程的关系,要将实施好学科课程作为优化课程结构的基本前提,跨学科主题课程要基于主题统领学科课程,超越学科课程,但又不能取代学科课程。”跨学科主题学习是一种实践学习,而不是对不同学科书本知识的学习,是采用参观、体验、动手操作等方式展开对现实问题的探究性学习。跨学科主题学习又是一种综合学习,它打破学科界限,超越书本知识,强调与学生真实生活相联系、与社会实践相联系,强调学生在真实生活中提出问题、分析并解决问题,体现出学习的综合性。跨学科主题学习还是一种提高学习者认知能力的深度学习,它强调运用不同学科的知识、观念、方法去分析和解决问题,从而形成新的观念、新的理解,符合深度学习的特征。开展跨学科主题学习有助于破解分科主义教学的弊端。分科对于提高教学效率、帮助学生建立学科认知结构有着重要作用,但单纯的学科知识无法应对复杂多变的真实情景,甚至分科主义也带来一些弊端,比如导致学生的学习被动机械、浅层次学习、学习效果差等。在现有教学中,部分学科也在尝试强化教学与实际的联系,但这种联系往往属于蜻蜓点水。跨学科主题学习突出了跨学科、多学科的优势,是解决上述困境的一个有效手段。跨学科主题学习符合人的整体发展和全面发展的需要。一个完整的人的生活是不分科的,只有跨学科主题学习才有利于我们培养完整的人。此外,促进学生的全面发展是我国既定的教育方针,除了德智体美劳等各个领域均衡发展之外,全面发展的人也必然是能够整合不同学科知识、拥有综合素养的,显然跨学科主题学习有助于实现这一培养目标。跨学科主题学习是应对日益复杂的社会问题的需要。当今社会复杂多变,人的生存与发展面临越来越多的挑战,而要迎接这些未知的挑战,解决现实中复杂的问题,单靠单一的学科已无法实现,必须进行跨学科的学习,综合运用多种学科知识方法去解决问题。与此同时,能解决复杂问题的具有创新性思维和批判性思维的人才能适应这个日益复杂的社会,而跨学科主题学习有利于培养学生面对复杂环境解决复杂问题的能力。总之,课程综合化问题是世界范围内课程研究的重要领域,挖掘其内在的育人价值并拓展其内涵是当今时代的新课题。尤其是在我国大力倡导“五育融合”的观念背景下,课程综合化带来的育人效果日益得到认可。作为教育工作者,既要深刻理解课程综合化是什么,更要知道应该怎样做,才能更好地落实立德树人根本任务,实现综合育人。 来源|《中国教育学刊》2024年第7期作者|宋时春,中国教育科学研究院课程与教学研究所副研究员;郝志军,中国教育科学研究院课程与教学研究所所长、研究员。 (免责声明:本文转载于《中国教育科学研究院官网》,版权归属于原作者,文中观点与本栏目无关,如涉侵权,联系立删!)

王学男、李永智:人工智能与教育变革

2024-09-30

一、引言自2022年11月30日ChatGPT正式发布以来,生成式人工智能在短短不到两年的时间内,实现了从开放式文字对话交互到文生图、文生视频,再到多模态交互的人机互动技术的飞速突破,其发展速度远超人类对其的思考与应对速度。这种强烈的不确定性和未知性,促使人类愈发重视人工智能的迭代及其引发的社会变革。教育,这个历来被视为慢变量且最为稳定的领域,如今却被广泛认为是最直接、最快速受到人工智能影响乃至冲击的领域之一。因此,秉持理性开放、客观严谨的态度,结合唯物史观视角,审视和分析人工智能与教育变革的真实发展水平,以及二者之间的内在关联和作用机制,将为人工智能赋能教育高质量发展提供基础性的观点和视角。二、理性看待当前生成式人工智能发展的水平以ChatGPT为代表的生成式人工智能凭借其强大的自然语言处理能力,通过开放式对话的方式完成信息检索、问题解答、内容创作、代码生成等复杂任务,其能力越发接近人类智能,甚至是对人类智能的扩展和部分替代。目前的“智能涌现”得益于数据的丰富、算力的提升、开源环境的活跃和多模态大模型的优化等的共同推动。但究其本质,它并不是一个新技术,仍然是人工智能发展过程中的阶段性产物,尚未在技术层面上发生突破性的质变。人工智能发展的历史虽然不长,但如果要客观评估当前人工智能发展的真实水平和未来趋势,需要将当前技术爆发的奇点置于人工智能发展历史和科技革命的脉络中去思考,才能勘破人工智能对教育的影响与挑战。(一)人工智能发展的三个阶段1950年,著名的图灵测试标志着人工智能的伊始。1956年,达特茅斯会议正式提出了“人工智能”这个概念,标志着人工智能学科的诞生。历经近70年的发展历程,人工智能学科内部的研究领域经历了多次分化与融合。在历经了因应用不充分、算力受限以及资助匮乏所导致的两次著名的“人工智能寒冬”之后,如今,该学科再次迎来了突飞猛进的发展阶段。按照智能程度来划分,可将人工智能分为计算智能、感知智能和认知智能三大阶段。第一个阶段是计算智能(Computational Intelligence)阶段(1950年—2000年),即机器对信息进行存储和计算。第二个阶段是感知智能(Perceptual Intelligence)阶段(2000年—2021年),即机器通过传感器捕获到物理世界的信号,理解一些直观的物理世界,高效地完成“看”和“听”的相关工作。第三阶段是认知智能(Cognitive Intelligence)阶段(2022年至今),即机器具备了像人类一样的思考和学习能力,并且能够自主做出决策并采取行动。这一阶段主要是以ChatGPT的发布为标志。但科学界普遍认为,人工智能尚未到达到这一阶段,目前仍处于探索初期。(二)人工智能发展的三个趋势在人工智能发展的历程中,主要存在两条路径:一条是通过符号推理,以模型学习驱动的数据智能,称为“符号主义”(Symbolicism),主张人工智能应该模仿人类的逻辑方式获取知识。另一条是通过神经网络,以认知仿生驱动的类脑智能,称为“连接主义”(Connectionism),奉行基于大数据和训练学习知识,主张模仿人类的神经元,用神经网络的连接机制实现人工智能。在人工智能发展的历程中,符号主义与连接主义两大流派经历了兴衰交替的过程,每次的兴盛都是不同的技术路线和发展模式发挥了重要的推动作用,不仅塑造了人工智能的理论基础和技术实现方式,也反映着科学家们在理解和模拟人类智能方面的不懈努力。随着人们对人工智能认知的成熟度越来越高,“连接主义”的发展路径进步速度将会越来越平缓,而“符号主义”将会再次兴盛。即便是连接主义的代表人物杨立昆、李飞飞、Geoffrey Hinton等人也都表达过当前的技术路线无法制造有感知能力的AI的观点。基于此,本文初步判断人工智能未来发展有以下三大趋势:一是从认知大模型向多模态大模型演进。传统的AI模型专注于处理来自单一模态的信息,主要侧重于理解和生成自然语言。而多模态大模型可以处理文本、图像、音频、视频和代码等多种数据类型,以促进内容合成任务的完成并整合多种信息源。人类智能和学习进化是天然多模态的,人拥有眼、耳、口、鼻、舌、肢体,人工智能的学习也可以更加还原人类学习多感官触发的真实情境。二是从通用大模型向“大小联动”深化应用。AI模型的算力增长、算法效率优化呈现新“摩尔定律”,模型性能随着模型规模、数据规模和算力规模等因素的增大而提升,呈现出幂律分布的特征,已成为大模型走向行业深度应用、创造价值的实际阻碍。小模型可以通过知识蒸馏从大模型中学习。同时,小模型又可以反哺大模型,提升大模型的训练精度。因此,大小模型协同联动,才是降低训练成本和应用成本,提升灵活性、适用性和效率的有效方法。三是从语言智能到具身智能(Embodied AI)实体转向。在现有的大模型应用中,多是在原有流程中嵌入AI工具,使其效率提高,并没有在底层逻辑和原生层面上产生具有创新价值的应用。脱虚向实的转向,为开发和应用拥有自主性和自适应性的人工智能体(AI Agent)提供了机会。要想创建一个能够在真实世界中工作的人工智能体,仅在文字环境中训练是不够的,必须具备对真实世界物理属性的感知能力。以GPT-4o为代表的生成式人工智能技术,不仅可以实现数字空间和物理空间的人机交互,而且还能提供情绪价值,这也表明情感计算是人工智能未来研究的重点方向之一。(三)人工智能发展的现实水平:通用人工智能与人类智慧仍有质的差别当前,人们对人工智能可以提供情绪价值、认知机制、协同价值的交互水平的惊叹,主要源于人们对它初始的预期较低,仍停留在固定、机械的机器人对话或Alpha Go人机围棋大战阶段。事实上,现阶段人工智能的真实发展水平距离通用人工智能还很远,仍与人类有很大差距,有质的差别,特别是在高阶认知和社会情感方面。朱松纯院长在2024年全国两会“委员通道”接受采访时指出,“通用人工智能的‘通用’,在学术上有特定的含义。一般来说,在日常的物理和社会场景中,人工智能要满足三个基本条件:第一,它必须能够完成无限的任务,而不是像过去那样只能完成人定义的有限几个任务;第二,要在场景中主动地、自主地发现任务,做到‘眼里有活’;第三,它要有自主的价值来驱动,而不是被动地被数据所驱动”。当前,尽管ChatGPT、Claude-3、文心一言、讯飞星火等生成式人工智能应用在国内外被公认为较为成功,但它们仍未完全达到通用人工智能的标准,也不具备与人类等值的能力。它在数据处理、记忆、基于组合的创造力、速度和精确度等基础认知方面远超人类,但缺乏人类的情感理性、价值体系、认知和推理能力以及从0到1的创新创造力。大模型在模拟真实世界方面,不管是通过外部信息编码,还是依靠内在的第一性原理(即尺度定律,Scaling Laws),都有显著的不足,表现在强烈依赖数据、模型不可解释、缺乏常识理解等方面,如果能在未来几年内解决这些问题,那么大模型的智能水平有望进一步提升,从而更好地融入社会应用。三、生成式人工智能在教育变革中的技术限度目前,生成式人工智能虽然仍属于弱人工智能,但是它的迭代速度和表现水平已经远远超出我们原来的预期。从教育的视角出发,分析生成式人工智能的技术限度,将打破以往技术发展与教育变革研究的宏大叙事或微观论证的局限性,以复杂性思维来科学分析、理性质疑人工智能影响教育的当下与未来。发展人工智能、训练大模型与教育孩子具有同构性。本文将着重以教育的要素和环节为逻辑脉络,从结构对比、逻辑对比、符号编码、内容分析、交互机理、培养模式六个方面展开论述。(一)结构对比:大模型与大脑所谓人工智能,实质上是对人脑组织结构与思维运行机制的模仿,是人类智能的物化。让人类的心智在计算系统中重现,对大脑的模拟是其中的关键。GPT-3的大语言模型已经具有1750亿个参数,GPT-4则达到1.8万亿个参数,一次的训练成本为6300万美元。在语言智能的发展过程中,模型功能越来越强,泛化能力越来越好,任务解决能力也就越强。大模型试图通过不断增加参数的数量,来实现最大可能地模拟人类大脑的神经元,以此实现接近人类智慧的复现。但人类大脑中有数以亿计的神经元,神经元之间还有连接的突触,人脑大概有800~1000亿个神经元,它们之间的连接突触数目在100万亿。神经元通过电信号相互通信,组成了复杂的网络,直至今天,人类也未完全了解其运行原理。冯·诺意曼早在《计算机与人脑》中就提出,“同样容积的神经元比人造元件能完成更多的运算,能同时处理更多的信息,记忆容量也大得多,每个神经元的准确度较低,但其综合后的可靠性比较高”。也就是说,如果人脑是有机联结的,那么人工智能就是机械联结的,其内在的丰富性和复杂度不可同日而语。按照计算机学科的发展趋势,再过几年,大模型的参数就有可能达到人脑百万亿级的规模。根据幂律定律可知,合理地分配模型参数和训练数据大小,可以在有限的预算内或者预期的计算速度内,尽可能获得效果优良的模型。但模型参数与模型智能程度不是简单的线性关系,大模型和人脑的感知、认知、推理、创新的机理并不一样。因此,一味地追求模型参数并不能实现完全模拟人类智慧的性能,也未必是大模型未来的发展趋势。(二)逻辑对比:概率推理与概念推理概率推理和决策理论为人工智能系统提供了重要的思维方式和决策依据。通过建立贝叶斯网络和使用强化学习等技术,人工智能系统能够利用过去的经验和观察结果进行决策,提高决策的准确性和效率。因此,目前基于概率推理的人工智能存在先天的技术局限。一方面,人工智能基于概率推理,人类智慧基于概念推理,二者之间有质的区别。概率推理是基于已有的信息和数据进行计算,由此获得最大的可能性。概念推理,属于形式逻辑,是基于概念——这一人类思维活动的抽象符号化产物,通过语言表示对某些实体或现象的理解、归纳或分类,反映人们对于事物的认知和理解的高阶思维形式。在计算机语言没有突破冯·诺意曼结构和二进制逻辑时,它把所有的运算存储最后都变成一种加减的关系,仍然是在低阶维度上的无限展开。生成式人工智能尚未突破概率推理的计算模式,只不过是在大数据、大算力、大模型的支撑下,加之人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)使得机器根据不确定的信息做出决定时,进行的推理实现了最大概率的可能性和最接近人类思考的结果。大模型无法运用一套算法解决各种问题,人工智能只能应对确定性指令。但人脑可以面对不同问题场景,可以同时执行不同任务,任意切换,从而应对不确定性。由此可见,人工智能目前停留在逻辑推理、概率推理、因果推理的低阶思维阶段,尚无法展现高维的人类智慧。另一方面,生成式人工智能很难突破线性的、片段的因果逻辑链,也无法根据多样性的社会文化与伦理,实时生成真实、具体的实践内容。但这并不代表它生成的内容不具有创造力,恰恰是由于缺乏逻辑体系、伦理规范的约束和实践检验而“太富创造力”,经常导致“知识幻想”的情况发生。从工程实践的角度来看,生成式人工智能完全可能会产生我们意想不到的智慧。但从知识生成的实效性来看,生成式人工智能的知识创造是通过对过去的大数据进行训练实现概率推理,仿佛是“用后视镜在开车”。麦克卢汉曾将“后视镜效应”生动地解释为“借助固有的经验解决问题的方法,透过后视镜看现在,我们倒退着步入未来”。这与人类真实的教育场景还有着本质差别。孩子的教育、人类的学习,都是在真实的师生互动或实践劳动的情境中,边行动、边建构中培养素养,是对人类智慧结晶的科学知识体系和当下现实生活中不断产生的新经验的结合。(三)符号编码:语言编码与隐性知识语言是人类特有的一种符号系统,是以语音为物质外壳,以语义为意义内容的词汇材料和语法组织规律的体系。语言本身就是一种编码。因此,教育的内容能否被编码和解码,成为“可说”与“不可说”的关键区分。1958年,迈克尔·波兰尼在《人的研究》一书中最早提出,人类的知识分为显性知识和隐性知识(也称缄默知识)两种,通常被描述为知识的,即以书面文字、图表或数字公式加以表述的,只是一种类型的知识;还有一种知识是不能系统表述的,像我们在做某事的行动中所拥有的知识。他指出,与显性知识相比,隐性知识的重要特征在于:第一,就是能通过语言、文字或符号进行逻辑的说明;第二,就是不能通过学校教育、大众传媒等进行传递;第三,不能加以“批判性反思”。由此可见,以自然语言理解与处理、机器学习为核心的人工智能的发展,其核心在于可编码、可建构逻辑的语料及其数据信息。大语言模型的智能正是基于语言文字可以被记录、编码、传播的显性知识,但作为另一种类型存在的隐性知识却被忽略了。因为各种类型的编码在内涵表达和意义建构上都具有一定的局限性,文本表达的有限性限制着多模态大模型的智能程度的发展,由于多次编码及其转化会使信息多重过滤和衰减。正如维特根斯坦所言,“语言给思想穿上了衣服,从这件衣服的外表形式人们不能推断出它所遮盖的思想的形式”。语言是人类思维和交流的工具,但语言的表达能力是有限的,无法完全捕捉和描述现实世界的复杂性。语言既是思维的脚手架,也是思维的桎梏。而在人类的学习和进化发展中,往往是隐性知识所占比例更大,意义更为重要,也更具挑战性,如分辨光谱上的颜色、用手感觉材料的颗粒度等非语言类的知识与技能。人工智能面对原理类知识、程序类方法、价值类知识的力不从心;面对生成性教学、情感性教学、实践性教学的无能为力。这类知识和教学不易“言传”,更适合“身教”,只有在做中学,在丰富、复杂、精密的多感官互动中学,才能在身、心、脑、体之间建立真正的联结。另外,即使把经验用语言文字表达出来,但对于接受者来说,它也失去了大部分情境信息和背景信息。当接受者以自己的角度来理解时,它已经丧失了所有的精微之处(相对于表达者而言)。因此,以大语言模型为底层核心技术的人工智能,其实只是注入了人类可以用语言文字或者其他符号编码、计算的显性知识,其基于自监督的语言模型无法获得关于真实世界的知识,其本质是“压缩”。(四)内容分析:海量数据与高质量数据尽管科学研究领域和市场行业人员对于人工智能领域的诸多问题尚未达成明确的共识,但对数据质量是下一阶段大模型能力涌现的关键似有共识。在大模型的生产关系中,数据是生产资料,算力是生产力,算法是生产工具。以ChatGPT为代表的生成式人工智能是劳动密集型、技术密集型和资本密集型技术与产业的结合。原因就在于绝大部分的算力都用在预训练上,主要用于数据收集与清洗;除此之外,细颗粒度、高质量的数据标注也是人力集中的重要工作,而大量的基础工作都是为了高质量数据的获取。关于数据量(Training Tokens)和模型参数量(Parameters)对于模型的影响,OpenAI于2020年曾通过扩大模型参数的方式,提升了大模型的智能水平。但最终被DeepMind得出的结论改变,即在有限算力资源的情况下,更多、更好的训练数据比一味提升模型参数规模更重要。在我们的传统认知里,普遍认为我国在人工智能发展的新浪潮中具有海量数据的比较优势。但现实并非如此,特别是在教育领域里,高质量的可用数据问题更为突出。虽然我们有着全世界最大规模的教师和学生数量,并且他们还会在日常的教育教学管理中源源不断地产生新的数据,但实际上目前可用的高质量数据主要来自书籍、新闻、科学论文等静态沉淀的专业文本。这些数据对于大模型的优化和深化应用,如从大模型走向行业垂类模型,是远远不够的。因为互联网可获取的免费公开数据缺乏深度和精度,无法满足专业性强、精准度高的教育垂类模型。虽然我国已经拥有了海量的教育大数据,包括多模态的教学数据,但其中高质量、结构化、可计算的有效数据并不多。主要问题在于,数据标准不全面和不统一、数据采集覆盖面窄、模型构建专业性不足、应用服务单一机械(主要聚焦于适应性教学、题库类)、开放共享尚未形成和隐私保护有待完善等。特别是教学环境、教学过程中的标准和数据,这些标准的缺失都极大地限制着教育大数据的发展和积累。因此,挖掘已有数据背后的价值,加强未来数据管理,明确行业标准,建立数据使用规则,确保大模型训练有充足、准确的专业数据,才是生成式人工智能赋能教育的基本前提。(五)交互机理:强化反馈与教学互动在信息处理上,基于人类反馈是大模型“智慧”提升的关键所在。人类反馈强化学习是生成式人工智能领域的新训练范式,它通过人类反馈来指导智能系统的行为。过去几年,各种大语言模型(Large Language Model,LLM)根据人类输入提示(Prompt)生成多样化文本,主要是依赖上下文的逻辑和概率推理,因此,存在一定的偏误性。但通过RLHF,在一般文本数据语料库上训练的语言模型能和复杂的人类价值观对齐,让生成式人工智能更具“人性化”。正是人类智慧的反馈与调优,使得人工智能更接近人类智慧。课堂教学也是一个有目的、有方向的、完整有序的复杂信息传递系统,教学反馈作为贯穿教学过程的必要环节,教师可通过时时反馈以调整优化教学策略,从而适应学生的学习行为。对于教学反馈而言,准确性、针对性、指导性、激励性、适时性、多样性、交互性是其核心特征。由此可见,教学反馈与RLHF具有同样的执行机理。(六)培养模式:多模态输入与全面发展在信息输入上,多模态的信息类型是输入有效性和丰富性的前提条件。通过结合不同类型的数据,大模型可以更好地理解和预测复杂的现实世界问题。目前,大多数模型都是通过训练单独的模块,将不同模态转化为语言文本,然后将它们拼接在一起以达到近似多模态,不足之处在于没办法在多模态空间进行深层复杂推理。而原生多模态则在技术上更进一步,具有处理不同形式数据(语言+听力+视觉)的能力,一开始就在不同模态上进行预训练,利用额外的多模态数据进行微调以提升有效性。正如教育领域中的具身学习理论,基于视觉、听觉、感觉、触觉等多感官的信息输入和学习者、技术、环境三者之间多模态交互的学习环境,实现大脑多区域的激活,通过深度学习的发生以达到最佳的学习效果。对于大模型的训练亦如培养模式的价值取向,即选择素质教育还是应试教育的问题。如果选择单一维度、单一模态的“刷题”强化训练,大模型在某些方面的智能会在短期内快速提升,但很快到达瓶颈。如果选择全面发展、多模态的素质教育,那么大模型的迭代速度较之前者会慢一些,但是智能程度的上限则会更高。因为通识是专识的基础,恰恰先发展通用认知能力,才有可能发展专业认知能力,大模型也是如此。教育领域更要谨防高分低能的“书呆子”大模型进入应用市场。四、以人工智能撬动教育变革人工智能不仅是科学问题,也是教育问题,更是社会问题。如果人类文明想要传承发展,那么主动面对人工智能是我们必须走出的一步。但总体而言,人们对于人工智能的影响,存在高估短期效果、低估长远效果的倾向。因此,必须从当前采取措施,客观理性地看待人工智能的发展并作出研判。当下,第三波人工智能的兴起不是来自学术界,而是来自企业界的催促和市场化的倒逼。从本质来看,这并不是人工智能领域发生了新的技术突破,而是随着教育数字化的普及和转型,时代发展的必然趋势和旺盛需求所催生的结果。(一)人工智能对教育的影响从长远来看,人工智能对教育发展的影响,应优先重点考虑以下三个方面:一是价值理性。今天的教育者或许无法精准预测未来复杂交织的影响因素,特别是人工智能这个正在巨变的因素,促使群体智慧、人工智能、社交网络对人们决策的影响更为深度地融入了我们的生活。人工智能的能力主要来自人工智能学习的人类大规模数据,数据中有能帮助我们解决问题的关键线索和事实,也有人类社会中的偏见、歧视、敌对和仇恨。人工智能在没有伦理安全、道德框架约束时,学习人类数据的同时也学习了人性的弱点,人工智能向人类提供服务时,也潜移默化地隐含了偏见等。因此,有意识地培养受教育者形成适应未来社会的价值观和是非判断能力,使其无论面临多么复杂难测的境遇,都能用坚定的价值理性作出独立判断,并妥善地加以应对。二是伦理道德。要重视建构机器智能高度发展后的社会伦理道德体系。目前,人工智能大模型在未来扮演的角色主要是三种:工具、伙伴或者敌人,不同的社会文化对它的定位也不尽相同。日本的“人工智能原则”强调,未来人工智能可能扮演社会的准成员,甚至是人类伙伴的角色;并规定,如果未来AI发展到准成员或人类伙伴阶段,它们需要遵守人类社会的伦理道德规范以及为人工智能制定的伦理道德规范。而在西方科幻电影和小说中,人工智能扮演了很多反派角色,是人类的敌人。人工智能大模型在未来究竟扮演何种角色,如何与人类和自然和谐共处,更好地辅助人类,都应率先思考。碳基生命的奥秘解密和在此原理基础上建立的人造智能体(硅基生命)是否会演化成为具有自主价值和生命成长性的机器体,也应该成为未来人工智能关注的方向。我们应该持有开放的态度,坚守人工智能为人类社会发展服务的初心,将其建立在人类伦理道德规约之下。同时,人类伦理道德体系也须随着文明形态的变化而实现相应的进步。教育的首要责任就是通过培养未来社会的合格公民,为建设面向智能社会的伦理道德体系发挥重要作用。三是人才培养。在未来的智能社会中,人工智能体与人类、自然、社会是否能够和谐共生,不是取决于人工智能,而是取决于人类对待人工智能的认知与态度是否能够加速演化。因此,教育要转向对受教育者创新思维等高阶能力的培养。未来社会需要大量具备人机协同能力的高水平人才,创新思维、计算思维和情感能力等高阶能力将成为人类的关键竞争力。为了应对人工智能时代新的挑战,各国应重新审视学校教育体系的价值,反思应“培养什么人”以及“如何培养”的问题。人们认识到,与以往任何历史时期相比,当下都更需要凸显人的价值和凝聚人的力量,以抵御不安和恐惧,区分人与机器、人与人工智能的差别。面对充满不确定性的后真相世界,教育不应只关注教会学生什么,而应帮助他们摆脱“工具人”,塑造“完整人”,激发他们的主体性和内驱力,培养他们独立思考和可持续发展的自主学习力。“五育”并举,全面发展,都与人的情感紧密相关。因此,培育机器智能无法具备的社会情感等是未来教育的关键内容和目标。从中短期来看,人工智能给教育带来了六个方面的影响。一是影响培养目标。为应对人工智能带来的长远挑战,教育要根据未来社会需要调整人才培养目标,以发展学生的核心素养为导向,培育学生终身发展和适应社会发展所需的正确价值观、必备品格和关键能力。二是影响学习方式。人工智能可以助力实现个性化的学习路径,提供智能化助学辅导,还可以通过虚拟现实技术和增强现实技术为学习者营造更逼真的学习情境,模拟那些无法在真实世界呈现的科学实验,等等。三是影响教学方式。通过人工智能,人类可以消解大规模教学和因材施教在实践中的两难困境,兼顾促进教育公平和提升教育质量,促进实现更好的教与学。四是影响师生关系。以前教师是课堂上的学术权威,而现在的学生使用ChatGPT、Sora等工具,即时获取的知识可能比教师能提供的还多。当师生关系不再单纯围绕知识传授而构建时,如何更好地发挥引导、激励和示范作用,如何重新诠释言传身教、保持师道尊严,对教师来说是一种挑战。五是影响教育内容。教材中的机械记忆内容将大幅度减少,给深度学习、认知创新和实践性学习留出了空间。另外,要注意防范通用人工智能潜在的意识形态风险。预训练数据蕴含的意识形态偏向将潜移默化地影响受教育者。六是影响教育管理。教育管理中的人工智能应用已相对成熟,技术促进了教育管理高效化、精细化、科学化,在我国各地已形成诸多优秀案例,积累了丰富经验。同时,还需要继续探索教育管理数据的集成应用,提升数据治理水平,并加强数据安全监管。(二)教育如何积极应对人工智能的挑战当下,生成式人工智能的诞生,已经将技术作用的对象从人的体力向人的脑力转移,从人的身体向人的智慧、意识延伸。人类作为主体性存在的独有特征——思维方式都将受到挑战。我们必须重新思考教育,使其向促进人类意识的觉醒和技能的提升转型,以此维护人类的价值与自由。当前,生成式人工智能依靠数据驱动的实现方法是不是最优路径,有待进一步确认。大模型基于概率推理的天然技术缺陷和资源损耗的制约,一味地追求参数的增多及模型变大是没有价值的。当数据驱动的红利消耗殆尽时,是否存在第三条道路,是否会产生新的研究范式或技术路线。对此,我们应该持有质疑和理性的态度。从大处着眼,从小处着手。在教育生态体系的复杂元素中,从以下三个问题入手最为紧要,也最具指导意义。第一,当我国传统教育优势将被人工智能大幅削弱时,更应注重学生哪些素养与能力的培养?第二,随着生成式人工智能技术的发展,如何处理新型的师生关系?第三,人工智能改变了知识生产和传播的方式,在此背景下,教学模式与教育信息化时代有何质的不同?1.注重学生的高阶思维培养人工智能时代,育人目标和模式从知识本位、学科本位走向素养本位,即查即用类知识的习得将更多由人工智能辅助完成。学生接受的不仅仅是海量的确定性信息,更是真假难辨、良莠不齐的生成式内容,这对提高学生的数字素养与技能这一未来必备的基本素养提出了要求。如果说信息化时代,我们要求学生要有发现问题和解决问题的能力,那么人工智能时代,我们则要求学生具有提出问题的能力,甚至要提出有质量、有逻辑、开放性的问题。提出好的问题,才是人类与人工智能良好协作的开始。目前,生成式人工智能生成的内容大概是人类常识的均值水平,如果想让它接近或达到峰值水平,则需要良好的提示词(Prompt)。这其中就蕴含了比较、分析、应用、迁移、综合、评价等高阶思维,而传统的记忆、检索、计算等初级思维则逐渐被人工智能替代。科技将人的一部分功能强化、延伸,就会相应地导致另一部分功能的弱化、萎缩,造成人类智慧懒惰(Intellectual Laziness)。脑神经科学和相关实验多次证明,历史上的技术和工具在不断地塑造着人类的大脑,脑神经元之间的突触连接会根据我们的思维习惯重新组合,互联网时代让信息过剩、生成式人工智能让知识不断创造,但是人类的思考会变得浅薄。互联网和多元刺激的富媒体可以让大脑的前额叶区不断兴奋,但是负责深度思考的海马体却在此过程中未被激活,这就会鼓励人类个体的智慧懒惰,因为好奇心和探索的愿望是需要鼓励和奖赏的,而“走捷径”是人类与生俱来的本性,这可能会使人类经历集体降智。当下,人工智能给我们带来的巨大威胁并不是代替人类的工作,而是人类会陷入人工智能的强大功能“陷阱”,习惯于机器提供的解决方案,而放弃自主思考。人类一旦习惯了轻松获得,不再进行独立思考,完全把思考交给机器,交给人工智能,那将是对人类最大的威胁所在。因此,教师需要回归教育初心,擅用互动启发式教学法,更加注重师生之间、生生之间的问答互动,重点在于学生的思维发展、情感发展与道德发展,而不仅仅是课堂教学流程上的效率提高或者教学内容的容量增大,避免其误用导致教育内卷的加剧。这就要求教师不断提高数字素养与技能,了解生成式人工智能的内容生成和输出的基本原理,在教育教学中客观理性地对待和适度应用。当下,我们再谈“互动启发式教学法”,是智能时代对教学法的一种复归。这是对中西方教育理念的一种创新性实践。苏格拉底提倡的“问答式”教学,是指他在教授某个知识点时,并不是直接告诉学生,而是先向学生提出问题,让学生回答,如果学生回答错了,他也并不直接纠正,而是提出另外的问题引导学生思考,从而一步步地得出正确的结论。苏格拉底将其称之为“产婆术”,其教学法则是为思想接生,是引导人们产生正确的思想。孔子在《论语·述而》中的“不愤不启,不悱不发。举一隅不以三隅反,则不复也”,强调了其启发式教学的思想和方法。朱熹在《论语集注》中对此解释为“愤心求通而未得之意,悱者,口欲言而未能之貌。启,谓开其意。发,谓达其辞。”在朱熹看来,愤悱之境是认知水平,而启发则是开意达辞的方法。简言之,我国优秀传统文化中的启发式教学,更注重在学生主动思考的基础上进行问答式的教学。当生成式人工智能走进教育现场时,融合中西文化精髓的“互动启发式教学法”,更加注重“启”和“互动”,即通过师生双向有效提问的互动方式,启发学生进行深度学习,培养学生的高阶思维。其特征是问题化、强交互、强反馈,只有真正触发学生深度思考的问题并及时给予正向反馈,才能刺激大脑皮层,促进大脑活跃。而当学生完成某个预期目标后,大脑会产生奖励系统,同时分泌多巴胺、去甲肾上腺素、内啡肽,让学生从精神上感受到愉悦和快乐。学生自主学习的真正发生,是脱离物质奖励和功利目的的单纯的学习专注,具体包括三个特点:第一,教师的启发工作必须建立在学生积极思考的前提下,学生的思考可以通过学生提出问题的方式来体现;第二,从传统课堂教学中的教师单向提问为主,转变为多主体交互、多轮次问答的师生、生生教学互动;第三,教师的教学设计目标要合理,遵循“最近发展区”原理,并强调及时的正向反馈。互动启发式教学法并不是某一种具体的教学方法的代名词,而是一种教学理念,一种教学的指导思想,它可以体现为一种教学方法,也可以是多种教学方法的整合。2.着力构建新型师生关系教师如何适应新型教学关系中的角色,教师如何开展人机协作教学,以及如何关注师生的数字道德问题等,都是构建新型师生关系的重要内容。通过将优秀教师的素质结构进行解构,并将这些素质通过预训练模型赋能机器,力求打造与优秀教师“同质”的虚拟教师。传统“以教为主、以师为主”的师生关系会被弱化甚至消失,同时“以学为主、以生为主”的新型师生关系会逐渐产生。单向传输的二元主体的师生关系,将转变为多向互动的“师—机—生”三元主体关系,形成新的育人生态,将“机”视为新主体的原因就在于,其智能性、交互性的不断发展迭代了传统机器教学的机械化、程序化。教师将从“知识的守门人”转变为“学习的编舞者”。首先,应更加注重对学生情感、态度、价值观的引导。未来新型的师生关系需要更具有情感性和互动性,未来的人类教师需要学会和机器共处,让“机师”为我所用,需要更具有亲和力和共情力,能够走进学生的心灵世界,需要将教育变成“艺术”。其次,逐渐成为知识生产者、学习促进者和成长引导者。教师将越来越起到导师般的作用,引导学生寻找正确的学习目标、科学的学习方法与高效的学习路径,提醒或约束他们形成自律的学习习惯,为学生的综合实践与社会体验提供情感支持。让人师与“机师”的协作在各自优势发挥的基础上充分展开。人师的优势主要包括对学生社会情感能力的支持,教师自身的世界观、人生观与价值观对学生的影响与塑造,对不同领域的知识进行跨学科交叉融合的能力等。智能技术相比以往信息技术所特有的智能优势,可以解决学习者学习需求差异化的识别困境、认知障碍内隐性的辅助困境和学习路径多样化的适配困境,使得精准教学的实现成为可能。因此,“机师”的优势在目前主要集中于知识的大量储备、近乎无限量的计算和对解决问题范式的记忆,并且在交互过程中永远“耐心”且个性化地对待每个学生。3.创新探索智能时代教学模式的变革如何科学认识当前人工智能技术的发展及其对教育的影响,需要教育界进行深入研究。目前的技术还没有成熟到可以系统、全面、准确地应用于教学当中,过度强调人工智能技术在教育教学微观环境中的应用,恐怕还为时尚早。教师首先要认识到当前技术的局限性。相对于人类智慧而言,生成式人工智能目前并没有关于“能力界限”的判断,对于无法回答的问题,它会依据概率给出答案,这其中可能往往包含着错误信息。师生都需要安全、有效和恰当地使用人工智能,教育应帮助每个学生为用好生成式人工智能技术或未来其他技术做好准备。在这种情况下,教师应该注重引导学生加强对生成式人工智能技术的本质认知与初步应用,强调在理性判断的前提下与新技术“接触”。再者,人工智能教育较之教育信息化教学,有着质的差别。在教学中,师生与生成式人工智能的思维链式对话是与过去的计算机辅助教学和使用数字化教育资源平台等完全不一样的体验。它在教育主体、资源供给、内容生产、交互方式上都有质的不同,但并不是在教育教学流程中某个环节的效率提高、某个资源的供给丰富,而是在教育信息化基础上的一次迈向教育数字化、智能化的系统性跃迁,是驱动教育在底层逻辑上的创新和对教育本质的更好实现。例如,教师在教学过程中,可以通过生成式人工智能技术产生一些必要的图文故事或视频等内容开展探究活动,提升其教学设计能力与教学组织能力,增强课堂互动性,但并不是把新技术作为一种主要教学手段。人工智能技术是深化教育数字化转型中的过程性路径和重要的驱动力,因此,要加快数字时代的教育新形态“五新”体系的转型与应用,它蕴含公平、包容、可持续、终身化的教育理念,塑造“人人皆学、处处能学、时时可学”的高质量个性化终身学习体系;构建以数据驱动大规模因材施教为核心的教学模式;创新素养导向、能力为重的教育内容;推进管理精细化、服务精准化、决策科学化的教育治理。通过智能技术突破现有路径依赖,真正系统性地赋能教育变革,实现教育高质量发展。来源|《电化教育研究》2024年第8期作者|王学男(1984—),中国教育科学研究院数字教育研究所副研究员,博士,主要从事教育学原理、教育政策研究。李永智为通信作者,中国教育科学研究院院长。(免责声明:本文转载于《中国教育科学研究院官网》,版权归属于原作者,文中观点与本栏目无关,如涉侵权,联系立删!)

刘建达 等:乡镇英语教师测评素养调查

2024-09-10

原创 中国考试 中国考试 2222024年08月26日 16:57 北京引用格式:刘建达, 崔婷婷. 乡镇英语教师测评素养调查[J]. 中国考试, 2024(8): 51-59.作 者刘建达,男,广东外语外贸大学外国语言学及应用语言学研究中心教授。崔婷婷,女,广东外语外贸大学外国语言学及应用语言学研究中心在读博士生。摘 要:建设教育强国和高质量教育体系要求教师具备良好的测评素养。调查乡镇教师测评素养现状,探寻乡镇教师测评素养发展路径,对提升乡镇学校教育教学水平具有重要意义。本研究采用定量和定性相结合的方法,通过问卷调查、访谈调查、课堂观察和文本分析对粤西地区乡镇英语教师的测评素养状况进行调查研究。结果表明,乡镇英语教师的整体测评素养较为欠缺,亟须从沟通测评结果、制定评分标准及评分程序、评估题目质量、开展课堂评估、提供促学反馈等方面加以提升,建议从加强培训和增强备课科组的测评意识等方面逐步提高其测评素养。关键词:语言测评素养;乡镇学校;英语教师;语言测评活动2020年,中共中央、国务院印发《深化新时代教育评价改革总体方案》,强调应重视结果评价,强化过程评价,探索增值评价,健全综合评价[1]。《义务教育英语课程标准(2022年版)》指出,教师应落实“教—学—评”整体育人观念,将教学评价贯穿于教与学的全过程[2]。相关要求表明,教师应具备较高的测评素养,承担起教学者和测评者的双重角色[3]。教师应明确评价的作用与原则,根据评价目标选择合适的评价内容与评价方式,充分发挥评价促教促学的功能。然而,相关调查发现,乡镇教师面临个体评价精神封闭、课堂评价文化失落、评价政策传达失语、评价课程培养缺位等问题[4]。在这种情况下,教师即便意识到评价的重要性,也难以将以评促学的理念落到实处。基于这一问题,同时也是为了贯彻国家“十四五”规划提出的“深入实施乡镇教师支持计划”的要求[5],开展乡镇教师测评素养现状调查,探索其测评素养的提升路径,具有重要的现实意义。有鉴于此,本研究以英语学科为例,对粤西地区乡镇教师测评素养状况开展调查研究,以期为后续研究和全面提升乡镇教师测评素养提供借鉴与参考。一、语言测评素养研究回顾1991年,Stiggins提出测评素养(assessment  literacy)的概念[6]。从此,不断有学者对教师测评素养进行系统性研究[7-8]。近10年来,教师测评素养更成为测试与教学领域的关注热点,相关研究主要集中在测评素养的构成[9-10]、测评素养测量工具的开发与验证[11-12]、教师测评素养的现状[13-14]、教师测评素养的发展路径[15]等方面。有学者认为,教师测评素养包含教学内容知识、测评原理、测评技术知识、测评实践技能、测评理念(包括认知和情感因素)、实践语境等[16-17]。语言测评素养(language assessment  literacy)则具有语言学科的独特属性[9],与教师的语言知识紧密相关,同时具备建构性、交互性和应答性等学科特征[18]。在内涵界定的基础上,人们试图开发教师测评素养测量工具,其中影响力较大的包括课堂测评素养列表(Classroom Assessment Literacy Inventory, CALI)[19]、语言测评素养培训需求问卷(Assessment Training Needs of LanguageTeachers)[20]、利益相关方测评素养问卷(Language Assessment Literacy Needs of Different Stakeholder Groups)[21]等。国内外有关研究表明,一线教师普遍存在测评概念理解模糊、测评结果解释能力不足、测评实践能力薄弱等问题[22-23]。专项培训是提升测评素养的有效途径,但其效果受培训周期、培训大纲、任务设计等因素的影响[24];掌握现代技术有助于实施有效评估和反馈[25],参与命题和题库建设等相关的测评活动以及对测评实践进行积极反思均有助于提升测评素养[26-27]。国外的有关研究起步较早,也为国内教师测评素养研究搭建了初步的理论框架和研究范式。目前,国内有关理论研究以通过书评引介新理念[28-29]和述评国内外教师测评素养研究为主[30-32],实证研究则以调查本土教师(主要为高校教师)的测评素养现状为主。相关研究表明,我国外语教师的整体测评素养处于初级水平,存在分数解释能力差、不善于根据教学目标选择合适的测评任务、难以提高学生在课堂评价中的参与度等问题[17],教师的评价意识和评价反馈质量也有待提升[33-34]。随着教师测评素养内涵的不断拓宽,有关研究重点关注的测评场景(assessment context)也逐渐从标准化测试转向形成性评价和课堂评估[14, 35]。从社会文化的视角出发,对不同文化背景、教育环境和测评场景下的教师测评素养进行本土化研究也在不断地为教师测评素养赋予新的内涵[36-38]。然而,国内现有研究对象的覆盖面不足,缺乏对不同学段和不同地域教师测评素养的现状调查与需求分析;同时,研究方法以量化为主,缺少实地质性研究,所采用的理论框架多为先验性框架,未必能切实反映实际情况[7]。因此,本研究拟采用问卷、访谈、课堂观察和文本分等多种方法探究以下问题:1)我国乡镇英语教的测评素养现状如何;2)乡镇英语教师的日常言测评活动有哪些;3)如何有效提升乡镇英语师测评素养。二、研究设计与方法(一)调查对象本研究于2021年11月至2022年2月开展,研究对象选自粤西地区的16所乡镇学校。124名英语教师参加问卷调查,其背景信息见表1。6人(包括英语教研组组长A、英语教师B与C、教务主任D、校长E和教育局教研员F)接受半结构化访谈,3名不同年级的英语教师接受课堂观察并提供教学材料。(二)研究工具采用问卷法、访谈法、课堂观察法和文本分析法对教师的测评素养现状及问题进行探究,借助SPSS25和Nvivo10软件对量化数据和质性数据进行分析。1.调查问卷问卷分为两部分:第一部分为背景信息调查,第二部分编译自CALI。CALI包含7个素养标准,每个标准下设5道题目,共35题。题型为多项选择题,教师需选择一项正确答案。本研究保留CALI框架与核心概念,但对情景、人名、知识内容进行本土化改编,使其更适合乡镇中学英语教学情景。由于问卷为多项选择题,故采用KR-20公式对其内部一致性信度进行检验,得出r=0.56,略高于Mertler将其用于在职教师测评素养研究的信度[39]。由于问卷包含多个维度,故采用McDonald’s omega信度检验方法[40-41]再次确认其信度,得出ω=0.898>0.8,说明具有较好的信度。2.课堂观察量表CALI主要聚焦测评理论和测评知识,具有一定的局限性,未能很好地体现语言测评素养对形成性评价的要求[42]。为更翔实地刻画乡镇英语教师的语言测评素养现状,课题组还改编了赵雪晶开发的教师测评素养观察量表[43],对英语教师在课前、课中和课后的评价活动进行观察,其中课前观察为重点。课前测评活动包括明确测评目标和制订相应测评计划。课前观察关注教师在授课前能否运用自评量表、测评任务等工具进行一定的学情诊断、选用的测评任务的质量是否过关等。课中测评活动主要包括介绍学习目标和测评目标、收集测评信息、提供测评反馈。课中观察重点记录教师在教学过程中收集学生学习信息的方式,如课堂观察、口头提问、随堂小测、同伴互评等。在观察提供测评反馈的情况时,重点关注教师如何向学生提供反馈、如何解释评分标准、如何反馈考试结果等。课后的测评活动主要包括作业布置、作业批改和试卷批改。课后观察主要关注教师布置作业的类型、质量及作业批改方式(如提供原始分数、等级分数或书面批语等)。3.半结构化访谈访谈话题聚焦日常教学,在明确常见测评场景(如布置作业、命制周测、修改作文等)后,围绕“在测评中遇到的困难”和“自身有何培训需求”两大主题展开,并根据回答进一步追问。对访谈内容进行文本转写后,依据扎根理论,对基础数据进行编码和归纳分析,提炼出教师常见的测评场景和测评困难、主要培训需求及提升培训积极性的方法。三、结果与讨论(一)问卷调查结果本次问卷调查共回收有效问卷113份,回收率为91.12%。数据分析表明,粤西乡镇英语教师的整体测评素养得分均值为12.92分,仅为满分(35分)的36.91%,测评素养总体上较为薄弱,详见表2。江进林曾对250位高校英语教师的测评素养进行诊断,得分均值为16.71分,为满分的47.74%,据此认为高校英语教师测评素养偏低[13]。相较之下,粤西乡镇英语教师测评素养的缺失则更为严重。为探究粤西乡镇英语教师的测评素养在不同维度上是否存在显著差异,课题组首先对相关英语教师在第一至七项素养标准上的得分结果进行方差同质性检验,得出F(6,782)=3.47,p=0.002,故采用Kruskal-Wallis检验探究各项素养标准的得分是否存在统计学上的差异。数据分析结果显示,H(6)=70.98,p=0.000,表明英语教师在7项素养标准上的得分存在显著差异。为进一步探究哪些素养标准的得分存在显著差异,课题组进行了事后分析(post-hocanalysis),检验7项测评素养标准得分的平均值在成对比较中是否存在显著差异,见表3。结合表2的数据分析可以看出,教师在素养标准三(实施测试、评分,并解释分数)上得分最高,显著高于在素养标准一、素养标准四、素养标准五和素养标准六上的得分;教师在素养标准四(运用测评结果评估学生、规划教学、开发课程等)、素养标准五(开发有效的评分标准)和素养标准六(向学生、家长或相关人员报告测评结果)上则得分较低。其中,在素养标准六上得分最低,显著低于除素养标准五以外的其他素养标准的得分;在素养标准五上的得分则显著低于素养标准三和素养标准七的得分。以上数据分析表明,粤西乡镇中学英语教师尽管具有一定的测评实施和评分能力,但在运用测评结果进行决策、对分数进行解释报告以及制定测评标准等方面的能力非常薄弱,而按照《中学教育专业师范生教师职业能力测评标准(试行)》中关于教学评价能力的相关要求[44],这些能力恰恰是不可或缺的。此外,课题组以性别、教龄、年龄和是否接受过语言测评培训为自变量,探究其对教师整体素养水平的影响。数据分析结果显示,各组得分不存在显著差异。鉴于CALI的局限性,为更翔实地刻画教师在日常测评活动中体现的测评素养状况,课题组选取3位不同年级的英语教师,针对其课前、课中和课后的测评活动进行观察,发现3个主要薄弱点。第一,在课前阶段,3位教师未能很好地确定评估目标并制订有效的评估计划。例如,由于教材内容较多,七年级教师A难以把握教学重点,加之对PPT制作较为生疏,其教学安排、教学目标和评估目标多参照网上课件资料。相比之下,九年级老师C较为年轻,善于制作PPT,但通常不会列出教学目标和评估目标。八年级教师B在授课前会列出本节课的具体教学目标和评估目标,但授课时未作解读,不利于学生课后自评。为进行课内评估,教师C经常直接从练习册中选取填空题和选择题放入课件,但由于未经改编,相关题目的质量往往不够理想。第二,在课中阶段,教师未能清晰介绍学习目标和测评目标,未及时收集测评信息并提供促学反馈。在为期一周的观察中,课堂观察、口头提问和听写是3位教师评估学生学习成果最常用的方法,学生自评和同伴互评等其他评价方式则被忽视。3位教师有时会提供书面练习,更多时候则是采用口头提问的方式。回应教师口头提问的通常是坐在前排的学生,其他学生则缺乏回答积极性。另外,在一对一提问中,教师通常只关注正确答案,忽视对错误答案的反馈,如下例:教师A:You please, what is your answer tothis question?学生1:(摇摇头。) 教师A: Deskmate, what is your answer?学生2: 应该是C教师A: Is it C? Anyone else?学生3: 应该是 B,因为那个 smells fresh 一般是用来说空气新鲜的。教师A: Yes. Good! The correct answer is B.The air smells fresh. Let’s move forward to the nextexercise.第三,在课后阶段,教师批改作业时对主观题的评分较为苦恼。因学生人数多(每个班级约50人),作文批改周期长达一个月。教师B反映,很多情况下,当教师完成作文批改并将结果反馈给学生时,学生已忘记所写内容,致使作文评改效果很差。另外,虽然教师在命制日常试卷(周测、月测、期中考试等)时并没有感到困难,但命题质量不高。教师往往并不了解各类题型的命题原则与方法,尤其是选择题干扰项的设计原则和作文主题的设计技巧。选择题干扰项经常是无效干扰,作文的话题常常偏离学生日常生活,如“请你谈谈脱贫攻坚应该采取何种措施”。(二)访谈结果课题组通过课堂观察和半结构化访谈来调查粤西乡镇英语教师开展日常测评的情况。结果表明,在备课阶段,教师不太关注测评目标和测评计划的制定,而是直接进入挑选测评任务的环节。同时,被观察的3位教师也未能开展学生自评或者同伴互评。对此,他们的解释是,乡镇学生的水平不足以支持自评或互评,更何况教学安排紧张,难以实施多元化评价。教师E:(课堂评估)这些对于我们农村学校来讲,好像很难做到这个啊……可能这个大城市比较多吧,因为我们每次去听课都会有这方面的评估。教师F:我们这边是农村学校,跟大城市那边老是去培训班的(学生)有差距。教师D:因为他们好像错的地方(作文互评时)还是比较难找出来。教师E:(学生水平较低的话),我们主要是为了完成教学内容而已,时间很紧。在授课阶段,测评活动以口头提问为主,较为单调。课后的测评任务主要是批改作业和日常小测。日常教学中,挑题组卷远多于命题组卷。为此,设计培训内容时,如时间有限,应优先讲授题目质量分析方法;同时,也不能忽视测评方式的选择、考卷质量的评估、试题的命制、测评软件的使用、评分标准的设定、促学评价的实操案例等方面。正如3位教师所反映的:教师D:设计题目啊?一般都不是自己设计。我们一般都是针对性地找和这个内容有关的题目,让他们操练而已。教师E:月测的话,好像是教研室啊,校长室那边,他去外面找一些题来考。教师F:(评分标准)没有,都是个人根据自己的主观意识来判断的吧。如果是大型考试的话,我们就会商量。教师E:自评表几乎每个学期都一样。同伴评估我们没有实施过,但是我听你说了之后也觉得蛮好的。总之,粤西乡镇英语教师的测评素养现状不太理想,突出问题包括:不善于运用测评结果、不善于开发有效的评分标准、不善于向利益相关方报告测评结果。课堂观察与教师访谈显示:教师未能很好地确定评估目标,未能制定有效的评估计划,未能较好地收集测评信息以提供促学反馈;认为主观题评分难度较大,且不熟悉常见题型的命题原则。教师对学生自评、同伴互评等测评方式虽有一定兴趣,但因种种原因,态度较为保守,未曾付诸行动。(三)原因分析教学中出现这种“有心无力”的情况,原因主要有两个。第一,教师测评素养相关的课程培训供给不足。首先,教师的测评素养并未得到足够重视,未纳入教师专业素养结构,不属于教师资格证认定的必要条件,相关的职前教育或职后培训供给不足[13];其次,教师培训活动(如新教师培训、骨干教师培训等)大多聚焦纯粹的教学,极少涉及测评[22];再次,本研究显示,仅有52.5%的教师学过与测评相关的课程,且是否学过相关课程对教师测评素养水平并无显著影响,表明现有测评课程不足以帮助教师应对复杂的测评实践;最后,地域不同也导致培训资源存在差异。乡镇教师难以接触到高校等机构提供的教师发展资源,难以接触到新的测评理念和方法,也较少有系统学习过语言测评的教师或职前教师到乡镇地区任教或实习。第二,班级规模、学生水平、测评氛围等因素对教师测评素养具有重要影响。首先,班级人数多,使得教师难以在45分钟的课堂上开展分组活动或其他较为复杂的测评活动,也影响教师提供促学反馈的意愿和质量。特别是在批改作文时,若要为每位学生提供详细的批改反馈,需耗费巨大的时间精力,因此乡镇英语教师存在不愿布置作文或作文批改周期过长等问题。其次,受学生能力水平和学习态度的影响,教师认为乡镇学校的学生难以开展自评和同伴互评。最后,备课科组的测评文化也会显著影响教师测评素养的发展。访谈中,有教师表示,他们愿意开展学生自评,且课堂上采用备课科组统一制定的自评量表。但是,也有研究表明,年轻教师对在课堂上融入同伴互评等形成性评价感到焦虑,担心这会导致自己在教学进度和教学效果上落后于其他教师[45]。(四)提升路径建议乡镇教师语言测评素养薄弱,需从多方面加以提升。第一,应为乡镇教师提供针对性强的培训资源。乡镇学校教师人数少,学生人数多,课程压力重。因此,不宜大量增加教师的培训负担。可以采用信息技术,以录制短视频的形式开展教师培训,方便教师利用碎片化时间进行学习。培训主题应重点关注沟通测评结果、制定评分标准及评分程序、评估题目质量、开展课堂评估、提供促学反馈等方面。值得注意的是,掌握现代技术有助于实施有效评估和反馈[25],而乡镇学校老教师占比较大,其信息素养相对较低,应注意加强信息技术培训。针对形成性评价难以开展这一问题,应在培训中补充课堂评价的实操案例。第二,鼓励备课科组建立良好的测评氛围。教师的测评活动受所在备课科组影响较大,如学生导学案是否包含自评量表、月考作文评分是否开展双评等,很大程度上是由备课科组决定的。因此,若难以开展全员培训,可对学科带头人、备课科组长等进行先期培训。此外,引导备课科组重视测评的一个有效方法是将测评融入科研课题或教学评比。职称评定与科研成果和教学奖励有着较为紧密的关联,如将测评知识转化为科研成果或教学奖励,会有助于提升教师学习和应用测评知识的积极性。同时,引导教师积极对测评实践进行反思,为教师提供参与命题和题库建设等相关测评活动的平台和机会,对提升教师的测评素养也会大有裨益。四、结束语本研究对粤西乡镇英语教师语言测评素养的状况进行了调查研究,并提出了相关思考和建议。当然,本研究也存在一定的局限性,乡镇英语教师的样本取自粤西地区,研究结果的代表性较为有限。未来可以对我国中西部更广泛地区的乡镇英语教师测评素养作进一步调研。同时,后续可以将研究对象拓展至其他利益相关者,特别是负责选购学生试卷和配套学习材料的相关人员,要关注学生试卷和配套学习材料的质量。同时,开展城乡英语教师测评素养对比研究对于揭示影响英语教师测评素养发展的多方面因素也具有一定意义。参考文献略。

荆鹏、吕立杰​:新时代中小学科学教育的内涵特征、现实审思与赋能逻辑

2024-09-04

原创 本刊编辑部 教育科学研究 2024年09月04日 16:01 北京引文信息荆鹏,吕立杰.新时代中小学科学教育的内涵特征、现实审思与赋能逻辑[J].教育科学研究,2024(8):5-12.作者荆 鹏 东北师范大学教育学部 博士生吕立杰 东北师范大学教育学部 教授 博士生导师摘要知识经济的迅猛发展对科学教育的育人质量提出了更高、更新的要求,赋予科学教育新的时代内涵。新时代中小学科学教育作为提高全民科学素质最关键、最基础的工作,是国家创新驱动发展战略的重要支撑,具有跨域交融、知行合一、协同共育等主要特征。近年来,我国科学教育的质量和成效稳步提升,但仍面临评价导向的二维离散、人文精神的底蕴流失、数字技术的介入失衡、参与主体的人本抽离等现实问题。进行全要素、全流程、全链条的科学教育深化改革,做好科学教育的“减法”;统筹促进大科学教育格局形成,做好科学教育的“加法”,是“双减”背景下基础教育阶段一体化推进教育、科技、人才高质量发展的重要举措。关键词科学教育;科学素养;课程改革;基础教育基金项目本文为 2022 年度教育部哲学社会科学研究重大课题攻关项目“‘双减’背景下基础教育课堂形态与高质量发展研究”(22JZD047)的成果之一。目录速览一、新时代中小学科学教育的内涵与特征(一)新时代中小学科学教育的内涵(二)新时代中小学科学教育的特征二、新时代中小学科学教育的现实审思(一)藩篱与羁绊 :科学教育中评价导向的二维离散(二)分离与对立 :科学教育中人文精神的底蕴流失(三)迷思与崇拜 :科学教育中数字技术的介入失衡(四)表象与窠臼 :科学教育中参与主体的人本抽离三、新时代中小学科学教育的赋能逻辑(一)减法逻辑 :革新科学教育理念和育人模式(二)加法逻辑 :统筹促进大科学教育格局形成科学教育是提升国家科技竞争力、培养创新人才、提高全民科学素质的重要基础。党的十八大以来,借力创新驱动发展战略和人才强国战略,科学教育迈入新的发展阶段。2023 年 5 月,教育部等十八部门联合发布的《关于加强新时代中小学科学教育工作的意见》(下文简称《意见》)指出,要着力在教育“双减”中做好科学教育加法,一体化推进教育、科技、人才高质量发展。[1] 同年 6 月,教育部办公厅印发《基础教育课程教学改革深化行动方案》(下文简称《方案》),将“科学素养提升行动”列为本次课程教学改革行动的重点任务之一。科学教育作为让学生理解科学与参与科学、涵养科学精神品质以真正提升科学素养 [2] 的教育教学活动,在促进学生全面发展和推进社会主义现代化教育强国建设中可释放巨大能量。因此,厘清新时代中小学科学教育的内涵特征与实践偏狭,探寻科学教育提质增效的赋能逻辑,对促进我国中小学科学教育高质量发展以及科技强国、教育强国、人才强国建设具有重要现实意义。一、新时代中小学科学教育的内涵与特征(一)新时代中小学科学教育的内涵科学教育是发生在师生之间真实生活世界中的社会活动,不应将其窄化为单一地、理论化地、体系化地传授书本知识。当前,知识经济的迅猛发展对科学教育的育人质量提出了更高、更新的要求,赋予了其新的时代内涵。换言之,科学教育不能停留在科学知识灌输和应试教育上,而要着眼于教育过程的价值取向、目标指向和实践导向,全要素、全流程、全链条地深化改革,培养服务中国式现代化建设的新时代人才。新时代中小学科学教育是一项通过科学技术知识及其社会价值的教学,以提高学生科学素养为目的的系统性教育工程。具体而言,一是面向新时代国家发展的重大战略需求。基础教育阶段是“孵化”学生科学世界观、创新素质和科学观念的决定性阶段,这一阶段应注重培养学生的科学素养、创新精神、实践能力和社会责任感,以契合新时代对现代化人才的迫切需求。二是指向形成创新人才培养的大科学教育格局。新时代中小学科学教育的实施应遵循《意见》等政策部署,贯彻落实立德树人根本任务,并与相关工作同向同行、有机衔接,形成育人合力。三是帮助学生适应未来不确定性的世界,促进其核心素养发展。在数字化时代,技术更迭不断刷新人们的认知视野,但同时个体被技术裹挟的风险急剧上升。这就要求,科学教育应寻求个体知识建构与现实生活的有意义关联,在了解学生认知发展和尊重学生个体差异的基础上,帮助学生树立终身学习观念和实现全面、均衡、和谐发展。(二)新时代中小学科学教育的特征新时代中小学科学教育是“双减”背景下基础教育阶段一体化推进教育、科技、人才高质量发展的重要举措,对支撑建设科技强国、教育强国、人才强国意义重大。[3] 新时代中小学科学教育需要教师用“教育的”方式教科学,学生用“科学的”方式学科学,是对传统意义上科学教育的内涵深化和外延拓宽,旨在形成创新人才培养的新格局。面对国家创新驱动发展战略对人才的迫切呼唤,是否有利于全面提升学生科学素养、有利于统筹推进形成大科学教育格局、有利于推动立德树人根本任务的实现,应成为衡量新时代中小学科学教育育人效能的重要尺度,具体有以下三项特征。1. 跨域交融 :内容的统整性教学内容的统整性是新时代中小学科学教育的重要特征。这是因为,科学领域内的知识密切联系与交叉,而非孤立存在,同时,科学问题日趋呈现综合性和复杂性,需要学习者兼具更完整的知识图谱。科学教育内容的统整性有两个特征 :一是系统性,即科学教育旨在通过课程设计、转化和实践应用等方式为学习者构建系统性、进阶性的知识场域。这有助于促进学生深入理解科学的内在逻辑和规律,培养学生迁移运用知识解决问题的能力。二是跨学科性,即科学教育应模糊学科间的内容边界,打破学科壁垒,对不同领域的科学内容进行有机整合,倡导用跨学科思维去发现、解决及反思现实问题。2. 知行合一 :方式的科学性新时代中小学科学教育应遵循儿童的认知发展规律,在提升学生科学素养的过程中兼顾实践理性与理论理性。一方面,科学教育强调知行合一,即将科学知识与实践探究相结合,引导学生主动参与实践活动,学思结合、激趣引智 ;另一方面,科学教育注重教育方式的科学性,即遵循儿童认知发展规律和尊重个体差异,通过选择适切的教学手段和资源,以科学本质教育为立足点,持续深化学生对科学的理解,有效促进学生科学素养的全面提升。      3. 协同共育:要素的联通性下好科学教育这盘大棋,需要凝聚多元主体力量以保障政策方案集成发力、职能部门协同落实、育人资源有效 整合的大 科学 教育格局形成。一方面,科学教育需深化顶层设计与注重实施效能,确保教育过程中各要素间实现共享共通、各学段教育体系有机衔接,以及学校主阵地与社会大课堂多元主体协同,释放科学教育的育人新潜能。另一方面,科学教育的协同共育强调不同主体间的联通性和协作性,注重对家庭、学校、社会等多方面的育人资源进行有效整合,以形成资源共享和优势互补。二、新时代中小学科学教育的现实审思近年来,政府和社会各方对科学教育日渐重视,中小学科学教育工作的质量水平稳步提升。《中华人民共和国 2023 年国民经济和社会发展统计公报》数据显示,2023年我国公民具备科学素质的比例达到14.14%[4],相较 2005 年 1.60% 提高了12.54%。国家义务教育质量监测数据显示,我国学生科学学业表现整体良好,中等及以上水平学生人数占比约八成,但就另一维度而言,学生科学学习自信心不强,学习方法尚待改善,仅有近两成学生期望长大后从事科学相关职业。[5] 因此,也要清醒地认识到,我国中小学科学教育工作涉及面广、系统性强、挑战性大,总体基础薄弱, [6] 在教学实践过程中仍面临着诸多现实阻碍。(一)藩篱与羁绊 :科学教育中评价导向的二维离散教育评价是学校教育实践的重要组成部分,对学校教育实践具有显著的导向作用。[7] 当前,科学教育的评价存在诸多实践误识与价值偏倚,主要表现在以下三个方面。其一,评价“应试化”与素养发展的离散。长期以来,“以考促教”“以考促学”“教学围着考试转”等应试教育观念根深蒂固,使得科学教育的评价流于形式、限于经验。这种评价方式容易导致科学教育的功利化,即师生过度关注分数,而忽略对学生综合能力和科学素养的培养。其二,评价“标准化”与个体差异的离散。过于依赖单一的考试评价方式,未能全面关注学生学习过程中所表现出的个体差异性,在一定程度上阻碍了学生的个性发展。其三,评价“浅表化”与价值观念的离散。现有评价模式难以实现从社会责任、人文精神等多个维度全面评估科学教育对学生价值观念的塑造效果。(二)分离与对立 :科学教育中人文精神的底蕴流失 科学教育要培养全面发展的人,就需要在发展学生科学素养的同时,培养其人文素养。著名科学教育家贝尔纳(John Desmond Bernal)于 1939 年首次提出科学教育的人文化这一议题, [8] 其认为科学与人文相互对立的局面亟须打破,代之以科学教育的人文化。遗憾的是,受传统的事实与价值二分观念的影响,在教学实践中,科学教育和人文精神之间存在着观念鸿沟,甚至两者存在分离与对立。长期以来,片面的、狭隘的科学教育文化观使教学一味聚焦科学概念、公式和偏难怪问题的求解,忽视了情感态度、社会责任等人文内涵,进而在文化自信、人文设计方面缺失严重 [9]。缺失人文含蕴的科学教育培养出的是“单向度”的人,也即所谓的“半人教育”。这种人文精神缺失、异化的科学教育,更像是一种机械训练,背离了新时代科学教育的育人初心,不能称之为有意义的教育。事实上,虽然科学和人文的生成背景、关注对象以及涵盖内容各异,但在底层的逻辑理路上,其互补耦合,具有共同的价值指向。现阶段,我们迫切需要在科学教育中赓续优质的人文精神,从构建积极健康的科学教育价值观出发,坚持科学教育与人文精神的交融与统一,探寻人文精神落后于科学教育发展的革新坐标。(三)迷思与崇拜 :科学教育中数字技术的介入失衡    近年来,数字技术的持续迭代升级为科学教育注入了新动能、提供了新养料、带入了新循环,与此同时,传统科学教育生态也因此产生剧烈扰动。一是体现在数字化传播时代的科普生态尚未形成。当前,科学教育在数字技术的冲击下仍存在体制机制不健全、治理规则不完善、顶层设计与实施脱节等问题,“重课本轻媒体”“重教学轻宣传”的现象普遍。同时,科学教师队伍数字素养有待提升,不少教师对数字技术不屑用、不愿用,致使设备技术在场,但功效未发挥的现象频现。二是体现在数字技术的介入防范机制还需完善。随着以虚拟现实、人工智能等为代表的数字技术进入科学教育教学实践,可触、可感、可视、可听的课程资源打破了传统的物理空间场域,为实现资源的流动、共享与互通提供了可能,但科学教育数字化支撑服务体系欠佳,使学生频繁无序地在现实和虚拟空间穿梭。这样的“两栖活动”使学生深陷“镜像世界”难以实现深度学习和科学意义建构。例如,不少学校已用数字化设备代替了真实实验仪器,若在教学中不加以规范引导,易导致学生错误地认为,科技创新就是在既定步骤操作下“按部就班”地解决问题,忽视了实验现象的不确定性和实验结果的多样性 ;过度依赖数字技术或异化为由原来的教师“灌”演变为机器“灌”,使学生失去了科学建模、推理和论证的过程,以及在探究实践中具身体悟的机会,进而无法有效培养其批判性思维和问题解决能力。(四)表象与窠臼 :科学教育中参与主体的人本抽离      儿童的思维和行动总是有一种内在的组织或结构,是与他所处的发展阶段的特点相联系的。[10]但当下科学教育对于“因材施教”在实际教学中的运用仍旧存在着局限与偏差,有悖于学生的认知发展规律和以人为本的育人初衷,主要表现在以下两个方面。首先,从横向的角度来说,科学教育的对象是规模化的。在同一学段内,学生的认知发展水平呈现出显著的非均衡性。然而,在面向规模化教育对象的班级授课制中,教学往往陷入标准化、线性化、同质化的困境。在此模式下,教师大多依据同样的基准和原则教学,难以满足学生个性化需求。此外,还有少数教师将科学教育狭隘地视为培养未来的科学家和专业人才的手段,强调资优生的培养,而忽视了全体学生科学素养发展的目标。其次,从纵向的角度来看,科学教育的体系化设计安排和不同阶段的衔接关注欠佳。学生在不同年龄段的学习方法、逻辑方式、认知水平等方面差异明显。尽管目前我国科学课程的设计也融入了学习进阶理念,但对学习进阶的研究还处于起步阶段,顶层设计和微观调控仍然无法满足本土学生的实际需求, [11] 有待进一步从理论和实践角度进行积极探索。三、新时代中小学科学教育的赋能逻辑在“双减”大力推进、全面实施科学普及工作和“提高全民科学素质行动”的时代背景下,进行全要素、全流程、全链条的科学教育深化改革,探寻科学教育的赋能逻辑,是构建优质基础教育生态的必然要求。       (一)减法逻辑 :革新科学教育理念和育人模式     1. 消弭窄化的科学教育观念现代教育观念是由一系列涉及教育不同层面、不同方面的思想观念和价值观念有机构成的复杂系统。[12] 科学教育中不同层面的观念支配着各项教学活动,进而形成了不同的科学教育实践形态,影响整个教育制度运行和育人实效。消弭窄化的科学教育观念,需要构建与时代发展相适应的高质量科学教育体系,这是科学教育在现代化道路上从容前行的先决条件和适应“双减”新形势的必然选择。因此,既要从历史发展脉络中深化对科学教育本质观的理解,又要在当代语境下深刻洞见科学教育的价值理念流变。这是因为,一方面,发展性是科学的一项典型特征。这也在某种意义上决定了科学教育内涵并非一成不变,需要我们持续从知识内容、实践形态、价值理念等多个维度对中小学科学教育予以审视,以期在科学发展的脉络中揭示科学教育教学活动、学习活动的本质意涵。另一方面,科学教育与社会、文化、政治、经济等各个方面密切关联,其既包含生物学、物理、化学等自然科学领域,同时指涉人文精神的涵育,以及世界观、人生观、价值观的培养。因此,科学教育教学实践要求教育者具备敏锐的价值洞察意识,聚焦对科学的本质理解和科学教学研究的方法论,以及积极寻求教学实践与社会现实、文化脉络及伦理道德的深度联结,以最大限度发挥科学教育在创新人才培养方面的现实价值。     2. 聚焦科学教育的参与主体聚焦科学教育的参与主体就要弘扬人的生命自觉,秉持为学生全面发展服务的科学教育价值取向。《义务教育课程方案和课程标准(2022年版)》提出,要遵循学生身心发展规律,凸显学生主体地位,关注学生个性化、多样化的学习和发展需求。[13] 新时代的科学教育教学场域中,师生角色的权力转移是“学为中心,教为学服务”理念的体现,聚焦参与主体即是将讲授、自学、实践、讨论、归纳有机结合,以持续推动教与学范式的变革。就此而言,一方面要发展学生的认知性动机。为此,需要创造良好的科学教育生态,营造宽容的科学文化氛围,激发儿童对科学探究的兴趣,鼓励其敢于发问、善于提问。另一方面要培养学生的成就动机。受“首轮效应”的影响,学生对知识的理解、接受程度差异显著,培养学生的成就动机需要教师掌握脑科学、心理学等多学科的基础理论,深入了解学生的认知发展规律、思想动态及心理需求。在此基础上,教师应不断创新和优化课堂教学策略,实施个性化指导,通过针对性引导和启发来有效激活和强化学生的成就动机。     3. 削减科学教育的形式负担在某种意义上,形式负担作为教育系统“内卷化”的集中映现,在深刻影响教育生态健康发展的同时,亦成为有效落实“双减”政策与推进科学教育高质量发展的重大现实阻隔,有必要在更深层次厘清科学教育的目标导向、内容要素与教学方式,以探索削减科学教育中形式负担的可行性路径。其一,明晰育人目标指向,回归科学教育本质。应以促进学生科学素养发展为宗旨,摒弃割裂式、碎片化、填鸭式的教育模式,依据学生全面发展这一育人目标精心设计教学活动,秉持以人为本、因材施教的价值理念。其二,因应社会发展需求,优化科学教育内容。在遵循儿童认知发展规律基础上体现进阶要求,依据科技发展趋势、经济结构调整以及全球性问题的变化进行科学教育内容的优化调整,保持科学教育的时效性和前瞻性,以帮助学生适应未来世界。其三,释放数字技术潜能,创新科学教学方式。在数字时代,充分发挥数字技术在科学教育中的新优势、新动能,是丰富科学教与学形态、提高教学效能的有效路径。例如,应用数字技术创设真实课堂境脉、调用多模态科学学习资源、采用样态多元的教学活动方式,为学生知识建构、认知发展,以及实现深度学习提供有效助力。     4. 缩小科学教育的地域差异科学教育优质均衡发展始终与教育强国建设的历史进程同频。然而,教育资源总量扩张的内卷化与优质教育资源的垄断化,发达地区教育资源产能的持续溢出与欠发达地区教育资源供给的持续短缺等主要矛盾, [14] 阻碍了目前科学教育的高质量发展。如何化解这些矛盾,并通过制度化、系统化的措施实现评估从关注表层数量指标到关注深层质量指标的转变,是扎实推进科学教育工作的关键议题。一是要强化宏观调控。加大对科学教育资源的投入力度,将科学教育项目和有形资源重点向乡村和中西部地区倾斜,从经费投入、师资培训、质量测评等方面着手,提高科学教育资源的覆盖率和均衡度。二是要推进数字化建设。除了鼓励教师应用技术赋能教学外,还可以积极推动线上教育资源的开发和共享,通过建设优质的科学教育智慧平台,为各地学校提供丰富的教学资源,弥补地域之间的教育资源差异。三是要协同多方参与。地方政府应制定明确的科学教育发展规划,并引导社会各方共同参与科学教育事业。例如,学校与企业要建立紧密的合作关系,外延科学教育的场所 ;社会组织可筹办丰富多样的科学教育活动,为学生提供更多的学习机会和展示平台。用好社会大课堂,是科学教育均衡发展的有效举措,通过多方力量协同共育,有效弥合地域间发展断层。(二)加法逻辑 :统筹促进大科学教育格局形成      1. 提升科学课程的转化实效 不同课程要素结合构成一定的课程形态,不同形态的课程彼此衔接、相互支撑 , 形成具有学段特点、区域特色的课程体系。[15] 提升科学课程的转化实效,需要对科学课程再次进行系统设计、统筹规划,使国家课程方案在地方、学校科学课程实施中减小势能落差。《方案》聚焦基础教育高质量内涵式发展,为推动国家课程方案转化落地绘制了新图景。在对科学课程进行转化的过程中,要充分考虑新时代的人才培养目标,关注从理想课程到文本课程再到课堂教学的课程层级间的转化。[16] 具体而言,一方面要建立引领科学课程转化实施的区域性规划大格局。各级地方教育行政部门要健全循证决策机制、课程实施监管机制,切实因地制宜、因校制宜地构建科学课程实施的区域蓝图和校本方案,保障科学课程转化的连贯性、系统性和实效性。另一方面要合理规范应用数字技术,多维度提升科学课程转化效能。可使用人工智能、大数据等新一代数字技术,加速优质科学课程资源共建共享平台建设、打破课堂教学的时空界限,以及不断完善教、学、评的各环节要素的动态监测与精准反馈机制,确保科学课程转化实施的高质量、高效能。2. 增进人文精神的浸润效果正如杜威(John Dewey)所言,教育应该从人文主义的科目和自然主义的科目之间密切的相互依存关系出发。[17] 整体而言,在科学教育中渗透人文精神应秉持适度、适时、适切的原则,厘定“融点”、丰盈“融法”、重视“融效” [18]。一是科学教育的目标要彰显科学的文化价值,重视培养学生对科学的热爱,对社会的责任感,以及对人类文明的认同意识。二是科学课程的教材要反映科学的人文旨趣。充分认识教材在课程建设中的基础性地位和能动作用,以研制科学课程教材修订标准、建立科学课程教材监管和评价制度为突破口,强化人文精神在科学课程教材中的体现,确保科学课程教材的“文化底蕴”。三是科学教育的过程要注重科学精神的培育。在教学实践中,教师要转变教育教学方式,采用启发式、探究式、项目式等教学模式,重视引导学生探究实践,让学生在做中学、用中学、创中学,不断探索在科学探究中渗透科学精神培养的有效路径。3. 加强教师队伍的专业建设中小学科学教师作为校内科学教育教学范式革新的关键角色,是决定校内科学教育质量的核心要素。加强教师队伍的专业建设,创新科学教师队伍专业发展培养模式,需要牢牢把握“强教必先强师”的逻辑理路,将加强科学教师队伍专业建设视为中小学科学教育高质量发展的重要驱动,进一步细化培养方案、创新培养协同机制,以推进科学教师教育一体化建设。首先,以高质量科学教师供给为培养目标细化培养方案,着力构建高水平的培养标准。这就要求在扩大科学教育专业招生规模的基础上,依据培养端与用人端实然现状进行持续优化、细化、实化人才培养方案,在科学教师准入定编、督导评价等多个流程中从严从实从细,致力于选拔和培养一批具有高专业素养的科学教师。其次,着力发展教师数字素养,重塑科学教师学科素养的现代性。基于科学教学的特征属性,应依据国家《教师数字素养》行业标准制定落实科学教师数字素养的提升方案,可通过开展跨区域跨学校跨学段研训、建立研修共同体,积极实施面向科学课堂、以实践探究为导向的针对性培训,探索全面提升科学教师数字素养的可行性路径,加速推进科学教育数字化转型。最后,创新培养协同机制,着力构建科学教师教育一体化发展体系。进一步深化师范院校、地方政府、中小学三方科学教师协同培养机制,全过程、全要素地打造科学教师人才链,构建以科学教师终身学习为目标指向,融合理论深化、技能迭代与教育创新的综合性、一体化培养发展体系。4. 延拓科学教育的实践场景以学生为中心的学习环境提供了互动的、鼓励性的活动,能满足个人独特的学习兴趣和需求,使学生在不同复杂程度下学习并加深理解。[19] 因此,科学教育的教学实践场景不能囿于科学课堂,而应 从注重“教的浇灌”转变为关注“学的给养”,为学生提供丰富多样的实践机会,促进学生的全面发展。具言之,一是强化部门间协作,统筹各方主体形成规范高效的协同联动机制。加强配套政策供给以支持主体有效协同,打破教育管理部门、学校、社会组织等多元教学实践主体的壁垒,着力推动家校社协同共育的大科学教育格局形成。二是顺应数字化发展,以数字技术赋能打破科学教育教学时空界限。数字 技术的持 续迭代升级,为实现更加公平与包容的科学教育提供了现实可能。例如,通过大数据、人工智能等技术,可打破传统教学的时空界限,为学生科学学习提供个性化诊断、定制化内容推送与全天候辅导。三是用好社会大课堂,推进优质科学教育资源与校内外场景的互动。一方面,要用好校内科学教育的主阵地,将优质的社会资源“引进来”,如,开展“科学家(精神)进校园”、设立流动科技馆等系列活动;另一方面,在条件允许的范畴下,要充分用好社会大课堂,加强高校、科研院所、科技企业、场馆等科学教育实践场地的开发,优化科学教育资源布局,带领学生“走出去”,引导学生在现实环境中建构科学知识,体悟科学精神、工匠精神和创新精神。5. 丰盈科学教育的评估范式教育评价是对教育实践的价值定义和价值赋值,既是一种科学的认识活动,也是一种价值的评价活动,应是合规律性与合价值性的统一。[20] 科学学习的复杂性、阶段性及其影响的滞后性,决定了科学教育的评价方式需要在理论与实践中持续完善。正如《义务教育科学课程标准(2022年版)》指出,应以课程目标和学业质量标准为依据,构建素养导向的综合评价体系,发挥评价与考试的导向功能、诊断功能和教学改进功能。[21] 也即是说,科学教育评价应超越给学生“贴标签”的伪科学方式,避免主观臆断和应试化,转向围绕科学教育的育人目标、特征属性,积极探索构建指标科学、样态丰富的综合评价体系。一方面,要围绕科学教育育人目标,形成规范科学的评价指标体系。为此,应厘定评价的目标主体、对象和模块,进而明晰评价的维度划分和权重比例,尤其是重视科学推理、科学论证、创新思维等高阶能力,以及社会情感能力、学习动机等非认知能力的评估。另一方面,要依据科学教育特征属性,建立样态多元的评价体制机制。就评价主体而言,应充分发挥学校、教师、学生、社会等多元主体参与科学教育评价的能动性,从不同层面揭示科学教育的真实境况,增强评价的公正性与客观性。就评价方式方法而言,要基于科学教育的探究性、跨学科性等特征属性,设计丰富的评价方式,综合利用定性评价与定量评价,传统纸笔测评与过程性、表现性、发展性评价相结合等方法,确保评价结果的信效度。例如,对学习者采用同伴互评、自我反思、成果物化、小组汇报等形式,重视在探究实践中的过程性评价 ;对科学教师采用课堂观察、同行互评、专家督导等方式 ;对教育管理部门和学校可采用内外部综合评估。就评价反馈而言,要关注背景变量信息,重视影响学生科学学习因素的复杂性,从学业和非学业发展两个维度科学理性分析评价结果,进而基于学生个体差异和依据评价结果改进、优化科学教育实践,最大限度发挥评价促进学生素养发展的反哺效能。参考文献(本文刊于《教育科学研究》2024年第8期。如有媒体或其他机构转载,请规范引用、注明出处。)编辑 | 陈   娜复审 | 何文洁终审 | 鲍丹禾