首页    >    教育资讯    >    教育科学研究详情

王娟 胡钦晓:美国教师增值评价的实践经验及启示

2024-03-07

原创 王娟 胡钦晓 中国考试 2024-03-07 16:44 北京

微信图片_20240308090057.jpg

引用格式:王娟, 胡钦晓. 美国教师增值评价的实践经验及启示[J]. 中国考试, 2024(2): 83-91.

作 者:

王娟,曲阜师范大学教育学院在读博士,聊城大学历史文化与旅游学院副教授。

胡钦晓,曲阜师范大学副校长,教育学院教授。



摘 要:教师增值评价是21世纪以来各国教育界广受关注的热点话题。美国教师增值评价的兴起和发展是政府、社会、学校和技术等多方面因素共同作用的结果。教师增值评价具有评价理念的先进性、评价过程的公平性、评价内容的独特性、评价方法的复杂性四个显著特征,可以发挥教育质量的诊断器、专业发展的增值泵、良好教学的指挥棒、教育决策的调控器等多重功能。然而,美国教师增值评价在有效性、透明性和应用范围等方面也存在争议,甚至面临伦理问题及法律风险。美国教师增值评价的实践经验,对我国教育评价改革具有一定启示意义。建设多元主体参与、多元评价方式融合的一体化教师评价体系,是我国教师评价改革的可行之路。



关键词:教师评价;增值评价;教育评价改革;评价模型

增值评价是一种以增值模型(value-added model,VAM)和统计方法为工具,对学生成长进步或教师发展程度进行测量的教育评价方式。作为诸多欧美国家开展基础教育评价的共同策略[1],增值评价实现了对传统评价模式的颠覆。美国是增值评价改革的先行者和引领者,其教师增值评价在教育评价体系中颇具特色。通过追踪教师所教学生某个阶段内的学业变化情况,教师增值评价运用增值模型测算教师对学生学业成绩的净效应,实现了对教师效能的评定,在提高教师教学质量、促进学生个人成长方面具有重要价值和意义。在我国深化教育评价改革的大背景下,本文从美国教师增值评价的发展动因切入,深入探讨其主要特征和基本功能,分析其对我国教师评价的启示,以期把握当代教师增值评价改革方向,为我国教育评价改革提供借鉴。



一、美国教师增值评价的发展动因


20世纪80年代以来,在国家竞争力战略和新自由主义思潮驱动下,美国教育政策的重心从教育投入转向教育产出。一方面,教师教学效能得到学校、政府和社会的广泛关注,以学生成绩增长衡量教师工作有效性的问责要求愈发强烈。各州普遍建立了学校问责系统和标准本位的绩效责任体系,将教师工资与其绩效表现挂钩。另一方面,教师专业化成为学校和教师关注的核心。教师评价是教师专业化发展的“发动机”,然而传统教师评价因主观性较强、区分度较差,并未起到推动教师发展的作用。传统教师评价主要依赖行政人员通过课堂观察产生的主观评分,评价结果仅有“满意”和“不满意”两种类型,几乎所有教师都获得了“满意”评级,教师的教学效能无法得到有效甄别[2]。就学生评价而言,当时美国大多数州的评价体系既不能解释学生群体学业成绩的变化,也不能衡量学生个体的学习发展情况[3]。因此,传统评价模式逐渐成为教师专业化发展的藩篱。


为改革教师评估体系,美国田纳西州政府于1992年颁布《教育改进法案》(Education Improvement Act,EIA),将统计学家William Sanders提出的增值评价方法纳入法案,以学生成绩变化作为评价教师绩效的标准。田纳西州增值评价系统(Tennessee Value-Added Assessment System,TVAAS)成为美国教师增值评价的滥觞,之后其他各州纷纷效仿。2002年,美国联邦政府出台《不让一个孩子掉队》(No Child Left Behind Act,NCLB)教育改革法案,开启了一场基于考试评估结果的问责运动。研究发现,教师之间的教学有效性存在巨大差异,增值评价可以将学生成长发展中的教师、学校因素与家庭背景等非教育因素区分开来[4]。田纳西州教师增值评价的优势与问责运动的要求颇为契合,得到联邦和州层面的支持和推广,北卡罗来纳州、路易斯安那州、加利福尼亚州、俄亥俄州等在不同程度上采用了该州教师增值评价方式。


此后,联邦政府继续深化评价改革,完善政策,增加资金投入。2006年,联邦政府设立了教师激励基金(Teacher Incentive Fund,TIF),对各州基础教育改革提供40亿美元资助;2009年,又启动了“力争上游计划”(Race to the Top,RTTT),要求各州根据学生进步程度评价和奖励教师,明确规定对学生成长的测量应在教师评价中占比40%,而其中25%必须来自增值评价[5]。各州积极响应政府政策,88%的州采纳或实施了教师增值评价[6]。教师增值评价在全国范围得到应用,成为各州教师评估系统的重要组成部分。


值得一提的是,庞大的数据系统和高级统计分析技术,是开展教师增值评价的基础。2001年,全美教育峰会要求各州积极收集学生数据,以考试数据驱动教学改进,准确跟踪学生在不同年级阶段的进步程度[7]。联邦政府也投入大量财政资源,支持全州纵向数据系统(State Longitudinal Data System,SLDS)的开发。2005年,美国数据质量运动(Data Quality Campaign,DQC)更是掀起了全国性教育数据库建设的热潮。根据2011年DQC的报告,美国各个州都建立了可靠的纵向数据[8]。20世纪末期,加权数据处理、多重推断、缺失数据处理等数据统计分析技术迅猛发展,建立在复杂统计分析技术基础上的增值模型得以持续优化。




二、美国教师增值评价的典型特征


尽管美国州际、州内所使用的增值评价模型及方法各异,在教师总体评价中所占权重也有所不同[9],但仍然表现出诸多共性特征。


(一)评价理念的先进性


增值意即价值的增长,增值评价则是对价值增量的评判。教师增值评价的首要特征是以动态方式监测学生学业数据,客观考查学生成绩增值情况,将学生增值程度作为教师评价的核心。在评价过程中,教师增值评价将衡量重点从“学生现在如何”的绝对成绩转移到“学生进步如何”的相对成绩,实现了从静态取向的定点成绩到动态取向的成绩增长的转变,打破了以单次考试成绩评估学生学业进展和教师教学水平的传统评价模式。


田纳西州正是凭借其完善的增值评估模式,在2015年被评为全美学生学业成就进步最快的州,该州学生无论在天赋和起点上存在多大差异,在学业方面均取得了显著进步[10]。教师增值评价通过利用学生学业数据信息,科学衡量学生学业增长,达到了提升学生知识技能、促进教师发展的目的。相对于以往根据标准化考试成绩和单一化课堂观察对教育质量的评价,教师增值评价更为科学有效。


(二)评价过程的公平性


教师增值评价是对教师个体的深度关注,但在具体实践过程中,学生成为评价的载体和依据。教师的最终任务是引导来自不同地域及社会经济背景的学生在自身能力基础上取得最大进步。教师增值评价既重视学生学习过程,肯定学生付出的努力,又鼓励学生不断超越自我,推进学生增值发展。区别于传统评价对学生个体初始差异的忽视,增值评价促使教师关照学生的复杂性和特殊性,推动每个学生均能在各自起点上得到适宜发展。在美国,移民学生数量占比较大,学生背景差异明显。增值评价通过增值模型控制变量,一定程度上消除了种族、贫富差距或社会经济地位等非教师因素对学生的影响,是一种相对公平的评价方式。


在增值理念引导下,教师将以往对成绩优异学生的关注及期待迁移至全部学生,进而形成改善教育的巨大潜力。成绩增值的衡量标准对于优势地位学生和弱势地位学生同等适用。由此,教师增值评价创造了相对公平的竞争环境,营造了“人人皆可进步”的良好氛围。


(三)评价内容的独特性


在教师增值评价中,“增值”被解释为教师某时间段内对学生影响的“净效应”,并进而成为社会和学校对教师问责的证据。教师增值评价不仅衡量学生随着时间推移而产生的学习增长,还评估教师对这种增长的因果效应,强调教师对学生成长的独特贡献。这种评价方式基于三个核心假设:一是教师对学生进步程度的影响可以从其他影响学生的外部因素中剥离出来;二是通过控制相关变量可以客观计算教师对学生进步的“净效应”;三是教师与学生成绩增值之间呈因果性关系,而非相关性关系。事实上,教师效能早在20世纪90年代就已得到证明。1997年,Sanders等人研究发现,教师之间的教学效能存在显著差异,而教学效能是影响学生学业成绩的最大因素[11]。教师增值评价将教师的影响与家庭背景等非教师因素区分开来,在学生学业成绩与教师教学效能之间建立联动关系,彰显了教师对学生个体成长发展的持续性、独特性影响。


(四)评价方法的复杂性


教师增值评价相对于传统教师评价,在算法实施运用和底层方法技术上表现出极大的艰深性和复杂性。增值模型作为增值评价最重要的技术工具和测算方法,能够排除无关因素或控制外部变量,从统计学意义上描述并分析教师对学生学习进步程度的贡献度。增值模型的基本形式是通过特定周期内的学生考试分数,精准计算学生的成绩变化;较复杂的形式则是结合统计技术解释学生特征的差异以及之前教师和学校的持续影响等因素。


增值模型类型繁多,包括线性回归模型、固定效应模型、方差成分模型、多级响应模型、交叉分类模型等,且模型之间可相互组合优化。不同的增值模型体现的是对教师教学效能不同维度的关注。田纳西州的增值评价系统作为被广泛认可的增值系统之一,运用的是混合模型方程,使用来自多元纵向数据集的协方差矩阵来评估教育系统对学生进步的影响[12]。在具体应用中,为了保证评价结果的科学性,任何一个增值模型都要经过复杂和严格的统计假设,并进行经常性的测试和监控。评价模型和方法的复杂性使增值模型的作用机理难以被人理解,很大程度上限制了评估数据的使用,削弱了增值评价结果的可推广性。




三、美国教师增值评价的基本功能


教师增值评价基于其统计模型的科学性和专业性,不易受人为主观因素影响,相对而言比较客观、公正,对中小学教育质量的提升、教师专业发展等具有诊断、改进、导向、决策等多重功能。


(一)教育质量的诊断器


诊断反馈是评价最基础的功能。美国教师增值评价既服务于教师教学效果的诊断,又运用于对学生学业成果的反馈,还适用于政府和公众对教育质量的问责。


对教师自身而言,增值评价基于其纵向追踪数据库的设计,通过翔实的数据描述和分析,一方面能够使教师有效识别学生表现状态,观察学生成绩增长情况;另一方面,赋能教师利用详细的增值评价数据,分析自身教学的优势和不足。简言之,教师增值评价既是教师因材施教的起点,也是教师教学改进的基点。


对政府和公众等外部问责群体而言,教师增值评价发挥着诊断教育质量的作用,是对教师效能进行衡量的重要指标。值得注意的是,通过增值模型所产生的丰富数据,仅仅是提供了数据利用的潜在可能性,只有教师及时、准确、高效地将评价数据应用于教学,才能发挥增值评价的实际效用。


(二)师生发展的增值泵


评价的最终目的不是诊断和证明,而是改进和发展。教师增值评价的内在价值是为教师提供教学和学习信息,进而促进教师自身专业发展。美国大多数州和地区教师评价改革的中心目标是支持教师改善教学,帮助所有教师提高教学水平;美国有83%的州明确将教师评价与专业发展要求联系起来[13]。增值评估凭借丰富的数据系统,不仅有助于教师主动改进教学,服务学生成长进步,而且能够促进教师自身的专业发展,支持教师的专业成长。


一方面,在确保增值评价科学性、有效性和实用性的前提下,教师能够最大限度访问学生关键数据,加强对学生特征、学习需求的深入研究,开展数据驱动的个性化教学,确保所有学生皆能取得发展。田纳西州TVAAS提供的数据便是教师努力改善学生学习的核心资源[14]。依托丰富的学生增值数据,教师得以合理分配教学资源,并采取适切的教学策略。学生在教师指导下,也可以利用评估数据促进学业改进,实现个人学业成就的增值。另一方面,教师的专业发展不再单纯依托固化的教师培训内容和形式,而是转向基于增值评估结果的个性化辅导。增值评价为每位教师提供了更加全面细致的评价,不仅使教师的改进更加有针对性,而且使教师的教学效能得到逐步增强,教学技能和人格特征亦获得差异化发展。


(三)良好教学的指挥棒


教师评价是教师开展教学工作的指挥棒。教师增值评价在师生发展方面具有鲜明的导向和激励作用。在美国,教师增值评价的直接应用是以评价结果衡定教师绩效,进行教师薪酬分配。这种将薪酬与增值结果挂钩的政策,不仅有助于激发高素质人才的从教动机,吸引他们进入教师行业,也有助于激励在职教师改善教学实践,为学生的成长进步付出努力。有研究指出,教师与其他高增值教师交流或取得基于增值评价的报酬时,其增值成就往往会提高[15]。也有研究强调,相对于未接受增值评价的同龄教师,接受增值评价的教师表现更加出色[16]。这从一个侧面凸显了教师增值评价对教师导向和激励作用的影响力。增值评价将评估教师工作的重心指向学生成就的增值,鼓励教师关注学生学业增值背后隐含的学生努力程度,深入挖掘学生成长进步的诸多影响因素,对教师改进教学起到了指挥引领作用。


此外,增值评价数据还具有丰富的预测潜能。即使是对教师一年内所教学生的学习情况进行简单增值评估,也可用以预测这些学生未来数年的学习表现[16]。教师凭借丰富的教学经验,合理利用增值评价数据,能够为每个学生的学业成长提供详细可靠的前瞻性预测,更科学地指导并引领学生终身发展。


(四)教育决策的调控器


教师增值评价的决策辅助功能体现在教师人事管理决策方面,如教师薪酬管理、教师晋升与解聘等。2009年,《美国复苏和再投资法案》(The American Recovery and Reinvestment Act,ARRA)提出,全力推动各州将基于教师表现的决策与学生表现情况联系起来,严格要求教师评价与教师薪酬、人力资本决策挂钩。由此,教师增值评价成为美国各地中小学教师职业生涯决策和薪酬分配的重要依据。首先赢得ARRA拨款竞赛的14个州,一致承诺使用学生成绩增值数据作为教师评估的重要组成部分,并使用评估数据进行人事决策[2]。美国多数州将教师增值结果设为教师人事决策的依据。


教师增值评价还具有教学决策功能。教师通过多维度、全方位挖掘并整合增值评价数据,可以准确判断并分析学生成长进步的关键节点,采取与学生身心特征、学校教育政策相契合的教学策略。2019年,依托学生增值数据,美国86%的教师形成了教学计划,88%的教师为学生确定了学习目标[17]。教师以宏大的视野统筹利用评价数据,增值评价由此成为教师开展个性化教学的重要决策支撑。




四、美国教师增值评价面临的问题与挑战


美国教师增值评价以教师推动学生成长进步的幅度作为评价标准,使得教师教育质量的评估相对科学和客观。研究表明,与其他衡量标准(如教师经验、资格认证、任教资历和校长评级)相比,增值评价是更为有效的工具[18]。但是,世界上从来不存在任何完美无缺的单一评价方式,教师增值评价自产生以来也面临诸多挑战。


首先,评价的有效性受到质疑。一方面,教师增值评价模型和分析方法必须依赖连续性的学生成绩跟踪数据,而美国学生流动性较强,加之学生缺勤、豁免考试等原因,学生数据不可避免包含不完整的成绩记录,数据缺失使评价结果的有效性大打折扣。另一方面,教师增值评价假定学生成绩仅受教师的影响,这种假设其实很难成立。事实上,教学活动类型、学生个性特征、家庭经济地位等非教师因素均会影响学生成绩,教师并非影响学生的唯一因素,教师增值评价的有效性也因此受到质疑。


其次,评价的透明性面临非议。一方面,增值模型的开发人员从保护其商业秘密的角度,不愿提供增值模型的详细信息[19]。另一方面,增值模型方法艰深复杂,绝大多数教师缺乏相关的统计学和数据分析技能,难以理解增值模型。有些学区并不具备实施增值评价的专业知识,在政府和社会的问责压力下开展增值评价时必须聘请技术熟练的专家,或者将任务外包给专业咨询公司。增值模型的可理解性与可操作性较差,导致美国教师增值评价的主动权牢牢把控在具有强大专业能力的社会评价组织手中。


再次,评价的应用范围有限。教学是一门极其复杂的综合性艺术,教师效能相应地具有多元特征,这就决定了学校不能像企业一样,仅通过计算“净效应”的方式评价教师。对教师教学有效性的评估,仅限于学生在标准化考试中客观外显的增值表现,显然是窄化了教师效能的内涵和价值。另外,美国中小学教师增值评价通常是基于各州数学、科学、语文等主要科目的标准化考试成绩,以增值分数代替教学质量的评价使学校教育质量简单化为学业质量,甚至被直接限定在学业成绩的范围内[20],教师教学逐渐功利化,教师对学生道德、审美和情感等方面发展的潜在贡献无法得到有效衡量。


最后,评价存在法律和伦理风险。在技术向度增强、管理主义思维凸显的背景下,美国教师增值评估的结果被用于指导教师薪酬决策,成为一种高风险评估,致使教师面临着不同程度的伦理风险。教师个人数据被社会公开发布,洛杉矶、华盛顿、纽约等地主要新闻媒体均曾恶意公布教师增值分数[3],教师逐渐沦为政府和公众严密盘查和议论的对象,教师的终身教职被严苛限制、教职被无情解雇等不良现象时有发生,教师的隐私权和工作保障均受到严重侵蚀。功利主义的绩效观引发了许多法律问题,美国各地教师为阻止教育行政管理人员对增值结果的惩罚性使用,都在寻求司法途径。2011年至2015年,教师作为原告在联邦和州法院至少提起了15起诉讼[21]。教师增值评价看似是一种准确衡量教师贡献的评价方式,但远未达到对教师工作效率进行科学衡量的目的。


2015年,奥巴马签署《让每个学生成功法案》(Every Student Succeeds Act,ESSA),赋予各州利用自主权修改教师评估系统的权力,州和地方学区由此获得了更多的教育自由裁量权。在理性审视和反思中,各州调整了增值评价的使用范围和权重,教师增值评价原有的“黄金标准”地位由此开始动摇。据2018年一项调查,在美国所有州和特区中,22个州明确表示不使用或不鼓励使用教师增值评价[22]。到2019年,11个州以学生学习目标(Student Learning Objectives, SLOs)取代了学生成长的客观指标,或完全放弃了基于测试的成绩指标[23]。可以看出,2015年以后教师增值评价在美国各地呈现明显收缩态势。




五、美国教师增值评价对我国的启示


教师评价不仅是国际教育改革的热点与重点,也是我国教育评价改革与发展的核心议题。2020年,《深化新时代教育评价改革总体方案》明确提出改进结果评价、强化过程评价、探索增值评价、健全综合评价[24],为我国深化教育评价改革指明了方向。“增值评价”一词前冠以“探索”二字,体现了我国增值评价的发展仍处于探索时期,尚未形成系统的理论和实践体系。美国教师增值评价的改革实践,对我国教师增值评价的未来发展有以下三点启示。


(一)深化增值理念,凝聚评价共识


评价是以人的需要为尺度的价值判断。深度理解并认同增值评价理念是有效开展教师增值评价的关键。在美国,作为评价关键要素的教师并未深度参与其中,丧失了评价的话语权和自主性,专业评价组织却因其技术优势“独享”了增值评价的主导权。为充分利用增值评价数据,发挥增值评价的持续改进作用,需要多方评价主体在融合不同价值取向和利益诉求的基础上,增进对于增值理念的理解与认同。


第一,发挥政府领导效能。我国政府部门应通过相关法律或政策有效推进增值评价改革,以清晰具体的政策指向,赋予教师增值评价足够的权威性与公信力。第二,发挥第三方社会评价组织的专业作用。在当今大数据、云计算、区块链等新兴信息技术加持下,我国第三方评价组织可以充分利用信息科技,寻求增值评价技术和方法的突破,研发中国本土化的增值模型。在此基础上,与政策制定者、学校管理者、教师等群体展开对话,详细描述、说明和解释统计模型,提高教师对增值的理解度和接受度[25],对中小学教师和管理人员进行技术指导,不断弥合增值评价理论和实践应用脱节的鸿沟。第三,发挥中小学校和教师的主体作用。中小学管理者应挖掘教师的内部动机,提升教师实践增值评价的主观能动性。一言以蔽之,深化多元主体的增值理念,强化对增值评价的价值认同,将各方共同利益统摄到为学校教育目标服务上来,才能逐步生成切实有效的教师增值机制。


(二)融合评价方法,拓展评价场域


任何一种评价方法都不应成为教师评价的唯一依据。正如美国教育研究协会(American Educational Research Association,AERA)提出的建议,增值评价永远不能在教育工作者或项目评估系统中单独使用[26]。教师评估系统的理想模式是教师日常观察、形成性反馈体系、学生学习多种证据等多元评价方式的有机组合和交汇融通。在我国教育评价改革进程中,必须理性认识教师增值评价的优势和短板,肯定教师增值评价的统计技术优势和数据循证价值,弥合单一增值评价的可能缺陷和潜在隐患,真正提高教师评价的信度和效度。


近几年,美国田纳西州便呈现出档案袋评价、课堂观察评价和学生分数增值构成的多元评价格局[27]。基于我国教育评价的文化背景和现实土壤,我们理应面向国际前沿,建构中国特色的多元教师评价体系,避免依赖单一的增值评价方式。在实施增值评价时,突破常规科目测试的局限,纳入技能、能力和情感等广泛的非认知因素指标,依托多元证据,对教师的实际贡献开展增值评价,发挥增值评价的独特优势。如此,既保证教师获得有价值的专业学习经验,也使学生多元发展得到较好保障。


(三)优化评价制度,规避伦理风险


当前我国教育正处于高质量发展进程中,通过教师增值评价激励教师和学校发展是教师评价的发展方向。我们应仔细审视美国教师增值评价出现的纷争,规避增值评价存在的缺陷和隐患,预防可能出现的伦理风险,致力建设一个真正提升教师质量的教育评价体系。


首先,学校和整个教育系统必须超越现状,健全增值评价的配套制度体系。正如宾夕法尼亚大学公共政策学者Hershberg所言,增值评估需要与之互补的政策才能有效提高学业成绩[28]。其次,在政策和法律实施层面开展强有力的治理,为评价数据的合法使用提供保护。同时,在道德和伦理层面,营造恪守评价伦理规范的社会氛围,尊重教师的隐私权和申诉权等正当权利,有效规避评价数据应用的伦理风险。最后,政府和教育管理者应弱化增值评价带来的问责和惩罚功能,淡化绩效主义取向,回归激励教师专业发展的本体功能,将教师增值评价的功能重心回归到为教师提供更个性化的专业学习和更准确的教学反馈上,重塑教师信任文化,建设以人为本、富有生机的教师评价系统。




六、结束语


相对于传统评价模式,增值评价拥有更多促进师生双方成长和发展的优势,有力彰显了发展性、公平性的评价理念,深刻体现了教育即生长的哲学论断,成为美国教师评价发展中的重要里程碑。在学习和借鉴美国教师增值评价实践经验的基础上,我们也要清醒认识到,增值评价结果突出管理功能和绩效导向,服务高利害决策,存在较高风险[29],教师的教学效能和内在价值被冰冷的数字所异化,凸显了技术至上的工具理性取向,一定程度上形成对人的发展价值向度的遮蔽。概而言之,教师增值评价并非是一种尽善尽美的评价模式,也不是教师问责的灵丹妙药。面向未来,我们应更加关注增值评价的诊断和改进功能,推动我国教师评价向综合评价体系转型。唯此,方能真正实现教师增值评价促进师生协同增值的理想。




参考文献

微信图片_20240308090339.jpg