首页    >    教育资讯    >    教育考试研究详情

形成性评价的概念辨析与实践路径

2025-11-17

引用格式:秦春华, 姜佳玥, 李庆港. 形成性评价的概念辨析与实践路径[J]. 中国考试, 2025(11): 22-33.

作 者

图片1.jpg

秦春华,北京大学考试研究院院长,研究员。

图片2.jpg

姜佳玥,加拿大韦仕敦大学教育学院在读博士生。

图片3.jpg

李庆港,加拿大麦吉尔大学政治学系在读博士生。

 

 

摘 要:在人工智能时代,形成性评价因其有助于培养学生自主学习、信息加工和科学创新能力,成为支持高质量教学的重要方法。然而,由于忽视因地制宜的关键作用、缺乏外部环境条件的有效支持以及教学实践本身的复杂性,形成性评价在我国教育实践中出现一些偏差,既造成概念上的混淆,也导致实践上的误用。为克服这些偏差,回归形成性评价的本源,应遵循因地制宜原则,对已有教学实践进行引导和系统改良,构建双师型教师专业发展模式,正确运用形成性评价推动教育教学改革。

关键词:形成性评价;总结性评价;教育评价改革;高质量教学;因地制宜 

2025年4月3日,经济合作与发展组织(OECD)在葡萄牙发布了《解锁高质量教学》(Unlocking High-QualityTeaching)研究报告。报告提出了支持高质量教学的五个关键目标,即确保认知参与、制作优质学科内容、提供社交情感支持、促进课堂互动以及使用形成性评价和反馈[1]。由此,形成性评价再度受到广泛关注。作为20世纪60年代发轫于美国的教育评价理论,形成性评价历经半个多世纪的发展和完善,对于重塑欧美国家教育体系、提升教育教学质量发挥了重要作用。在人工智能迅速发展的今天,由于在自主学习、信息加工和科学创新等能力培养方面所发挥的重要作用[2],形成性评价已成为教育教学中不可或缺的方法。尽管我国引入形成性评价这一概念已超过40年,但其作为一个舶来概念,对于很多研究者和实践者来说还相当陌生。如何更准确地理解和把握形成性评价的概念和内涵,尤其是如何在实践中正确运用形成性评价工具,推动我国的教育评价改革,是摆在教育界面前的一个现实问题。

一、概念辨析

对于形成性评价的概念,根据不同使用情境,不同的人有不同界定。相当多的人把形成性评价等同于过程性评价,但其所理解的“过程性评价”又与西方的定义有很大不同。《深化新时代教育评价改革总体方案》中提到“改进结果评价,强化过程评价,探索增值评价,健全综合评价”[3],并没有提及形成性评价,一个重要原因也许就是认为二者语义相同。在教育部的正式文件中,2023年12月发布的《教育部办公厅关于推荐首批全国中小学科学教育实验区、实验校的通知》中第一次使用形成性评价,提出“探索改革评价方法,重视过程性、形成性评价”,并首次将过程性评价和形成性评价进行了区分[4]。在实际应用中,仍然有很多人习惯于使用“过程性评价”而非“形成性评价”。就概念的语义本身而言,总结性评价和过程性评价比较容易理解——前者对应结果,后者对应过程,但对于形成性评价理解起来仍有一定难度。

事实上,自Cronbach于1963年最早提出利用评价改善教育项目或课程开发的设想[5]以来,经过半个多世纪的探索,一代又一代学者围绕形成性评价衍生出一整套极为复杂的概念与实践体系,涉及教育理论、目的、功能、方法和环境等多个领域[6]。即使在欧美国家内部,对这些概念的理解运用也不尽相同,更遑论引入我国后所产生的理解上的困难。再加上中文翻译的问题,使得研究者与实践者经常将字面意思相近的概念混淆,不仅造成信息上的“鸡同鸭讲”,也造成学术交流上的割裂[3]事实上,当人们使用一个舶来概念时,很容易忽视历史发展对概念本身的塑造,也容易忽略概念内在的情境条件之间的相互作用。追本溯源,有必要对形成性评价的产生和发展历程进行重新审视。

(一)形成性评价的提出与发展

在形成性评价概念发展史上,有如下四种代表性观点奠定了其理论形成的基础。

第一,教育评价可以分为总结性评价与形成性评价。20世纪中叶,Cronbach最早提出利用评价改善教育项目或课程开发的设想[5]。在这一基础上,Scriven首次提出形成性评价(formative evaluation)概念。Scriven认为,教育评价在行动上是指收集数据并根据一系列目标性指标进行比较或者打分,但在目的上存在着总结性(sum­mative)与形成性(formative)的区别[7]。总结性是对最终成果价值的评价,而形成性则是在教育过程中为改善效果提供信息和反馈支持。这一区分明确了形成性的定义,评价的目的开始由总结性地判断价值转向形成性地发现问题并加以改善;同时,其主要以课程开发为目的,服务于课程的制定者而非实践者[7]。此外,Scriven对教育评价方法的理解偏向在开发过程中对课程项目进行多次阶段性结果测评,评价的目的、主体和手段相对单一,与今天的定义有较大区别[7-8]

第二,评价可用于改进教学和学习。Scriven的“形成性”定义强调在教育过程中收集信息反馈并用于改进,其与学生和教师等过程行为主体具有天然的亲和性[7]。Bloom等率先提出形成性评价不仅可用于课程开发,还可用于改进教师教学和学生学习。他主张对教学内容进行单元内的细分,并根据学生的学习行为步骤,在学习行为与教学内容之间建立模块式联系(如从对概念的理解到知识的迁移应用),然后以测验手段检验学生对每个部分的掌握程度,教师和学生则可根据测验反馈的信息,“诊断”出有问题的部分并进行针对性的学习[9]。这一理念将形成性评价的应用场域拓展到课堂,将评价的主体从课程制定者、教育管理者拓展到最基础的教学者和学习者。Fuchs等的系列研究则进一步证明这种评价方法具有70%的效果,为后来形成性评价在课堂评价领域的发展奠定了基础[10]。总体来看,早期的形成性评价整体秉持“掌握学习”(mastery learning)的理念,希望通过特定的测试了解学生对规定知识的掌握情况,促进学生对知识的理解,并不强调对课堂教学实践的调整和对学生学习能力的关注。一些人经常误认为频繁的月考、小测验就是形成性评价,或将过程性评价等同于形成性评价,其实是对形成性评价的片面理解。

第三,形成性评价需要有效反馈和学生的参与。在形成性评价概念提出后的30年中,欧美国家教育评价范式经历了从量化考试为主到课堂评价为主的转变过程,评价目的和方式都得到极大拓展,这一变化也体现在形成性评价概念的发展中。“evaluation”一词强调对整体价值做出总结性判断,此时逐渐被更强调过程反馈和改进的“assessment”所取代[11-14]。Sadler指出,虽然诊断是形成性评价中的一部分,但“测验诊断—发现问题”的评价模式较为随机和低效,改进学习的关键应该是提供和获得有效的反馈[14]。学生并不能从表现性的量化指标(如成绩)或抽象的反馈建议(如“做得好”或“要努力”)中获得有效的信息。有效反馈应该是综合课程学习目标与学生具体情况的质性建议(如在何处存在什么样的问题,应该如何改进等)。Sadler还强调,反馈绝不是教师的单向工作,学生应该在教师的帮助下,通过范例、自评与互评等方式,了解具体的学习标准和目标,发现自己与目标之间的差距,并采取相应措施有针对性地缩小差距,最终形成能够监控自己的学习状况以及调整自己学习策略的能力,同时也可以减轻教师的负担[14]。Sadler的定义强调反馈是形成性评价过程的关键,也强调学生在学习过程中的主体性作用。

第四,形成性评价是师生之间的教学反馈循环。Black与William对课堂教学中的形成性评价重新定义,提出形成性评价(formative assessment)是指所有由教师和学生所采取的,能提供信息与反馈,并用于改进教学和学习活动的活动[15]。由于他们的研究证实了形成性评价可以在40%~70%的范围内提高学生表现(尽管这一结论今天仍有争议),因此这一定义被大量引用,成为当前学术界对形成性评价的基本认识。该定义主要涵盖四个方面的要素:一是目标与标准,强调教师和学生明确并理解课程学习目标与评价标准;二是收集信息与诊断,教师通过正式(如学习测验、表现测验、档案)与非正式(如师生对话、课堂观察、日常课业、采访)的多种方式,常态化收集课堂信息,用于了解学生学习情况,发现学生与学习目标之间的差距;三是评价反馈,教师根据教学和学习过程中发现的具体差距,依照评价标准及时有效地为学生提供非评判、质性的反馈,同时教师调整教学策略,为学生提供相应的改进机会;四是以学生为主体,通过自评和互评等方式推动学生对学习内容、评价体系的理解,鼓励学生分析反馈信息并调整学习策略,培养自主学习的能力[12-13,16-18]

这一定义明确了形成性评价的核心元素,即形成性评价的目的是通过评价改善学生的学习情况,提升学习能力。形成性评价的过程由明确目标、收集信息、提供反馈、改进策略四个循环性步骤构成,包括一系列正式与非正式方法;其行为主体是课堂中的教师和学生,尤其学生作为评价者积极参与到每一个步骤中,不是被动的接受者和被评价者。在教师的帮助下,学生可以通过这些评价方式了解自己的学习状况,形成对学习和评价体系的认识,最终成为学习的主导者。

(二)促进学生学习的评测(assessment for learning)

20世纪末,英国的评价改革小组提出对于学习的评价(assessment of learning)和促进学习的评价(assessment for learning),用以对应并取代总结性评价和形成性评价,逐渐成为一部分学者所使用的术语。有学者认为,总结性评价与形成性评价可以和对于学习的评价、促进学习的评价交替使用,两组概念之间不存在太多实际意义上的出入[19-20]。该术语的使用者则认为,形成性评价的早期定义使其容易被理解成经常性地测试以制定教学计划(类似于上文中Bloom的观点),具有一定的滞后性,也没有充分强调学生的作用。他们主张应该将评价整合进学习过程中,满足学生的信息需要,提高他们学习的自主性[16,21]。Earl则认为,除了对于学习的评价和促进学习的评价外,评价也可以作为一种学习过程中的学习方式。作为学习的评价(assessment as learning)是促进学习的评价的一个概念分支,旨在利用评价帮助学生建立和发展元认知(metacognition),让学生在评价与学习之间建立联系,在教师的帮助下形成对自身学习和评价的认知,自主地塑造学习模式[22]

从表述上来看,促进学习的评价包括三层意义:一是与早期的频繁测试做出了区分,二是进一步强调学生的作用,三是将评价整合进学习过程中而不再单独出现。事实上,Sadler之后的形成性评价研究者大多非常重视学生的作用,也强调形成性评价与课堂学习的全过程相结合。许多人依然在大量使用“formative assessment”一词,包括Stiggins本人[23]。这说明不同表述间的分界并不重要,关键是明确概念的本质含义。

另外,Stiggins等人所反对的频繁性测验(high-frequency testing)虽然不能代表形成性评价的全部,但也有研究者指出,经过形成性设计的测验也可以起到促进学生学习的作用[24]。实际上,测验与课堂内的形成性评价之间虽然存在一定矛盾,但二者也有诸多交集,且在很多语境中必须同时存在[24-25]。一方面,形成性评价重视实践和效果的关系,对学习情况的阶段性测评是其重要的环节。即便这种测评是出于促进学习的目的,也并不妨碍其在提供有价值的评价信息的同时,兼具总结性的功能。另一方面,经过形成性设计的总结性考试也可以通过备考、强化记忆、提供形成性信息等起到促进学习的作用[26]。需要强调的是,并非所有的考试都可以发挥形成性作用,一味通过增加考试测评密度或提供各种分数并不能起到形成性作用,因为这些做法并没有找出学生或教学方法的具体薄弱之处,也没有提供相应的改进方向。事实上,为了比较、筛选学生的考试设计与为了提高教学质量的考试设计是完全不同的,后者需要精准的课程目标及相关说明、根据学生个性和课程目标制定的反馈报告,以及对教学效果的评价[27]。作为整体的教育系统内应避免“非此即彼”的做法,需要在实践中不断探索测试与形成性评价之间的关系。

(三)全面而平衡的评价系统

除了评价目的与测量工具之间的争论,另一个争议点是形成性评价和总结性评价如何在教育评价系统的不同层级中得以体现。由于Black和William对形成性评价的定义是从课堂评价的传统出发,并未强调中观(如学校、学区)与宏观层面(如州/省、国家)教育主体的作用,容易造成形成性评价仅仅局限于课堂评价的错觉,导致课堂的形成性评价与其他教育环节的脱节。

实际上,即便是课堂范围内的形成性评价,也无法脱离教育评价体系而单独存在,其效果受到教育系统尤其是考试系统的限制[27]。Bennett和Gitomer指出,教育评价系统应该在内部和外部保持一致,内部一致性指形成性评价与总结性评价必须互相补充,外部一致性则是指形成性评价与总结性评价都要与学习理论和广为人们接受的学习价值相结合,支持和配合整个教育系统[28]。Stiggins等的研究更多地强调内部一致性,即形成性评价与总结性评价在课堂评价、基准测试/中期评估、年度考试中的结合,主要涉及学生、家长、教师、教研组和学校管理者等主体的分工[23]。例如,对于同一次期中考试结果,教研组和教师应该思考并找出学生需要哪些具体的帮助,以及如何提供帮助;而学校决策者则应该总结性地思考当前的教育项目是否有效,是否需要修改或者更换等。外部一致性在涉及更多行为主体的同时,也涉及更多的评价目的。Shepard等认为,在外部环境下各级行为主体对形成性评价实现学习理念的认同时,教育系统也应保持上下的一致性[29]。例如,地区级别的评价一般用来总结性地比较不同学校和教育项目,但地方教育行政部门也可以通过制定相关标准、提供指导材料、提供教师培训和职业发展机会等方式,推动当地形成性评价的发展。在国家层面,政府需要为推动课堂中的形成性评价提供足够支持,为教师提供与教学评价相关的培训,在国家课程标准中提供形成性评价的指导和实践案例,将形成性评价实施情况纳入学校监管体系,设立相应的评价研究项目等。

在2019年的美国未来评价实践会议(Na­tional Panel on the Future of Assessment Practices)上,形成性评价领域的多位专家指出,教育评价应该在改进学生学习的形成性过程的同时,向利益相关群体报告学习情况的总结性成分;教育评价也不宜只由评价工具和评价过程组成,而应该在各层级收集所有能用来分析学习情况的信息,不只是收集最简单的考试成绩[23]。在这个评价系统中,课堂评价应该由教师和学生从多个角度日常性地收集和使用大量的、细节性的形成性信息用于促进学习,不一定需要记录并用于向上报告。评价信息使用者层级越高,信息收集周期就越长,信息的细节也越少。对于管理者而言,明确评价目的、评估评价效果及确保各层级对评价理念有基本认识,是推动区域化教育评价均衡发展的关键。

二、形成性评价在我国的实践

进入二十一世纪,形成性评价受到国内学者的广泛关注,早期研究多聚焦于其在英语教学中的应用[2]。随着教育评价改革的重要性日益凸显,国内对于形成性评价的研究和实践都进入高涨期。然而,形成性评价在引进到我国并转化为教育实践时,往往被随意压缩或断章取义,一方面造成概念上的混淆,另一方面也导致了实践做法上的混乱。尽管学术界对形成性评价的核心概念已达成一定程度的共识,但在实际操作中仅有共识还远远不够,认知、理解以及基于理解的执行都将极大地影响实施效果。已有的实证案例证明,形成性评价能够对教学产生积极作用[15],但受到不同社会环境、文化环境、教学条件等的影响,教师对形成性评价的理解与实施可能产生偏差,导致形成性评价在应用过程中遇到诸多困难,难以在教学一线真正发挥作用。

(一)我国形成性评价实践中存在的问题

在我国形成性评价实践中,主要存在以下三种偏差。

一是将教师看作实施形成性评价的责任主体,忽视学校及政策环境的作用。目前,关于形成性评价实施的研究中,多数讨论聚焦于教师在课堂中的实践和创新,很少提及学校和政策环境在形成性评价中的角色和作用[30-31,33-37]。王晓红等关于形成性评价实施的中美比较案例研究列举了我国教师在实施形成性评价过程中遇到的种种困难,包括较低的师生比、教学内容多但课时少、教师问责考核制度与学生评价过度注重成绩与排名、教师职业培训及合作交流机会少等问题[35]。虽然教师是形成性评价实践的关键主体,但作为个体依然受制于学校管理和宏观教育政策的制约,在缺乏支持的情况下,很难独自成功完成形成性评价的实施。

二是将形成性评价简化为具有统一标准的教学策略,简单套用到教学中,忽视学校、学生的实际情况以及学生学习的实际效果。在这种情况下,教师的评价往往流于形式,无法实现预期目标。例如,教师将偶尔运用学习档案袋、学生互评、自评等作为形成性评价的实施。在运用这些策略时,他们往往会忽视一个关键因素,即当学生尚未通过自评、互评、学习档案袋等有效反思学习方法的训练和指导,缺乏评价的明确标准和判断依据时,教师仅对学生提出自评、互评、整理档案袋的要求,学生往往按照自己的理解完成任务,表现和效果因人而异,很难在总体上实现认知和能力的提升。教师也会认为此类教学策略浪费时间,没有效果。实际上,这恰恰是由于教师对学生的真实情况认识不足,没有相应地设计合适的教学策略所导致的,且这种做法忽视了其他更适应学生实际情况的形成性评价设计。

三是将形成性评价理解为单一、独立的教学策略或教学活动,割裂形成性评价与其他教学技能、教学内容与教学方法之间的关联。实际上,形成性评价不仅需要与整体教学计划、内容、方法相配合,还对教师已有的教学水平、教学能力等有较高的前置要求。例如,形成性评价中关键的一环是提供有效反馈信息,需要教师在教学过程中有效提出问题,引导学生思考,明确地与学生沟通学习目标,提出有针对性的改进意见,并能在有效收集学生反馈信息的过程中,随时根据学生的反应调整教学策略。然而,在很多形成性评价案例中,教师往往不具备相关教学技能,或难以将已有教学经验与形成性评价实践相结合。许多教师提供给学生的评语内容信息非常有限,如简单笼统的表扬“很好”,提醒“继续努力”,优、良、中、差的评级等,缺乏多层次、多维度的具体评价信息和改进意见,难以实现形成性评价改进学习的目标。

(二)影响形成性评价有效实施的因素

从国际视角来看,形成性评价在我国实践中出现的问题并非特殊现象,而是其作为一种从其他教学环境中产生、引进而来的教学方法必然面临的适应性问题。为此,形成性评价需要在充分调查我国社情、教情、学情的基础上,进行因地制宜的改进和创新。在我国基础教育阶段,形成性评价实施困境主要出于以下三个方面的原因。

第一,忽视因地制宜原则的关键作用。因地制宜是教学实践的重要特点,当一种教学实践在某种教学环境中产生,并尝试迁移到新的环境中执行时,新环境的许多特点(如社会环境、文化环境、教师条件、家长期望、已有的教学实践等)将影响该环境中的个体对教学实践的理解、实施和最终效果[38-39]。形成性评价作为一种国外引进的评价方式,能否因地制宜地付诸实践决定了其实施效果。在公共政策理论中,已有研究证明“政策借鉴(policy-borrowing)”实施的效果会受到当地环境与条件的影响[40]。这一结论也适用于教育实践领域。一些学者将形成性评价在不同地区或学校的实施看作教育政策借用的案例[39-40]。例如,Bernstein在教学实践方法的研究中指出,教育政策从出台到应用于实际教学工作的过程中,存在教师在特定教学环境下对教学实践的重塑(recontextualize),这种重塑的形式和结果受到当地已有的文化环境与教育环境的影响[41]。经济合作与发展组织(OECD)将不同国家文化环境下的形成性评价看作一种教育创新,因为在新环境下,已有的教学实践需要根据当地情况做出相应的调整以适应当地教学实际,在此基础上形成全新的教学模式[42]。因此,形成性评价在任何国家、地区、学校和课堂中的实施并不具有统一模式,应根据不同教学环境进行设计,且在实践中不断调整。

第二,缺乏外部条件的有效支持。形成性评价作为一种高度抽象的理念性、系统性教育实践,其成功实施对于教学环境有着较高的要求。Clark总结了文献中形成性评价成功实施的三个必要条件[43]:一是教师具备较强的教学能力,包括在课堂中与学生建立平等、双向、积极的高质量沟通氛围,围绕教学目标设计课程、组织有效活动和评价,能够在教学过程中持续关注学生的学习情况,做出相应的调整及随机应变等[44];二是教育政策制定者、学校管理者和教师对形成性评价理论与实践均有系统、全面、深入的理解,对教学目标、方法论、形成性评价等具有价值认同,能够提供支持形成性评价的系统环境[45];三是各层级教育实践者在已具备良好的教学理念、教学能力,对形成性评价具有深入理解以及掌握相应教学方法的基础上,愿意付出大量时间和精力设计适合于特定教学现场、教师培训等系统性的教学创新及辅助项目[46-47]

第三,教学实践本身的复杂性。首先是现行教育政策和学校管理制度对教学提出的要求和需求。教师对于形成性评价的理解和实践受到教学要求和需求的影响,不同学段的教学要求和需求的差异,会对形成性评价的理解和实施产生不同程度的偏差。例如,目前小学教师相当一部分的工作是维持纪律秩序,让学生保持注意力,更有可能将形成性评价误用在非学习认知领域[33-34];而高中教师往往面临更多来自课程内容进度、教学效率和学生成绩提升方面的压力,容易将形成性评价的误解误用体现在所谓的“过程评价”中,即重复考试测验(如月考、周测),对形成性评价的认识多局限于是否能够提高分数[32,37]。此外,教育评价政策对教师的要求也会影响教师对形成性评价的理解。例如,由于综合评价改革的需要,很多学校设置了“学生成长档案袋”,在教师对形成性评价概念仍然陌生的情况下,很容易将档案袋评价与形成性评价混淆,认为完善学生档案袋就做好了形成性评价[33,35,37]。其次是教师对形成性评价或评价概念的固有认识和实践。教师在缺乏科学的评价观引导的情况下,容易基于自己已有的教学经验对形成性评价产生理解与实践的偏差。例如,由于形成性评价包含“评价”一词,很多教师会联想到已有教学实践中的评价而导致误用。在他们看来,形成性和总结性是一对非此即彼的概念,总结性评价就是期末考试,只要剔除了期末考试或一切纸笔考试之外的评价就是形成性评价。课堂中对学生的表扬与批评、作业评级或简单评语,为维持课堂秩序或引起学生注意力的鼓励性话语、奖励小红花或记分等奖惩机制等都被归类为形成性评价[28,30-31]。最后是形成性评价与教学创新相关的学习、培训等资源。教师对形成性评价的了解往往来源于文献中的案例,较少经历过系统的培训和因地制宜的引导。而对于形成性评价所需要的课堂沟通技巧、课程设计方法、评价设计方法等,教师的掌握水平参差不齐,实践效果也有很大差异。例如,将学生自评用于形成性评价时,很少有教师能够科学地针对学生实际情况制定评价标准或样本,为学生提供清晰、多维度的评价标准和依据,并帮助学生理解和指导自我评价。有些教师会发放自评表让学生填写,但自评表如何合理设计、是否能够帮助学生充分理解表格内容并进行有效填写,则不在教师考虑范畴。还有的教师仅仅要求学生按照自己的理解进行自我评价[31-32]。有鉴于此,在缺乏相应教学技能培训和系统学习的前提下,形成性评价实践往往流于形式。

(三)有效实施形成性评价的路径

为了更有效地根据各地各学校教学环境特点实施形成性评价,许多学者基于已有的理论和实证研究,主要从三个方面提出了解决思路和方案。

第一,利用形成性评价和总结性评价的共通性引导教师发掘总结性评价的形成性功能。Black等在形成性评价实践中发现,完全放弃总结性评价直接转向形成性评价往往很难被教师接受。在大多数教育环境中,形成性评价需要总结性评价的配合,总结性评价也可以对形成性评价产生积极作用[46]。基于这一观察,Black等提出总结性评价的形成性应用(formative use of sum­mative assessment),主要包括引导学生在复习备考中主动反思学习、学会自测,考试结束后由教师帮助学生分析之前的学习成果和不足,指导学生在后续学习中取得进步。Carless也指出,在实践中强行区分形成性评价与总结性评价会极大增加教师的工作量,因此在多数环境下实施并不现实[48]。虽然总结性评价的形成性应用方案已有不少成功的实践案例支撑,但由于形成性评价与总结性评价概念边界的模糊性,同样也存在容易造成认识误区和实践偏差的风险。例如,一些教师在综合运用总结性评价与形成性评价的过程中,未能强调其辅助深度学习的作用,导致反复测验、碎片化甚至应试化的学习[49]。因此,在发挥总结性评价的形成性评价功能时,仍需强调形成性评价的目标、作用与实践方法,包括学生参与、主动学习和系统性反馈等。

第二,对已有的具备形成性评价特征的教学实践进行系统性优化。除了总结性考试,成功的形成性评价也需要考虑教学环境相关的其他因素。例如,在我国香港特别行政区的形成性评价案例中,专家帮助教师利用教学中已有的形式,如帮助后进生补课、考试后讲评试卷、学生互相批改作业等,通过深入观察和科学系统的教学改进发挥形成性评价的作用[48]。在帮助后进生补课过程中,教师原本可能倾向于从自身出发,将自己认为课堂中没有讲到或未讲清楚的部分重新讲一遍;而采用形成性评价则帮助其从学生的角度进行思考,并鼓励学生积极参与到查缺补漏的环节中,通过充分沟通帮助教师理解学生在学习中遇到的困难,从而给予学生更有效的建议,引导学生形成自学、主动反思和解决问题的习惯。

第三,利用有利于教学改革的教育政策,营造形成性评价实施的政策环境。除了教学现场,教育政策环境和教学管理措施也很重要。例如,在英国的教学系统中,由于高利害考试的存在,最初的形成性评价试点避开了升学压力最大的九年级和十一年级,学生和教师有相对充裕的时间、精力和心态面对形成性评价的教学改革,减少高利害考试带来的负面影响[50]。澳大利亚昆士兰州的研究人员则利用新一轮国家课程标准改革实施形成性评价[51]。因为在这段时期内,教师面临教学内容与方法的改革,相对更容易接受新的教学与评价模式,在研发新的教学体系的过程中,也较少产生额外的工作负担。

从现有较为成功的案例中可以发现,好的形成性评价的实施需要对于所有可能影响教学的环境因素进行系统、深入的调查研究,充分利用环境中存在的优势,规避可能存在的阻碍。

三、研究结论与建议

综上所述,形成性评价的概念引进到国内的过程中,会产生多种变异,也因此会导致实践中的偏差。克服这些偏差,回归形成性评价的初衷,对于正确运用形成性评价和推动教育教学改革具有十分重要的意义。

(一)形成性评价是一套教育生态系统

前述分析表明,对于学校而言,构建一个全面而平衡的评价体系至关重要。全面意味着从时间维度上看,短期、中期和长期都要兼顾;同时还要覆盖从个体到学校再到学区的各个层级的评价系统。平衡意味着不能偏废,为保证评价系统的稳定运行,各利益主体的诉求都应得到有效回应。事实上,这正是Stake回应性评价(respon­sive evaluation)的核心思想[52]。正如学者指出的,尽管课堂是运用形成性评价的主要场域,但形成性评价并不仅仅局限于课堂,而是一整套涉及学生、教师、家长、学校、社区和各级教育管理者的教育生态系统。这一系统中的每个个体都应该为改善学生的学习做出贡献,就像自然界生态系统中的每一个物种都为自然的和谐共生做出贡献一样[23]

(二)形成性评价是改良而不是革命

很多一线教师对于形成性评价有较多的畏惧乃至抵触情绪。除参加公开课、赛课等表演性教学或研究课题等任务外,教师很少在日常课堂中真正运用形成性评价。一个重要原因在于,他们往往把形成性评价视为一场教育评价革命。既然是革命,就要颠覆原有的内容另起炉灶,这意味着教师在以往教学中付出努力且行之有效的做法都可能变成“沉没成本”;而对于要学习一套新的来自国外的理论,很多教师都有畏难情绪。最重要的是,他们认为形成性评价对学生的成绩提升不会产生任何影响。既然成本巨大且困难重重,又不会带来明显效果,那么对于教师而言,不做或不按要求做才是最好的选择。实际上形成性评价并非革命,毋宁说是改良。教师在日常教学实践中已经积累了相当多的经验和做法,只是他们没有意识到这就是形成性评价。事实上,一切有助于改善学生学习的做法都可以被认为是形成性的,都可以发挥形成性评价功能。广大教师应该意识到他们在多年教学生涯中积累的经验是有价值的,但需要得到理论的凝练和提高。这些工作单靠教师自身努力是无法实现的,需要构建一种新型的双师型教师发展模式。

(三)有必要构建双师型教师专业发展模式

教师需要经过培训才能学会使用形成性评价。当前,承担培训的讲师大多是高校科研人员或各级教研员,鉴于形成性评价的特点,需要培训者对学科内容有相当程度的熟悉和掌握,这恰恰是高校科研人员和教研员所缺乏的;另外,形成性评价也需要受培训者具备一定的教育理论素养,这恰恰是基础教育阶段教师的薄弱环节。因此,在培训中受培训教师往往认为讲授内容不接地气,讲师则认为教师缺乏理论基础,培训效果并不理想。

在长期实践中,北京大学研究团队围绕形成性评价构建了一套双师型教师专业发展模式。该模式由高校教育研究者与中小学教师组成团队,通过跨界学习、课例改造和行动研究的深度融合,围绕形成性评价中的学习目标、学习证据、教师反馈、同伴反馈和自我反馈五大要素,将形成性评价理论与实际教学场景中的操作相结合,并提供相应的可调整的模块化工具与真实案例,从而降低教师理解与采纳新理论的门槛,激发教师基于自身学科特性和学生实际的再设计,增强可操作性和可实施性,提升教师在改革过程中的自我效能感。

(四)因地制宜地运用形成性评价

因地制宜原则是运用形成性评价的灵魂,不同教育主体都应努力贯彻这一原则。首先,对于教育科研人员与教育部门管理人员而言,要注意把握有利的政策时机与条件,如教育评价改革、中小学“双减”等政策风口,采取各种有力措施,帮助教育实践者实施科学有效的形成性评价改革。其次,成功的教学实践离不开扎实的科学研究基础。对于那些立足于我国国情与具体教学环境,能够切实指导形成性评价教学实践的研究应予以足够重视,并鼓励科研人员与一线教师的交流与合作。最后,应重视教育系统乃至大众的教育科学普及工作,建立良好的学习环境与正确的评价观念,创造支持教师专业知识技能成长的职业发展政策条件等。

对于广大一线教师而言,应当积极学习先进的教育理念,提升职业素养与专业能力,明确形成性评价的核心概念并进行灵活操作,尤其是重视通过有效信息反馈促进学生学习认知能力的提升及学会学习、主动学习。在努力提高教学能力的同时,教师应当更加关注学生的实际情况,勇于创新,设计真正帮助学生学习的形成性评价方案,在探索教育创新的过程中积极寻求外部支持,并与专业研究人员、学校管理人员、同行等保持充分的交流沟通,相互支持促进,共同为改善和提升学生的学习做出贡献。

参考文献略。

(免责声明:本文转载于《中国考试》公众号。转载旨在分享与交流,版权归属原作者,文中观点与本栏目无关。如涉侵权,联系立删!)