首页    >    教育资讯
增值评价中的有效反馈问题探讨

2023-05-26

李俊飞 谭顶良:增值评价中的有效反馈问题探讨原文刊载于《中国考试》2023年第5期第29—36页。作 者李俊飞,南京师范大学教育科学学院在读博士生。谭顶良,南京师范大学教育科学学院教授。摘 要:反馈是评价的基本组成部分,有效反馈是提高评价质量、发挥评价促进教学功能的重要途径。随着我国增值评价探索的逐渐深入,在增值评价实践中如何恰当地运用评价结果的问题亟待解决,而有效的增值评价反馈有利于改善评价结果的运用。基于有效反馈理论,对目前增值评价中的反馈问题进行探讨,从增值数据特征出发,探索增值评价有效反馈的基本路径;同时,提出健全综合评价反馈、加强形成性的反馈和搭建数字化反馈平台3项措施,以提升增值评价反馈的有效性。关键词:教育评价改革;增值评价;增值数据;有效反馈近年来,在《深化新时代教育评价改革总体方案》的推动下,我国学者围绕增值评价的理念、技术和应用开展了诸多方面的研究,合理运用增值评价结果是其中的一项重要内容。然而,如何基于增值评价结果精准服务教育管理和教育教学,尚未形成科学、有效的机制,“重方法、轻结果”“重结论、轻运用”的问题较为突出[1]。针对增值评价结果运用的问题,有效反馈可以提供可行的解决方案。反馈作为评价的核心部分[2],在理论上对教、学、评三者有正向的促进作用,但在实践过程中,容易出现一些问题。相较于传统评价形式,增值评价通过增值模型可为教师与学生提供更为科学的反馈信息,但由于增值评价在理念和技术上的特殊性,诸多因素制约着有效反馈的达成,如不当的反馈内容、方式和环境等[3-4]。因此,增值评价中的有效反馈问题需要更深入的分析和探讨,为师生更好地运用增值评价结果提供参考。本文基于有效反馈理论,分析现行增值评价反馈中存在的问题,讨论利用增值数据进行评价反馈的路径,提出相应的提高效率的策略建议。1 增值评价反馈的问题分析目前,我国对增值评价的研究逐步深入,这对增值评价有效应用提供了重要支持。但客观而言,增值评价实践中仍存在一系列问题亟待解决,特别是评价反馈的问题常受到忽视。增值评价不同于传统的终结性评价,其过程耗时长、内容范畴广、结果形式多,容易出现低效甚至无效的评价反馈,对增值评价实践的整体效果会产生不利影响。深入分析阻碍增值评价有效反馈的问题后,归纳为以下4个方面。  首先,增值评价的信度和效度不稳定。所有的反馈都必须以某种形式的评价或判断作为先决条件[5],可以说评价的质量影响着反馈效果。信度和效度是判断评价质量的重要指标,信度代表评价结果的稳定性和可靠性,效度则代表评价的准确性和有效性。由于数据缺失、测量误差等问题的出现,统计上的假设难以在现实的教育情境中得到验证[6],从而导致增值评价的信度和效度不稳定。在这种情况下,师生对评价数据的信任度将会降低,反馈可能会使师生产生非预期的负面情绪[7],从而影响反馈成效。尤其是在高风险绩效考核中,不稳定的信度和效度会使评价相关主体收到反馈后产生怀疑倾向,从而忽略甚至抵触增值评价的结果,这就有违反馈接收的积极意愿准则[8]。因此,保障评价的信度和效度是有效反馈的前提条件,而目前很多增值评价的信度和效度有待提升。  其次,反馈内容不易理解。反馈不是单向的输出,还包括反馈对象的接收。因此,师生能否准确理解反馈信息是实现有效反馈的基础。一些增值评价的反馈以书面报告形式呈现,其种类繁多、内容较为复杂,并缺少对统计方法和数据含义的充分解释[9],从而阻碍师生准确理解反馈内容。以美国学校为例,其报告类别多样,每种报告的侧重点也不同,主要有增值报告、表现诊断报告、学生报告、学生成就预测报告等。增值报告主要描述学校或校区的总体增值结果;表现诊断报告更注重群体间的比较分析,呈现学校、教师、学生3个层次的增值情况;学生报告和学生成就预测报告侧重于学生在不同学科上的增值表现、比较和预测。另外,报告给出的反馈信息还包括增值量的判断标准和不同的增值表达形式,如百分比、标准增值分及净增值量等,报告内容可谓复杂多样[10]。然而,反馈的信息并非越多越好,需要选择精准、有效的信息,避免因冗余内容导致理解偏误,阻碍教师使用增值评价结果进行教学改革。  再次,反馈目的不明确。目的明确的反馈有利于信息传递和导向设立[11]。在评价反馈过程中,评价相关主体应达成一种目的共识,以促进师生间的有效合作。一方面,我国增值评价主要以标准化测试作为评价依据,过分依赖应试成绩,窄化了评价内容[9],这种增值评价使反馈目的偏向高风险考核,与促进师生发展的评价理念相悖。另一方面,在发展性和形成性的评价理念下,反馈目的应是分析成因和改进教学,而实践中的评价目的却与之有所偏差,造成了评价目的在理念与实践中的分歧,这不仅会影响反馈效果,还可能使教师错失改进教学的机会[12]。因此,目前增值评价的反馈目的还不够明确,阻碍着评价相关主体间的信息传递和评价导向的设立。  最后,反馈时机滞后。反馈应当及时,尽可能在测评结束后立即开展,以保证师生及时得到近期表现的评价结果,从而进一步促进教学[13]。元分析研究也证实了及时、显性、直接的评价反馈对教学更为有效[14]。显然,恰当的反馈时机对反馈效果有着重要的影响。增值评价需要长期追踪和收集充足的纵向数据,通常耗时较长,评价结果产出较慢。此外,一些增值评价项目不仅包含学业成绩,也要测量教学的影响因素,各类因素的数据处理流程较为繁杂、专业程度较高,往往使得增值评价的反馈无法及时开展,导致反馈时机具有一定的滞后性。2 基于增值数据的有效反馈路径反馈本身无法对教学产生直接促进作用,需要使用适当的反馈策略使评价相关主体理解并运用评价结果来改进教学[15]。增值评价可提供丰富的反馈内容,但基于不同增值模型,增值结果在形式、内容等方面具有不同的特征,如果单一、死板地反馈增值结果,将不利于评价相关主体准确理解反馈内容。因此,亟须设计一种系统的反馈路径,保证反馈效果。而增值数据是反馈路径构建的基础,有必要对其特征进行深入分析。2.1 不同增值模型及其数据特征模型的建构思路和统计方法决定了增值数据的特征。随着统计技术的发展,研究者提出适配于不同场景的各类增值模型,模型采用的统计方法有所不同,因此,增值评价项目需要选择适合的模型[16],并在模型确定的基础上,对不同增值模型的数据特征进行分析。下面选取常见的4种模型进行讨论,包括获得分数模型、多元线性回归模型、多水平回归模型和成长百分比模型。  一是获得分数模型。这是目前比较简单的一种增值模型,利用标准分差值的统计方法,将连续两次的标准化测试成绩之差作为增值量。前后测分数通过标准化处理,获得均值为0、方差为1的标准化分数集Z,使两次不同测试的结果纳入统一的衡量标尺中,公式如下:获得分数模型以学生、班级的标准分差值作为增值结果,得到的数据相对直观、简洁,但这种增值模型只关注考试成绩,忽略了其他变量的影响,难以提取有针对性的诊断证据。  二是多元线性回归模型。其利用最小二乘法拟合方程参数,可探究不同因素对增值的影响。多元回归模型不仅可以纳入人口学因素等非教育变量,还可以分析师生特征、教学方式等因素对增值的影响[17]。随着变量逐步纳入方程,通过拟合解释率(R2)和夏普利值(shapley value)可以得到每个自变量对因变量的解释权重,进而估计模型中各变量的相对效应。回归公式如下:其中,Yi为预测成绩,X1…Xi为初始成绩和人口学因素等变量。预测值与实际值的最小均差平方和,即为残差,代表教师效能。这种方法需要广泛的实证调查,受测量误差和缺失值等方面的影响,增值结果的精准度会有所降低,但得到的数据较为丰富,可对改进教学提供更具体的指导。  三是多水平回归模型。这是目前较为主流的增值模型,将学生前测成绩作为基线分数,前两次及以上成绩作为矫正分数,在学校、教师、学生等多个层次中输入各层相关的协变量,得到相应的效应量。以教师和学生的2水平回归模型为例进行分析,统计思路见图1。可见,多水平回归是一种嵌套结构,上层回归系数受到下层的调节,使数据在不同层次间产生关联。在控制非教育因素的影响后,学生层系数的变化会影响教师层系数的估计。  相较获得分数模型,多水平回归模型得到的增值结果更为具体,可以同时分析不同层次的增值特征,使得每一位学生和教师分门别类地获得有价值的反馈信息。与多元回归模型相比,多水平回归模型各变量间不再是相互独立的,评价场景中的变量分层布局、相互影响,增值估计会更加准确;因此,该模型的评价结果科学性更强,但对数据的解释也更为复杂。  四是成长百分比模型。其通过建立分数位回归在以往学业水平一致的考生群体(同类学生)中进行比较来评估每个学生的进步情况[19]。分数位回归关注的是变量的全局分布,利用加权最小绝对离差和法进行参数估计,数据具有显著的标准化特征,解决了增值的“天花板”和“地板”效应问题,并可有效甄别处于平均效能附近的评价结果。该模型的统计方法要求较大的样本量,支持所有对象在百分比水平内具有可比性。成长百分比模型通常服务于大规模增值评价项目,可能难以有效甄别小规模样本的增值评价。  基于以上分析,4种增值模型的构建思路和统计方法有相似之处,也存在明显的差异。为了更加直观地比较增值数据的特点,本文从复杂性、信息量、精准度、系统性和诊断价值5个维度总结比较增值数据特征,见表1。 从表1可以看出,获得分数模型在结果精准度上更佳,对数据的解读较为简单,但诊断价值不高。基于最小二乘法的多元线性回归模型信息量较大,具有一定的诊断价值;多水平回归模型和成长百分比模型的计算方法复杂,系统性较高,可以对评价相关主体提供具体的诊断意见。后3种模型由于存在统计假设和测量误差,往往在结果精准度上有所欠缺。从整体来看,不同的增值模型得到的数据形式各异、内容多样,在构建有效增值评价反馈路径时,需要考虑增值数据的多方面特征,从而有针对性地进行设计。2.2 增值评价有效反馈的路径增值数据为反馈提供了必要的内容,是构建增值评价有效反馈路径的前提基础。依据增值数据的各个特征,有效增值评价反馈需要整体统筹、局部推进,以满足反馈的全过程、多层次和重改进的要求。  学生学习通常被定义为4个阶段:生成初始经验、反思性观察、形成概念和主动试验[20]。在传统认识中,反馈是第二个阶段的产物,但由于增值数据需追踪学生发展的全过程,因此,生成初始经验、形成概念和主动试验均可以被纳入增值评价反馈系统。可见,增值评价的有效反馈贯穿于整个教学过程,反馈路径的设计应体现出系统性特点。结合增值数据的分析结果,本文提出其有效反馈的路径系统,见图2。系统是由分析、报告和使用3个部分构成。   首先,增值数据的分析。准确分析增值数据是一项前提性工作,分析的科学性决定了后期报告的效果,这个过程由分类、整合、解释和评估4个环节组成。分类是指依据模型类别或师生特点等,将总体的数据集合理地分为若干部分;整合是指在不同学校、学科或年级的数据集中提取具有类似特征的样本。分类与整合能够保障数据的结构性,为下一步的解释和评估奠定基础。解释是分析增值数据的关键,妥善解释不同模型的统计方法和增值含义有助于评价相关主体准确理解增值数据,如获得分数模型的计算结果在统计上不考虑其他因素,对其解释可较为客观、直接;对基于回归的增值模型而言,数据内容较为复杂,解释需要用易于理解的表达方式。评估是指对数据的科学性作出判断,包括规范的数据采集和统计,如评估数据的信度和效度是否达标等,以确保后续报告的质量。  其次,增值数据的报告。报告要求具有可操作性,以保证师生可以高效地利用增值报告改进教学,涉及内容、对象、方式和时机4个方面的问题。第一,报告的内容和对象应紧密联系,报告内容会随对象的改变而做相应的调整。增值数据的报告内容主要有学业增值、教学效能和教学管理3个层面,对象则可包括学生、家长、教师和学校等。学生主要接收学业增值数据,了解自身在所处班级和学校的增值情况;家长可接收学业增值、教学效能的数据,辅助家庭教育的开展,部分参与学校治理的家长委员会成员可接收教学管理层面的数据,为家庭与学校协作提供决策参考;教师和学校尽可能全面地获得增值评价的各项结果,促进自身教学质量的提升。第二,报告增值数据的方式要灵活。目前主流的报告方式主要以书面为主,但口头报告的方式不可忽视,口头报告可以结合书面报告,以强化对反馈内容的理解。此外,口头报告还能及时地补充书面报告的内容。因此,书面和口头的报告方式应相辅相成,实现反馈效益的最大化。第三,报告增值数据的时机要恰当。增值评价需要追踪纵向数据,往往无法及时进行报告,前后测之间相隔太久可能使师生难以清晰地回顾过去的问题,因此,要准确把握报告增值数据的时机。例如,在单次成绩报告时一并附上增值结果,还可通过档案袋的形式长期追踪学生成长趋势。综上,建立一套规范的报告机制是保障反馈效果的关键,评价相关主体需要针对不同评价场景和目的,对增值数据的报告内容、对象、方式和时机作出适应性的设计考虑。  最后,增值数据的使用。该环节要体现数据使用的发展性,具体包括总结、诊断和预测3个方面的功能。总结是在整体上反映一段时间内教学的效果,是绩效考核的重要参考。增值报告所提供的客观测评结果能够为教育决策提供一定的支持。诊断是师生发现问题、解决问题和确立目标的过程[21]。增值报告的内容为教学提供改进建议,师生可依据接收到的报告,针对具体情况发现各自的缺点和优势,以此拟定下一步教学的目标,并采取行动缩小实际成就与目标之间的差距。预测是增值评价的一项独特功能,利用回归的拟合曲线在一定程度上可预测学生学业和教师教学的发展趋势,教师可结合预测结果采取相关的调整策略,改进教学管理。在增值数据的使用结束后,反思其使用过程并总结经验,进一步完善数据的分析环节,形成路径的闭环,最终建立起有效的反馈系统。  从整体来看,有效增值评价反馈的路径立足于分析、报告和使用3个关键环节,各环节紧密联系、相互促进,共同确立科学性、可操作性及发展性的目标。在实际应用中,结合不同增值模型、评价对象、反馈目的等方面的特征,还应建立起程序化、规范化的流程,实现基于增值数据的有效反馈。3 提升增值评价反馈有效性的措施建议路径的确立为增值评价的有效反馈提供了可行的操作框架,如何更好地提升反馈效果仍是目前面临的主要问题。本文提出,健全综合评价反馈、加强形成性的反馈和搭建数字化反馈平台3项措施,以提升增值评价反馈的有效性。3.1 健全综合评价反馈由于增值评价存在信度和效度不稳定的问题,其反馈需要结合多方面的信息,以提升增值评价反馈的可靠性和有效性。健全综合评价反馈主要表现为组合测评结果、丰富反馈内容和搭配多种形式3个方面。组合测评结果是指增值评价的结果需要与其相关的多个测评结果相结合,通过补充其他评价要素,提升结果的可靠性和有效性,并为评价反馈提供更全面的内容,如语文学科的增值反馈可辅之阅读、写作素养的测评。也就是说,增值评价不应该仅限于学业成绩,也要结合核心素养、心理认知等其他方面的内容。随着测评的数据维度不断增加,评价结果的可靠性也会随之提升[22]。丰富反馈内容指增值评价反馈不仅要报告增值量,也要反映评价群体内的特点,有针对性地进行拓展,如不同增值模型和不同学科、年级的评价结果等。搭配多种形式主要体现在反馈主客体间的沟通协作中,结合口头与书面报告、量化与质性报告、文字与可视化报告的形式,达到相互补充、共同促进的效果。综合评价反馈在提高信度和效度的同时,还能够兼顾增值评价在绩效考核和诊断改进方面的需求,缓解应试与全面发展之间的矛盾。3.2 加强形成性的反馈 一些增值评价的反馈内容复杂多样、不易理解,在反馈过程中,需要不断跟进和调整反馈的策略。形成性的反馈是一个信息再输入的过程,将评价结果返回至输入端,以前期经验调整反馈策略,进而提升反馈成效。一方面,基于增值评价理念,学生和教师的发展应是动态的,对其反馈需要遵循连续性和过程性的要求:将反馈贯穿于整个评价过程,使各个阶段的数据持续不断地反馈给师生,实现从终结性到形成性的转变。另一方面,利用形成性的反馈方法,在增值数据反馈的分析、报告和使用环节,不断调整反馈的内容、方式和时机,由浅入深,循序渐进,实现高效的评价反馈。3.3 搭建数字化反馈平台增值数据收集需要长期追踪,过程较复杂,这导致增值评价的反馈时机相对滞后,亟须采取现代化技术手段提高反馈效率。搭建数字化反馈平台是提高反馈效率的可行办法,可以通过线上系统有针对性地显示师生的增值情况,自动追踪形成学生学习和教师教学的过程性数据。目前,一些数字化反馈平台存在只能提供终结性反馈、重视量化分析忽略经验转化、访问流程复杂等问题[23],不符合增值评价及时、有效反馈的要求。为提高反馈的精准度和效率,增值评价的数字化反馈平台可以融合数据收集、测评监控、数据运算、结果报告、实时干预等功能,采取网络交付形式,使评价相关主体便捷、高效地获取有用信息。此外,借助数字化反馈平台还可以为不同对象群体提供针对性的反馈内容,如为不同学科、学段或背景特征的学生提供改进建议,实现以增值数据为依据的因材施教。最后,基于大数据支持,增值模型可利用人工神经网络等机器学习算法提升其包容性和精准度[24],为搭建增值评价数字化反馈平台提供技术保障。增值评价在数字化平台的辅助下可以改善反馈时机滞后的问题,提升反馈效率。  目前,我国有关增值评价基本理念和技术模型上的研究已取得一定的进展,为实现增值评价有效反馈打下了基础。未来,结合增值评价实践的需要,可利用适当的反馈策略拓展增值评价的功能,以有效反馈为视角进行更多的本土化探索。参考文献:(略)    版权声明:文章选自《中国考试》,版权归属于原作者,如有侵权,联系删除。

新课标背景下小学生技术与工程实践能力 评价框架的建构及其应用研究

2023-05-15

新课标背景下小学生技术与工程实践能力评价框架的建构及其应用研究原文刊载于《中国考试》2023年第4期第50—58页。作 者王俊民,重庆师范大学初等教育学院副教授。摘 要:技术与工程实践能力是科学课程要求培养的学生核心素养的重要组成部分。结合国内外研究成果,从技术与工程实践的过程出发,建构小学生技术与工程实践能力的评价框架,包括界定问题、设计方案、动手操作、分工协作、测试改进、交流评价6个评价要素,具体表现性评价按学段分两级。以某小学2年级学生作为研究对象,采用自编的表现性评价任务,通过现场操作并录像的方式收集信息,对小学生的技术与工程实践能力进行评价。结果发现,低学段小学生的技术与工程实践能力发展较好,但各维度发展不均衡,具体表现为:界定问题和测试改进的能力发展良好,具有一定的动手操作能力和参与意识;设计方案能力不足,材料选择和制作过程易与方案设计脱节;表达交流的语言有待丰富和科学化。研究为小学技术与工程实践能力的教学和评价提供一定参考。关键词:义务教育科学课程标准;技术与工程实践能力;评价框架;核心素养2022年4月,我国颁布的《义务教育科学课程标准(2022年版)》(以下简称《科学新课标》)将“探究实践”列为科学课程的核心素养之一。《科学新课标》提出的“探究实践”主要指在了解和探索自然、获得科学知识、解决科学问题以及技术与工程实践过程中,形成的科学探究能力、技术与工程实践能力和自主学习能力[1]5。技术与工程实践能力首次出现在义务教育阶段科学课程标准中。目前,关于技术与工程实践能力的相关研究还很少,对于什么是技术与工程实践能力、如何评价学生的技术与工程实践能力尚在探索阶段。本研究从技术与工程实践能力的内涵出发,构建评价框架,采用表现性评价调查小学生的技术与工程实践能力发展水平,以期对新课标背景下科学课程的教学与评价改革有所启发。1 技术与工程实践能力的内涵在高等教育领域,工程实践能力是工科专业广泛使用的一个词,其概念范畴非常宽泛,包括从对工程实践的感知到介入,从工程项目的实施到工程产品的改进及整体优化,从项目成果的鉴定、验收、归档到工程文档资料的再利用。有研究将其概括为工程设计、工程实施、工程控制、发现问题、沟通协作、批判创新、文档梳理7个方面[2];也有研究将其概括为提出问题、设计方案、实施方案、试验调试、提交文档和沟通与协作6个方面[3]。在基础教育领域,美国《新一代科学课程标准》对科学与工程实践能力作出界定,包括提出问题和界定任务、开发与使用模型、计划和实施调查、分析和解释数据、运用数学和计算思维、构建解释和设计解决方案、基于证据进行论证以及获取、评价和交流信息8个要素[4]。2020年,美国技术与工程教育协会发布的《技术与工程素养标准:STEM教育中技术与工程的作用》提出技术和工程实践包括系统思维、创造力、制作、批判性思维、乐观、合作、沟通与关注伦理[5]。由此可知,无论是高等教育领域,还是基础教育领域,国内外研究主要从工程实践的过程描述技术与工程实践能力,可以概括为界定问题、设计方案、实施计划、检验作品、改进完善、发布成果等环节,而系统思维、批判性思维、协作沟通、创造力、乐观等核心素养是学生进行技术与工程实践必须调用的关键能力和必备品格。例如,设计方案需要系统思维、创造力以及成员之间的沟通,实施计划需要个体的操作能力和乐观坚毅的品质以及成员之间的协作,改进完善需要批判性思维等。  《科学新课标》提出的技术与工程实践能力主要体现为:了解技术与工程实践的一般过程和方法,针对实际需要明确问题,提出有创意的方案,并根据科学原理或限制条件进行筛选;实施计划,利用工具和材料进行加工制作;根据实际效果进行修改迭代;用自制的简单装置及实物模型验证或展示某些原理、现象和设想[1]5。这一标准也从工程实践过程角度描述技术与工程实践能力,涉及的要素包括明确问题、提出并筛选方案、加工制作、修改迭代和验证展示。胡卫平等将技术与工程实践能力确定为构思与设计、操作与实现、验证与优化等要素[6]。基于上述研究,本研究认为,技术与工程实践能力是与科学探究能力同等重要的一种过程性能力,包括界定问题、设计方案、加工制作、测试改进、交流评价5个要素。其中:界定问题指从真实或建构的问题情境中发现问题,且最大限度地定义需要解决的问题,分析问题的限制条件和需求,比如可以使用的材料、作品的外观和功能等,为设计制作提供一个基本的标准或限制条件,要求能够对情境进行整体分析,对问题进行准确的描述;设计方案指针对问题提出可行方案并依据需求或限制条件进行优化,涉及测量记录、选择材料、模型建构、绘画表达、比较权衡、分析综合等多个方面的操作和思维能力;加工制作指能利用工具和材料完成加工制作,生产出基本满足条件的作品,涉及正确安全地使用工具、百折不挠的品质、有效利用材料的意识、与人协作和解决冲突的能力等;测试改进是指能根据实际效果或测试结果对作品进行修改完善,要求具有测试改进的意识和接受不足的勇气,能发现问题并坚持不懈地解决问题;交流评价指能用自制的简单装置或实物模型验证或展示某些原理、现象或设想,要求能通过多种形式表达观点,同时能够与他人交流,评价他人的观点、作品或反思自己的作品与实践过程。2 技术与工程实践能力评价框架      国际上,技术与工程实践能力的评价多体现在“技术素养”“技术与工程素养”等测评框架中。美国NAEP技术与工程素养评估从领域和实践两个维度构建评价内容,领域包括技术和社会、设计和系统、信息和通信技术,实践包括理解技术原则、设计方案实现目标、合作与交流。其中,设计和系统体现了工程素养要求,与实践形成工程实践能力的二维模型,包括描述、举例、解释、分析系统或过程等技术原则,设计制作、生产方案、评估、作出决策、改进等实现设计方案目标的过程,以及呈现、运用、展示等交流与合作的能力[7]。澳大利亚昆士兰州技术与设计评估项目从知识理解、过程与生产两个维度评价小学生的技术设计素养,其中,过程与生产维度包括调查与界定、生成与设计、加工与实施、评价、合作与管理5个方面[8]。新西兰技术素养测评项目中的技术素养包括技术知识、技术实践和技术本质3个维度,其中的技术实践对应技术与工程实践能力,具体包括制订实践计划、简述开发过程与产品、成果开发与评价3个方面[9]。  由此可知,国际测评项目中的技术与工程实践主要通过工程实践过程确定测评内容。在我国,有研究从工程实践的过程构建指标,包括提出工程问题、设计解决方案、运用材料和工具、基于证据解释、评估/改进设计5个过程性能力[10],还有研究从自主学习能力、分析能力、思维能力、实践操作能力、沟通协作能力、创造与创新能力6个方面构建大学生工程实践能力的评价指标[11]。  基于《科学新课标》对技术与工程实践能力的表述,结合国内外相关研究成果,本研究从技术与工程实践的过程出发,将系统思维、沟通协作等核心素养渗透其中,构建小学生(中低学段)技术与工程实践能力的评价框架,见表1。该框架包括6个内容要素,分别是界定问题、设计方案、动手操作、分工协作、测试改进和交流评价。其中,动手操作是对《科学新课标》中“加工制作”要素的进一步区分,关注的是学生使用工具和材料进行制作的能力。分工协作被单独列为评价要素,一方面是考虑小组合作的重要性,应在研究过程中给予更多关注;另一方面是分工协作不仅体现在加工制作的过程中,也体现在设计方案和测试改进的过程中,单独评价有利于整体把握。      在明确技术与工程实践能力的评价要素后,本研究从评价要素的具体内容出发,依据科学课程学业质量标准,同时参考《科学新课标》“探究实践”的学段目标,确定每个评价要素的具体表现水平,将其分为两级,一级为低学段(1~2年级)小学生应达到的水平,二级为中学段(3~4年级)小学生应达到的水平。3 小学生技术与工程实践能力的应用研究3.1 设计评价任务      以低学段(1~2年级)小学生为研究对象,依据学生的认知发展水平和课程标准设计两个评价任务,分别为“制作一个文具盒”(任务一)和“制作鸡蛋保护器”(任务二),这两个任务均设计有教师工作单和学生记录单。  教师工作单主要用于指导教师的现场操作,包括操作环节说明、教师行为(比如发放材料、记录等)和语言、评价内容及其他注意事项。以任务一为例,教师工作单的流程和具体内容见表2。      学生记录单主要辅助学生完成操作过程并记录相关信息,包括任务要求、画图要求和材料清单,其中的任务要求是学生自己界定问题后,由教师统一提出作品要求。以任务一为例(图1),其中:“任务要求”对文具盒的大小、质量、功能、美观性、成本5个方面提出设计要求;“材料清单”列出学生可以选择的材料、规格及单价,学生根据需要勾选材料并计算成本。3.2 设计评价标准      为了判断学生的具体表现水平,根据具体任务要求对表1中的表现水平进行细化,形成针对具体任务的评价标准。以任务一为例,评价标准见表3。3.3 试测与修订选取某小学2年级学生进行试测,其目的主要是检测教师工作单、学生记录单的流程与内容是否合适,学生是否有不认识的字、不理解的信息等问题。  每个任务随机抽取4名学生(分两组),在教师引导下完成整个操作,试测地点为该小学的实验室,每个任务的试测时间为1.2~1.5小时。教师严格按照教师工作单的环节和要求进行,包括发放与回收学生记录单、发放操作材料、记录观察信息、个别信息提示等。  现场操作结束后,研究者对录制的视频进行分析;同时,结合教师反馈对教师工作单和学生记录单进行完善,结合学生表现对评价标准进一步修订完善。具体包括:1)将初步规划的任务时间由0.5小时延长为1小时以上,以保证学生能有充足的时间完成操作任务;2)增加录制设备以保证录像质量;3)在任务开始前和制作过程中提醒学生大声交流,在任务完成过程中注意记录学生有代表性的语言;4)重新设置材料规格、价格,删除超出学生认知范围的单位;5)修改、完善测评标准,如在交流评价能力中将能说出5种以上材料标定为二级水平,在设计方案能力中考虑设计图、材料选择之间的关联性等。3.4 评价实施流程首先,随机选取某小学2年级学生40人(非试测学生)作为研究对象,其中参加任务一的男生12人、女生8人,参加任务二的男生8人、女生12人。为了便于观察和记录信息,评价地点为该学校内单独的实验室。  其次,确定小组构成形式为男女组合、男男组合、女女组合,每个小组2人,且两个任务小组同时操作,每次时间持续1.2~1.5小时。操作过程由一位经过培训的教师全程参与,包括发放与回收学生记录单、发放操作材料、记录学生操作信息、个别信息提示等。操作过程全程录像,由两台独立的摄像机分别记录每组的操作过程。  最后,研究者对录制的20个视频进行分析,综合分析学生在任务中的行为表现及学生记录单填写情况,对照每个任务的评价标准进行评价,然后对所有学生的技术与工程实践能力进行综合分析。具体评价方法如下:未全部满足一级水平,评定为0.5级水平;全部满足一级标准但不满足二级标准,评定为一级水平;全部满足二级标准,评定为二级水平。3.5 评价结果      表4为样本学生技术与工程实践能力的综合评价结果。      1)界定问题能力。55%的学生达到一级水平,45%的学生达到二级水平。学生的具体表现显示学生界定问题的视角比较单一。在任务一中:所有学生都考虑到文具盒装笔的功能,但几乎没有人对该功能进行细化,更多停留在外观层面,比如“文具盒要好看”;个别小组具有参照实物考虑模型尺寸大小的意识,并考虑其功能,如装铅笔、橡皮擦,坚固耐用,不能被笔戳破等。在任务二中,多数小组能考虑到保护器保护鸡蛋的功能,但仅有个别小组会讨论“要按照鸡蛋的形状来设计”(保证鸡蛋能放进去),或用直尺粗略测量鸡蛋大小以帮助界定等。  2)设计方案能力。40%的学生未达到一级水平,30%学生达到一级水平,30%的学生达到二级水平,说明学生设计方案能力差异较大,部分学生该能力有待提升。具体表现为:①多数学生不会使用长度等数据表达自己的设计,图纸设计不规范。例如:任务一中很多小组的草图绘制不清晰、未进行标注,所有组都未进行长度标注;任务二中多数小组的草图能呈现保护器的形状,经教师提醒进行标注,但标注内容都是材料而非数据。②学生缺少系统思维,不能将材料选择与草图设计相结合,不考虑材料规格和成本,且学生对草图的价值认识不足,选择材料不以草图为依据,多依靠个人经验。如任务二中多数小组选材料的依据不是设计需要,而是哪些材料能直接保护鸡蛋。③学生大多基于已有的知识和经验进行设计,创新设计比较欠缺。例如:任务一多集中于外观性设计,创新多局限在外观装饰;任务二仅有个别小组能联系多个材料进行设计,比如让被包裹的鸡蛋落下后掉在装有棉花的塑料杯中。  3)动手操作能力。达到一级、二级水平的学生均为35%,同时有30%的学生未达到一级水平,说明学生的动手操作能力差异较大,部分学生的动手操作能力有待提升。主要表现为多数学生能安全、规范使用剪刀、胶水等基本工具或材料,但很多小组不能依据草图施工。在两个任务中:①部分学生对直尺的使用不规范或绘图不用直尺等辅助工具;②存在用嘴撕透明胶、使用剪刀吃力、不能区别使用双面胶和透明胶、手工胶使用不当等现象;③多数小组制作过程脱离草图,缺少系统规划,不断重复“自由尝试—修改—放弃”的过程,浪费了很多材料和时间。  4)分工协作能力。85%的学生达到一级水平及以上,15%的学生未达到一级水平,说明大部分学生具有较好的团队意识,但少量学生的分工协作能力有待提升。主要表现为学生基本能参与到制作任务中,但协作能力和应对冲突的能力有待加强。在两个任务中:①所有学生都能在团队中扮演一定角色,但大部分学生没有明确的合作意识和分工意识,多数小组为一人主导,部分学生容易走神、关注其他组,少量学生主动找教师交流,但忽略组员;②任务二中,少数小组在制作过程中存在争吵和推卸责任的情况,比如一名男同学在自己尝试失败后,处于半放弃状态,在旁边观望和催促,并自言自语“不想做了”,交流评价时责怪其他组员。  5)测试改进能力。25%的学生为一级水平,75%的学生达到二级水平,说明学生都有初步的改进意识,多数小组能对作品进行简单改进:任务一中,学生主动将笔放进文具盒测试,能根据观察和反思进行改进;任务二中,学生能积极地测试鸡蛋是否会破。但大部分小组只进行了一次测试,缺乏改进、再测试的意识,且部分小组存在问题不准确或改进方法不合理等现象,如对文具盒的改进多是美观问题,对鸡蛋不能精准掉入塑料杯的问题未能解决等。  6)交流评价能力。80%的学生达到一级以上水平,20%的学生未能达到一级水平,说明学生的交流评价能力发展不均衡,少量学生的交流评价能力需要提升。表现为:①所有学生都能使用简单的语言表达自己的观点,但语言多为词汇且简短、笼统、不够具体,不会举例,甚至不够科学;②表达形式比较单一,多基于作品进行表达,忽视其他工具的应用;③大部分学生具有评价他人的意识,但语言较欠缺,相比之下,评价自己的作品和他人的作品时语言较为丰富,还能通过比较等方式进行说明或提出一些改进建议。4 结论与讨论综合来看,低学段小学生的技术与工程实践能力发展较好,少数学生甚至达到二级水平,但部分学生的相关能力还有待提高。本研究可以得出两个方面的主要结论。其一,低学段小学生的技术与工程实践能力基本达到应达到的一级水平。主要表现包括:能从产品的功能出发界定简单问题;能从形状和大小等角度设计简单的草图,部分地满足任务界定,能根据需要选择一些材料;能在教师指导下安全地使用简单的工具或材料(如剪刀、胶水等)收集信息或进行加工;基本能参与到制作任务中,在团队中扮演一定的角色;能在作品完成后进行简单测试;能使用简单的语言表达自己的观点或评价他人作品。其二,低学段小学生的技术与工程实践能力在各维度上发展不均衡。主要表现为:学生界定问题和测试改进能力发展较好,具有一定的动手操作和参与意识;设计方案的能力不足,图纸设计规范性不够,方案设计过程中还不具备总体谋划的系统思维,创新表现在外观装饰上;材料选择和制作过程容易与方案设计脱节;表达交流的语言比较简单、笼统,有待丰富和科学化。  本研究为小学技术与工程实践能力的教学和评价提供一定参考。基于科学课程学业质量标准对小学生的技术与工程实践能力进行表现性评价,为新课标背景下基于学业质量标准的评价提供了实践经验,为技术与工程实践能力的评价提供了可操作的思路和框架。本研究得出的2年级小学生在界定问题、设计方案、分工协作等方面的表现,有利于教师基于学情进行教学设计并在工程实践过程中理解学生的行为。研究发现可以为小学中高年级开展教学提供一定的诊断评价信息,如研究发现大部分2年级学生没有明确的合作意识和分工意识,即学生虽然在角色上认可了自己的同伴或团队,但在实际行动中无法与团队成员进行较好的分工合作,为小学中高学段教学中关注分工合作策略提供了证据支持。  由于研究工具、实施方式和样本的局限,小学生技术与工程实践能力的发展水平研究还有待进一步改进和深化。  首先,评价任务的设计有待进一步完善。评价任务的设计是小学生技术与工程实践能力评价的一个难点,既要保证评价任务能够全面真实地反映学生的行为表现,又要保证研究者能够依据行为表现准确判断其水平。本研究中部分评价任务要素的表现水平描述还需要进一步的证据支撑,如将“图纸设计满足任务的3个及以上要求”作为任务一的二级水平,虽然在操作层面比较方便,但以“3个”作为分界点是依据该任务的复杂性和试测学生的表现作出的判断,缺少其他证据支撑。  其次,从研究过程来看,本研究采用的表现性评价是在课堂教学之外的专门活动,这种评价方式和环境虽然避免了课堂教学中无关因素的干扰,有利于研究者更加准确地捕捉信息,但学生可能为了讨好教师而过度表现或受到环境影响而发挥失常,如75%的学生测试改进能力已经达到二级水平,即能在完成作品后主动进行测试,并基于测试结果进行改进。《科学新课标》要求3~4年级学生“能发现所制作模型的问题,并进行适当的改进”[1]114;那么,究竟是小学生出于好奇心或成就感而在学习科学课程后确实具备了测试的意识和适当改进的能力,还是在研究实施过程中受到教师行为或语言暗示才主动测试与修改的,还有待进一步研究。  最后,本研究选择的40名学生来自重庆市某周边城区的一所小学,虽然能反映区县普通学校的学生水平,但无法代表中心城区和乡村学校2年级学生的真实水平;因此,还需要对不同经济水平地区的学生表现进行广泛研究。参考文献:

教—学—评一致性视阈下的课堂教学转型

2023-05-04

生物学学科学业质量水平的评价与思考

2023-05-04

数学运算素养的水平划分与评价

2023-05-04