首页    >    教育资讯
何沛芸 卿灿:我国小学生考试焦虑状况、影响及其成因——基于SSES2019调查数据的分析

2024-07-01

原创 何沛芸 卿灿 中国考试 2024-06-28 15:53 北京引用格式:何沛芸, 卿灿. 我国小学生考试焦虑状况、影响及其成因: 基于SSES2019调查数据的分析[J]. 中国考试, 2024(6): 90-99.作 者何沛芸,南京大学教育研究院在读博士生。卿灿,华东师范大学教育学部在读博士生(通信作者)。摘 要:行之有效的考试焦虑干预手段,对于保护中小学生心理健康具有重要意义。本研究采用SSES2019年调查数据对我国小学生考试焦虑状况、影响及成因进行初步探讨。研究发现:我国超过三成小学生存在考试焦虑现象,“考试不自信”是小学生考试焦虑主要表现形式;回归分析发现考试焦虑不利于小学生学业发展,阅读成绩受到的影响最为明显,且“考试不自信”对学生学业成绩的负向影响最大;教师期望和家长期望对小学生考试焦虑具有显著正向影响,学校和家庭因素是造成小学生考试焦虑的主要原因。基于此,研究提出三个方面改进举措,包括优化考试制度、建立情感支持体系,转变教育观念、营造和谐家庭氛围,倡导教育多元、加强家庭学校社会合作。关键词:考试焦虑;小学生;学业成绩;教师期望;家长期望一、问题提出考试焦虑(test anxiety)是学生在学习过程中出现的一种消极情绪状态,主要发生在评价情境中[1],具体是指个体处于考试或其他评价情境时所产生的紧张、不安、担忧以及相应的情绪唤醒[2]。我国学生考试焦虑现象在基础教育阶段较为突出,有调查研究显示,近15年来我国中小学生考试焦虑发生率居高不下,长期稳定在30%左右[3]。这严重影响到学生的认知与非认知能力发展,甚至危害其身体健康。考试焦虑是基础教育内卷现象的一种具体表现,东亚社会一直重视教育,孩子的良好教育需要从小抓起也已成为文化共识。为了“不输在起跑线上”,我国不少学生从小学阶段就被迫卷入以考试成绩为代表的激烈竞争,进而导致考试焦虑的低龄化。为促进学生的全面发展和健康成长,2021年7月,中共中央办公厅、国务院办公厅印发了《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》(以下简称“双减”政策),针对我国中小学生过重的作业负担与校外培训负担现象提出整改举措。2023年4月,教育部等17个部门联合发文《全面加强和改进新时代学生心理健康工作专项行动计划(2023—2025年)》,明确指出要加强学生心理健康工作体系建设,全方位强化学生心理健康教育,健全心理问题预防和监测机制[4]。由此可见,全面提升学生心理健康水平已然成为新时代人才培养的必然要求。考试焦虑现象也成为学界关注的重点问题,近年来国内外学者围绕学生考试焦虑的影响及成因进行了大量讨论。从其影响来看,研究发现考试焦虑不仅对学生智商、课程成绩与GPA、记忆力等认知能力具有显著的负向影响[5-8],而且不利于学生的情绪调节能力、专注度等非认知能力发展[9-10]。不仅如此,有学者指出长期的考试焦虑还会危害学生的身体健康水平,对学生的心肺功能、免疫系统等造成危害[11-12],考试焦虑严重时可能使学生产生抑郁情绪甚至自杀行为[3,13]。因此,分析考试焦虑的影响因素进而对学生考试焦虑进行有效干预十分必要。基于既有研究,可以将考试焦虑的影响因素大致划分为内部因素与外部因素两类。内部因素主要源自学生个体层面,包括基因遗传、情境自我评估、自我认知等。例如,有学者提出特质焦虑有50%左右的差异是基因遗传造成的[14]。同时,个体对所处评价环境的自我评估也会影响其情绪状态,当学生判定所处的考试评价情境对其自身具有一定难度或挑战性时便会表现出较高的焦虑情绪[15]。此外,考试焦虑还受到个体自我认知的影响,自我成就目标较高的学生通常比其他学生具有更高的考试焦虑情绪[16]。外部因素方面,既有研究则主要围绕学生家庭和学校两个方面进行探讨。例如,多项研究指出,父母的教育水平越低、家庭社会经济地位越低、对子女的教育期望越高、采取专制型的教养方式等家庭因素会导致学生更高的考试焦虑程度[17-21];同时,就读于重点中学、学校的课业负担重以及教师消极的教学行为等学校因素也会对学生考试焦虑造成负向影响[7, 22-23]。目前,已有不少学者围绕考试焦虑对学生的影响及成因进行了讨论。首先,从研究对象来看,多数学者主要针对中学生、大学生的考试焦虑,专门探讨小学生的研究并不多见。其次,从研究视角来看,多数研究主要围绕学生个体特征以及家庭因素就考试焦虑的成因进行分析,探讨学校特征尤其是教师特征因素影响学生考试焦虑的研究较少。此外,近年我国学生考试焦虑现象呈现出低龄化趋势,在这样的社会背景下亟须对我国小学生考试焦虑现象做出系统全面的分析,为有效提升学生心理健康素养提供经验证据,从而促进我国基础教育健康发展。基于此,本文尝试分析我国小学生考试焦虑状况,并探讨考试焦虑对小学生学业表现的影响,以及家长期望、教师期望和同辈期望对小学生考试焦虑的影响,以期找到干预小学生考试焦虑的有效办法。二、研究方法(一)研究设计本研究数据来源于社会情感能力调查(study on social and emotional skills, SSES)2019年中国小学生样本。该调查是OECD于2019年在中国、韩国、美国等9个国家开展的针对青少年社会情感能力的一项大规模国际性测评。项目采取两阶段抽样方式在中国苏州调查了3800余名小学生的详细信息,包括学生个人、家庭、教师等方面。首先,对问卷中的信息进行编码、合并,并对缺失值、异常值等进行处理,获得2927名小学生有效样本,其中男生样本1584名,占比54.12%;女生样本1343名,占比45.88%。其次,采用OLS回归方法构建模型分别探讨考试焦虑对小学生学业表现的影响和家长期望、教师期望以及同辈期望对小学生考试焦虑的影响。最后,采用夏普利值法(Shapley value method)深入探讨学生个体特征、家庭特征以及学校特征等因素对考试焦虑的影响程度。夏普利值法采取的是合作博弈论的思想,基于回归模型的估计结果,通过逐步剔除各影响变量展开分解并计算拟合优度的变化量,当拟合优度变化越大时则表明该影响变量对被解释变量的边际贡献度越高[24]。(二)模型与变量首先,根据OLS回归方法设定如下模型,探讨考试焦虑与小学生学业表现的关系:上式(1)中,s表示学校,i表示学生个体;gradeis表示小学生的学业表现情况,调查组收集了受访学生在数学、阅读、艺术三个学科的学校成绩信息,并对原始成绩做标准化处理以保证不同学校间成绩具有可比性,然后将其作为判断学生学业成果的依据之一;anxiousis为小学生考试焦虑情况,调查组询问了学生对“经常担心考试很难”“为了考试学习时会感到紧张”“即使准备很好仍然会担心考试”等问题的认可程度,回答均采用5点计分法(非常不同意=1;非常同意=5),然后根据得分情况计算了学生的考试焦虑指数。根据教育生产函数,影响个体教育产出的投入要素主要包括来自学生个体、学生家庭、教师以及学校等方面的投入[25]。据此在模型中控制一系列混淆变量:①学生特征变量(Xperson, is),根据数据可获得性,选取了学生性别(男生=1)、是否为独生子女(是=1)以及学生自评健康状况(很差=1;很好=5)。②家庭特征变量(Xfamily, is),包括学生父母的年龄情况(24岁以下=1;50岁以上=7)、父母受教育水平(文盲=1;博士=8)以及调查组给出的家庭社会经济地位指数(SES)。③教师特征变量(Xteacher, is),涉及教师性别(男性=1)、年龄、教龄以及教师受教育水平(小学及以下=1;博士=7)。此外,考虑到可能还存在一系列学校因素会影响青少年考试焦虑,模型还纳入了学校固定效应(δs)。εis为随机扰动项。其次,根据OLS回归方法设定如下模型,探讨我国小学生考试焦虑的影响因素:上式(2)中,expectis表示小学生受到来自家庭、学校以及同辈的期望,其中家庭层面来自问项“我父母希望我每件事都做得很好”“我父母总是希望我比别人做得更好”;学校层面来自问项“我老师希望我的作业完成得很好”“我老师对我要求很高”;同辈层面来自问项“我朋友对我的期待超出了我的能力范畴”“我朋友对我要求太多了”。所有问项的回答均采用了5点计分法(非常不同意=1;非常同意=5),为了便于分析,本文对每类变量进行加总处理,最终得到家长期望、教师期望以及同辈期望三个变量。模型中其余变量同公式(1)。各变量的描述性统计结果如表1所示。最后,借助夏普利值法进一步探讨学生个体、家庭以及学校等因素对其考试焦虑的影响程度。夏普利值的具体计算可基于如下公式:上式(3)中,Shxj(f)为变量xj的夏普利值;K为自变量的集合{xj};Θ(K)为K所有的排列组合;θ表示自变量的一组排列;MC(xj, θ)表示变量xj在θ中的临界贡献。三、结果与讨论(一)我国小学生的考试焦虑情况首先根据SSES2019调查中针对小学生考试焦虑所提的三个问题进行描述统计,以探清我国小学生考试焦虑状况,结果如表2所示。根据表2,我国小学生考试焦虑现象较为普遍,有接近70%的受访学生表示自己可能存在考试畏难、考试紧张以及考试不自信等考试焦虑情绪;超过三成的学生明确表示自己存在考试焦虑,且男生所占比例高于女生。从考试焦虑的各维度来看,有38%的小学生明确表示即使自己准备得很好仍然会担心考试,即考试不自信;其次是考试紧张与考试畏难,分别占比34%与33%。可以发现,我国小学生的考试焦虑现象较为普遍,亟须社会各界的广泛关注。他们可能承受着较大的压力,其中包括来自家庭、学校以及社会等方面的期望与要求,这些压力导致小学生即使认为自己已经为考试做好了充足准备,仍然会担心考试失利。同时,统计结果也发现大多数小学生不存在考试紧张问题,这或许是因为我国小学生参加了过多的考试选拔活动,已经逐渐适应了考试带来的紧张感。(二)考试焦虑对小学生学业成绩的影响鉴于我国小学生考试焦虑情况确实存在,有必要进一步探讨考试焦虑会对学生造成何种影响。本文主要从小学生学业表现视角进行了分析,小学生数学、阅读以及艺术成绩在不同考试焦虑组别下的均值如表3所示。根据表3,小学生数学、阅读以及艺术成绩在不同考试焦虑组别间确实存在显著差异,无论是考试畏难、考试紧张还是考试不自信,随着其焦虑程度的加重,小学生的各类成绩均有不同程度的下降,其中,阅读成绩降低最为明显,组间差异最大为2.96个标准分,且在统计意义上显著。为明确小学生考试焦虑是否对其学业表现具有消极影响,本文采用模型(1)进行回归分析,结果如表4所示。根据表4,在控制了学生、家庭、教师以及学校等各类因素的条件下,考试焦虑对于学生的学业成绩确实具有显著的负向影响。其中,小学生的阅读成绩受到考试焦虑的影响最大,考试焦虑指数平均每增加1分,其阅读成绩将会显著下降0.06个标准分。此外,本研究还就考试焦虑不同维度对小学生学业成绩的影响进行了估计,结果如图1所示。根据图1,考试不自信对小学生学业成绩带来的负面影响最大,其次分别为考试畏难与考试紧张;从各科学业成绩来看,依旧是小学生的阅读成绩受到的负向影响最大,其次分别是艺术成绩与数学成绩。由此可见,考试焦虑情绪主要对偏文学科成绩影响较大,而对偏理学科成绩影响较小。这可能与心理学提出的注意控制理论有关,阅读、艺术等偏文学科对个体所需的认知与记忆资源要求更高,因此受到的影响也就更大。(三)影响小学生考试焦虑的因素为探讨如何有效缓解我国小学生考试焦虑问题,本研究对小学生考试焦虑的影响因素进行了分析。表5为基于模型(2)的估计结果,来自家庭、学校以及社会等各方面的压力确实对小学生考试焦虑具有正向影响。在控制学生特征、家庭特征、教师特征以及学校固定效应的条件下,家长的期望程度平均每增加1个单位,将会显著提高小学生的考试焦虑指数0.886分;教师期望、同辈期望平均每增加1个单位,将会分别显著增加小学生考试焦虑指数1.581、0.710。为比较家庭、教师以及同辈等对小学生考试焦虑影响的大小,本文还同时将三个变量纳入回归进行分析。从表4中结果(4)来看,教师期望对小学生考试焦虑影响程度最大,家长期望次之,而相较之下,同辈期望对小学生考试焦虑的影响最小且不显著。类似地,本研究也采取与结果(4)相同的实证策略,就各类期望对小学生考试焦虑不同维度进行了估计。从图2的结果来看,对小学生考试焦虑影响最大的仍然是教师期望,尤其是会影响到小学生的考试畏难情绪;相较之下,家长期望对小学生考试焦虑影响较小,主要是会影响小学生考试不自信情绪;而同辈期望则依旧对小学生考试焦虑无显著的影响。可能的原因在于,小学生在校内与校外的活动中最为经常接触的就是教师与家长,他们的行为态度直接影响着小学生的学习状态与情绪变化。就考试焦虑而言,教师直接决定着小学生的学习任务、考试频率、测试难度等,因此教师对小学生的学业要求和期望越高,往往布置的学习任务越多、考试频率越高、测试难度越大,这将会直接影响小学生的考试焦虑,尤其是会让小学生产生考试畏难情绪。而家长则会通过安排校外学习活动以及平时的言传身教等方式,给小学生传达出对其较高的教育期望,也会对小学生考试焦虑具有一定影响。小学生尤其会担心自己在各种竞争性考试中失利而让家长失望,所以会出现考试不自信的消极情绪。相较之下,同辈对小学生的期望不具有约束性和强制性,因此对其考试焦虑的影响相对较小。最后,借助夏普利值法对模型(4)中各回归变量对小学生考试焦虑的影响程度进行分解,结果如表6所示。从各影响因素对小学生考试焦虑贡献率来看,教师和学校层面的因素确实是影响小学生考试焦虑的最主要因素,贡献率高达55.12%;家庭层面因素次之,贡献率达24%。学校和家庭是小学生活动最为密切的环境,他们的教育和生活都主要在这两个时空环境中进行。其中,学校提供了学习的场所和制度,而家庭则是小学生最早接触到的社会环境,都对小学生的情感、认知和行为发展有着深远的影响,因此学校和家庭对小学生考试焦虑影响的贡献率合计达到80%。而相较之下,小学生的社会圈子相对狭窄,通常在认知、情感和社会发展上还处于相对较早的阶段,因此社会因素对其考试焦虑的影响较小。但需要注意的是,虽然学校和家庭特征因素对小学生考试焦虑的影响较大,但其中实则存在了大量人为难以改变的因素,诸如父母年龄、父母受教育水平、教师教龄、教师受教育水平、学校区位、学校教育理念等等,现实生活中难以通过对这些因素的调控来减轻小学生考试焦虑的程度。因此,从可操作角度来看,外界附加在小学生身上的过高期望不容忽视。表6中的结果也显示,家长、教师以及同辈对小学生的期望对小学生考试焦虑贡献率总计达22.78%,其中影响最大的来自教师期望,其次为家长期望。可见,缓解小学生考试焦虑的着力点应放在教师与家长对小学生的期望上,降低对小学生的预期和要求。家庭与学校合力为小学生共同营造一个轻松积极的成长和学习环境是破解小学生考试焦虑现象的关键。四、结论与建议本文基于SSES2019年中国小学生样本数据,首先从考试畏难、考试紧张以及考试不自信三个方面对我国小学生考试焦虑进行了现状描述,发现我国有超过三成的小学生存在考试焦虑问题,且男生占据比例更大;其中,考试不自信是小学生考试焦虑主要表现形式。其次,通过组间差异分析探讨了小学生数学、阅读以及艺术成绩在考试焦虑不同组别间的差异情况,发现小学生各类学业成绩会随着其焦虑程度的加重而下降;通过回归分析也发现考试焦虑对于小学生的学业成绩确实具有显著的负向影响,其中阅读成绩受到考试焦虑的影响最大;从考试焦虑维度看,考试不自信对小学生学业成绩的负向影响最大,其次分别为考试畏难与考试紧张。最后,从家庭、学校以及社会等三个方面分析了家长期望、教师期望以及同辈期望对小学生考试焦虑的影响,发现教师期望和家长期望对小学生考试焦虑具有显著正向影响,并借助夏普利值法对模型各变量的贡献率进行了分解,发现学校和家庭因素是造成小学生考试焦虑的主要原因,贡献率合计高达80%。基于上述结论,本文从学校、家庭、社会三个层面提出如下几点建议。首先,学校应优化考试制度,建立学生情感支持体系。在中小学阶段,学校是学生生活的核心,其不仅是传授知识的场所,更是学生成长、交流和身心发展的重要场所,因此学校在缓解学生考试焦虑问题上应该发挥重要作用。为此,学校应优化考试制度,在考试频率、考试难度、考试内容、考试形式等方面应做出调整,采取多元化的学业测评方式,弱化传统考试在学生校内学习中的应用。此外,学校还应当建立情感支持体系,一方面要重视培养学生的心理韧性和自我调控能力,为学生提供必要的心理健康教育和咨询服务;另一方面学科教师也应适当降低对学生的学习要求和难度,在布置学习任务时要注意到学生间的个体差异,加强个性化培养。其次,家庭应转变教育观念,注意营造和谐家庭氛围。家庭是学生最主要的生活场所、是学生成长过程中的重要支柱,家长的行为态度、言传身教、教育方式等对于学生的情绪状态和性格养成有着深远影响,有效缓解学生考试焦虑离不开家庭的支持和参与。由于教育竞争激烈,学生面临着家长对成绩的过度关心和过高的教育期望,这容易给学生的教育学习带来沉重心理负担。为此,家长应转变教育观念,摆正对孩子学习成绩的态度,不过分强调分数和排名,合理调整对子女教育的期望,注重学生的全面发展和个性化培养;同时还应该营造和谐的家庭氛围,给予学生充分的情感支持和理解,在其遇到困难和挫折时给予鼓励和安慰,不要过分批评或施加压力,让家庭成为学生心理上的避风港。最后,社会应倡导多元教育,加强家庭学校社会合作。家庭的教育方式、学校的教学理念等都会受到社会教育政策和舆论等社会因素的影响。因此,社会应该倡导多元化的教育观念,使大众认识到教育的目的不仅是为了取得好的成绩,更重要的是为了培养学生的综合素质和个性发展。此外,还应加强家庭学校社会的三方联动,为学生提供多样化的学习机会和资源,鼓励他们积极参与各种实践活动和社会实践,培养他们的多种能力素养和创新精神,共同努力为学生营造一个轻松、积极的校内校外学习环境,推动教育改革和良性发展。“双减”政策对我国中小学生校内课程作业与校外补习培训方面做出明确规定,减轻了中小学生的显性负担。然而,有学者指出家长的教育焦虑情绪并未因“双减”政策的实施得到缓解[26],而这种教育焦虑情绪又具有一定的代际传递性,会对学生情绪和行为产生影响[27],给学生带来隐性负担。本研究从教育期望这一外部压力视角出发,探讨了如何从学校、家庭、社会等方面有效缓解学生的考试焦虑,为重构“双减”背景下的良性教育生态提供了新思路。当然,受数据限制,本研究还存有不足之处,后续可基于“双减”政策实施前后的数据做进一步探讨和验证。参考文献略。

孙杭 金艳:考试分数报告研发的国际经验及启示

2024-07-01

原创 孙杭 金艳 中国考试 2024-06-26 15:10 北京引用格式:孙杭, 金艳. 考试分数报告研发的国际经验及启示[J]. 中国考试, 2024(6): 79-89.作 者孙杭,上海理工大学外语学院讲师。金艳,上海交通大学外国语学院教授(通信作者)。摘 要:分数报告是考试结果的呈现形式,作为考试开发人员与考试使用者的沟通媒介,它在很大程度上影响着考试能否达成预期目的。十多年来,在教育与心理测量领域,分数报告的研究与实践取得丰硕成果。本文聚焦于国际前沿的分数报告开发流程和评价方法,对国内外大型外语考试分数报告案例进行分析,提出我国教育考试分数报告的改革和创新可以从整体规划、理论构建和加强信息技术运用等三个方面展开,为我国分数报告的理论和实践创新提供参考。关键词:分数报告;教育评价改革;研发框架;评价体系;国际经验作为考试结果的呈现形式,分数报告(score report)是实现考试功能的重要环节。Zapata-Rivera等指出,分数报告是连接考试信息和考试使用者决策或行动的桥梁[1]。无论一个考试的构思、设计和实施过程如何科学合理,假如考试使用者不能正确地理解和使用分数报告,则所有前期努力都将付诸东流[2]。分数报告作为考试的外部形象,是公众了解考试信息最直观的材料,直接影响着公众对考试的看法[3]。一直以来,考试研发人员将大部分精力放在如何开发技术上能够通过公众和专业人士严格审查的考试,而对如何组织、报告和使用考试结果的研究相对较少[4]。在很长一段时间里,大多数考试的分数报告几乎只包含总分及对考试使用者来说不太相关的信息,给人留下负面刻板印象,认为考试就是将每个考生标记成一个数字或提供一堆令人无法理解的信息[5]585。有研究表明,无论是教育决策者、教学工作者还是公众,在理解和使用考试结果方面都存在不少困难[6-8]。十多年来,社会公众以及教育界对考试后效(washback)不断反思,促使教育与心理测量领域重新认识和关注分数报告的重要性。有关分数报告的相关研究迅猛增长,已经逐渐成为一个重要且独立的研究领域。同时,分数报告的研究内容也不再局限于分析考试分数的心理测量学特质,而是扩展到如何在设计分数报告时充分考虑特定受众的需求和特征,如何利用不同的图示和支持性材料提高使用者对分数报告的理解,以及如何促进考试信息的合理使用等方面[9]。目前,我国大规模教育考试组织严格规范、命题质量高,但对考试分数报告的关注不足、相关研究也较少,尚未形成独立的理论体系和实践模式。国内有关研究发现,分数报告存在内容和形式单一、对教学和学习的导向作用不强等问题,考生认为现有大规模考试分数报告的丰富性有待提高[10-11]。同时,越来越多的国内学者意识到挖掘和利用考试数据、对分数报告进行改革和创新的重要性[12-14]。鉴于此,本文通过梳理和分析国际教育考试研究中分数报告的基本特征、开发步骤与评价方法,总结大型考试分数报告的实践现状,探索科学有效的分数报告内容和形式,以促进我国教育考试分数报告的理论研究和实践探索。一、分数报告的基本特征由于不同考试的考试目的和分数报告对象存在明显差异,因此并不存在一体通用的分数报告模式。然而,分数报告研发时应考虑的因素和分数报告的构成要素上存在诸多共性。有研究者在总结大量现有分数报告的基础上,构建了分数报告的基本特征汇总表[15],见表1。该框架将分数报告的特征分为八个基本要素,其中:1)报告对象,指报告的使用者,包括学生、家长、教师、教育管理人员等,在很大程度上决定报告的内容和信息呈现方式;2)分数量表,指分数的呈现形式,包括原始分、标准分、百分位数等多种形式,每种分数各有利弊;3)分数参照,指考试分数可以提供学生在学校、地区或国家常模群体中的位置(即常模参照),或学生对某些知识内容的掌握是否达到标准(即标准参照);4)评价单元,包含题目分、单项分和总分,总分是最常见的评价单元,特定知识/技能领域的单项分更能提供对教与学具有指导意义的信息,如提供诊断性反馈;5)报告单元,指报告可以提供给考生个人、班级、学校、地区等不同层面,且每个单元具有独特性;6)测量误差,指报告对考试的测量误差进行呈现和解释,如提供单项分的同时也提供该层面的测量误差;7)呈现方式,指报告中包含的数字、图表、文字叙述三种呈现方式;8)报告媒介,指报告传播的三种方式,纸质版是传统的报告媒介,网络版本(包含静态型和互动型)随着信息技术的发展愈发常见。在上述八个要素中,报告对象和报告单元是对报告目标受众的界定,分数量表、分数参照、评价单元和测量误差四项主要关注考试结果的报告方法,呈现方式和报告媒介强调报告内容的信息呈现方式和发放形式等。在研发分数报告时,考试开发人员首先应该考虑和确认这些基本特征。Zenisky和Hambleton在解析分数报告的基本要素时指出,应充分考虑分数报告的内容(描述和数据)、发放方式(纸质或电子版)、发放对象(个人或群体)[5]586-591。其中,报告内容的描述部分是对分数报告进行基本的描述和解释,具体包含考试名称/标识、考试日期、报告标题、报告目的、考试目的、介绍性引言、考生个体或群体信息标题、附加资源(如课程资料、解释性指南)的外部链接、分数使用指导、术语表、后续步骤等多项信息。数据部分是分数报告的核心,包括总结性结果、表现级别描述、单项表现、题目层面结果、常模参照结果、形成性或诊断性信息、进步情况预测和题目映射(item mapping)等七个主要内容。此外,根据2014年版《教育与心理测量标准》(Standards for Educational and Psychological Testing)要求,考试机构应帮助报告对象正确理解考试分数的意义[16]119。因此,分数报告应清晰、易于理解,且提供分数解释的相关信息,如提供计分方法和分数准确性的说明等。同时还应认识到,分数报告包含的最重要的信息和呈现这些信息的最佳方式取决于目标受众、考试目的及考试分数的心理测量学特质[17]。二、分数报告的研发框架与流程近年来,教育与心理测量领域发表了一系列有关分数报告开发步骤的研究。这些研究为考试开发人员提供了科学合理、基于研究支撑的研发框架,有助于收集相关的效度证据。其中,Zapata-Rivera[18]、Hambleton等[19]、Slater等[20]开发的三个框架应用较广泛,本文以主要研究者的名字命名其框架名称,每个框架的主要阶段划分和具体内容示例见表2。通过对比以上三个框架可知,Zapata-Rivera框架对应Hambleton等框架的前三个阶段,而后者在第四阶段强调发布后的分数报告进行持续调整和维护的重要性。Slater等框架增加制订分数报告研发进度表阶段(阶段二),并强调收集考试委托方反馈(阶段四)和使用者反馈(阶段五)的重要性。总体而言,上述三个框架都强调了报告研发前的准备工作、研发报告样例、收集反馈并加以修订、确定分数报告四个主要阶段。下面以Hambleton等框架为例,对考试开发者在各阶段应采取的行动和注意事项进行详细介绍。(一)阶段一:奠定研发基础Hambleton和Zenisky将分数报告研发的前期基础工作分为四步。第一步是对贯穿整个考试设计的分数报告应考虑的因素进行说明。例如,考试测量什么能力或技能?分数报告想要提供哪些信息?这一步的首要关注点是确保分数报告准确地反映考试想要达成的目标,并在考试开发的最初阶段厘清和说明考试、分数和分数报告的关系。第二步是确认报告对象,即明确根据分数报告做出决策或采取行动的利益相关者。例如,谁是分数报告的主要使用者?他们会根据分数报告做出哪些决策?不同群体对分数报告的需求不同,如教师可以根据分数报告调整教学,学生可以借助报告有针对性地开展自主学习,教育管理部门可以将报告作为评价、筛选的重要依据等。第三步是对报告对象进行需求分析。在与报告使用者的沟通过程中,应关注他们想要了解考试表现的哪些方面,哪些信息对他们有用以及如何获取和使用分数报告等[5]593。对报告对象的分析不仅包括鉴定他们的需求,还包括了解他们的测评素养[1]。测评知识较少的群体需要给他们提供更多的解释性、支持性信息以协助他们正确地理解报告内容。第四步是阅读相关文献,包括行业行为准则和有关实证研究[21]。这些行为准则和研究可以为考试开发人员提供科学可靠的参照。目前,很多考试机构都公开其分数报告样式,通过查阅分数报告实例,可以借鉴先进经验并避免重复他人犯过的错误[2]。(二)阶段二:研制分数报告样例基于阶段一收集到的信息资料,考试开发人员要设计一份或多份分数报告样例。分数报告样例也被称为预期分数报告(prospective score report, PSR),是最终版本的分数报告内容和呈现形式的模型[22]。按照考试开发流程,研发人员应在考试开发初期提前设计PSR,并在考试开发流程推进中根据发展变化对其进行相应的修订。然而,实际情况是很多分数报告经常是在考试开发的最后阶段才被提上研究日程,此时留给设计和修改分数报告的时间和资源都极其有限[5]591,由此导致分数报告可能无法提供一些重要信息。此外,PSR既要与测试目标和特定受众的需求相匹配,还要充分考虑整体设计和信息呈现的清晰程度和准确性,因此需要不同领域的专家通力合作。根据分数报告的形式和功能,专家团队包括专业领域专家、测量学专家、信息技术专家、图表设计师等[19]。(三)阶段三:获取反馈并进行修正这一阶段旨在获取相关人员对PSR的反馈信息,并根据反馈信息修正报告,是分数报告研发过程中不可或缺的重要步骤。首先,进行内部审核并达到满意结果,这需要考试开发人员根据收集到的信息对PSR进行几轮审查和修改。其次,采用问卷调查法、焦点小组法、访谈法、有声思维法、直接观察法或眼动实验等等多种研究方法进行外部审核,既要收集报告使用者的态度和感受,也要探究他们能否正确地理解报告内容。考试开发人员可以给报告使用者提供不同版本的分数报告,以了解他们偏向于哪个版本中的哪些特征[20]。最后,要认真、仔细地分析数据并作为依据修改报告。这是一个不断重复的过程,因为分数报告在版本确定和正式投入使用前必须经过多轮修改。(四)阶段四:评估和维护报告在分数报告正式对外发布后,考试研发人员还要对其进行维护。在阶段三中提及的数据收集方法也可应用于本阶段。评价分数报告需要大规模地收集报告对象的意见反馈,既包括对报告内容和形式的反馈(如信息的可读性、视觉化效果、对不同内容和呈现方式的偏好),也包括对分数报告的理解和使用情况的调查。例如,报告对象能否正确地描述分数的含义?他们根据分数报告做出哪些决策?此阶段应着重关注报告使用者在何种程度上理解(或误解)和使用(或误用、滥用)分数报告,以及由此产生哪些正面、负面的影响等。总之,研发框架可以为分数报告的设计提供科学、有效的模板,使考试开发工作有章可循、有据可依。上述研发框架具有一定的灵活性,可以应用在不同的考试场景中。此外,分数报告的研发步骤已经发展为迭代设计方法(iterative methodology design),即根据需要不断地利用后期搜集的信息修改和重复前期工作[17,19],这种重复的迭代方法在Zapata-Rivera的分数报告开发流程中得到体现,见图1。三、分数报告的评价体系为了确保分数报告的效度,需要对分数报告自身及研发流程等进行客观评估,为此不同学者设计了不同的评价系统,以下三种是比较典型的分数报告评价体系。与分数报告开发框架相对应,Zenisky和Hambleton针对每一阶段如何评价分数报告的研发进程同步设计了评价表,见表3[5]595。该评价表由开放式问题组成,旨在鼓励考试开发者清楚地记录分数报告开发过程中的细节。Zenisky和Hambleton认为,通过明确地记录和说明分数报告的开发过程,考试机构可以积累分数报告开发的效度证据以支持报告的合理使用[5]597。此外,Zenisky和Hambleton还就如何评价分数报告提出37个指导性问题,涵盖八个方面。这里,每个领域仅列举一个代表性问题,具体如下:1)总体方面,了解分数报告是否反映主要利益相关者的信息需求;2)报告介绍和描述方面,了解分数报告是否说明考试目的;3)考试分数和表现级别方面,了解分数报告是否详细描述了所使用的表现级别或心理状态,如合格、不合格,基础、熟练、通过等;4)考试表现指标方面,了解分数报告是否通知报告使用者分数的精确程度;5)分数报告内容的其他方面,了解分数报告是否提供电话号码、网站等联系方式以便报告使用者有问题时可以进行咨询;6)语言表述方面,了解分数报告是否去除对报告使用者来说难以理解的统计学或其他专业术语和符号;7)设计方面,了解报告是否清晰且合乎逻辑地被划分为不同部分以提高可读性;8)说明性指南和其他辅助性材料方面,了解说明性指南是否存在,能否提供清晰、有用的信息等。总之,这些指导性问题是对现有分数报告实践和研究的总结,可以为全面地评价分数报告提供支撑。从考试效度概念中对分数的解释和使用角度出发,O’Leary提出关注结果的分数报告评价方法(outcomes-focused evaluation of score reporting),该方法包含清晰度和实用性两个原则,具体分为七个要素[23]。清晰度要求分数报告能让使用者较为容易地理解,具体包含四个要素:1)设计特征,即分数报告的设计必须基于现有的最佳实践,包括当代最优秀的报告范例、行为准则以及文献建议;2)解释性指南,指分数报告必须是独立的,应将充分理解报告信息所需要的额外工作降到最少;3)呈现方式,指分数报告必须融合多种数据呈现方式;4)语言形式,分数报告的语言必须容易理解,而实用性则要求分数报告的目的、预期解释以及预期的行动与后果等三个要素必须明确。综上可知,上述三个分数报告评价体系存在一定区别,其中,Zenisky和Hambleton设计的第一个评价表,其目的在于评价分数报告研发流程,引导考试开发者对开发步骤进行自查;第二个体系关注分数报告本身,以提问的方式检查分数报告的各个组成部分;O’Leary提出的评价体系源于研究者对分数报告效度的要求,从结果使用角度出发对报告进行评估。考试开发机构可根据自身需要,选择合适的分数报告评价体系。四、国内外大型外语考试分数报告案例的分析比较推进和深化分数报告的改革和创新,应基于对现有实践的了解之上。因此,本研究以Ryan以及Zenisky和Hambleton的分数报告基本特征框架作为理论依据,选取国内外测试人数多、具有一定代表性和影响的七项语言测试的分数报告进行分析比较,结果见表4。上述七项语言测试分别为托福(TOEFLiBT)、雅思(IELTS)、剑桥高级英语证书考试(CAE)、培生学术英语考试(PTE-Academic,简称PTE)、多邻国英语考试(Duolingo English Test,简称Duolingo)、大学英语四级考试(CET-4)和汉语水平考试(HSK)。表4为七项分数报告目前包含的信息类型和信息呈现方式。由于这七项分数报告都包含基本信息(考生和考试信息),因此在表中未重复呈现。本研究关注的重点是考试的分数报告,因此在考试官网出现的其他信息未在表中呈现。由表4可知,现有大型外语考试的分数报告在内容和形式上既存在共性,也有相当大的差异。首先,考试总分是考生最关注的信息。上述七种考试的分制为9~710分不等,说明不同分数报告的评分系统差异很大。Zenisky和Hambleton认为,考试采用不同的计分方法,部分原因是考试机构希望将自己的考试分数与其他考试进行区分,以防止错误理解考试[5]590。然而,繁多且复杂的评分系统会使非测试专家,如考生、家长、教师等群体难以理解分数的真实含义。为了帮助考试使用者进一步理解分数的含义,部分考试提供分数与等级量表的对应关系。例如,IELTS和CAE在分数报告上直接体现分数与欧洲语言共同参考框架(CEFR)的比照;TOEFL和Duolingo虽然没在分数报告上直接体现,但在官网上可找到对应信息,Duolingo还提供与TOEFL和IELTS的分数比照,以帮助读者理解自身的能力水平。其次,在信息的丰富性上,虽然这几种考试对语言技能分类稍有不同,但都提供语言技能的单项分。此外,TOEFL还提供考生的历史最高分,HSK为帮助考生了解其分数在常模群体中的位置专门报告百分等级,CET-4在官网的分数解释中提供常模信息、单项分、总分的百分位表等信息。再次,在提供诊断性信息方面,PTE提供考生个人技能档案,并提供技能定义和个性化建议,以帮助考生进一步了解自己的强弱项。最后,在语言能力描述方面,Duolingo报告考生总体能力,CET-4报告口试中语言能力的三个等级,TOEFL等考试在官网上对不同技能和水平进行描述,但并未体现在具体的分数报告上。此外,上述考试多将比较详细的分数解释性指南放在官方网站上,但考生是否能快速找到这些信息,与分数报告上是否标明其位置有关,其中TOEFL、CAE、Duolingo、CET-4四类考试直接在报告上注明相关信息的位置。下面以Duolingo和PTE两个考试的分数报告为例进行分析,见图2、图3。由图2可以看到,Duolingo分数报告可分为三个区域。第一部分是考生和考试的基本信息。第二、三部分是报告的主体,分别为考生的总分和单项分。在第二部分,报告通过加大字号和橙色字体呈现报告使用者最关注的总分,同时采用要点罗列的方式简要描述考生的总体语言能力,以帮助报告使用者了解考生可以用英语完成的任务。除数字和文字呈现外,报告还用图示方式直观地展现考生分数在量尺上的位置。在第三部分,分别报告阅读和写作、阅读和听力、听力和口语以及写作与口语四个单项分数,同样用明亮的橙色字体进行标示,辅以简洁的文字描述和图形展示。值得注意的是,Duolingo报告在分数展示图中呈现考生总分和单项分的分数范围(score range),这涉及考试分数的精确度(the precision of test scores)。2014年版《教育与心理测量标准》一书中明确指出考试开发者应提供报告使用者有关分数精确度的信息[16]119,有研究认为分数精确度的信息有助于防止使用者对分数信息过度解读[7]。Duolingo以图示方式展示考生分数范围的作法,既遵循了优秀分数报告的实践标准,也对如何报告分数精确度进行了有益探索。然而,由于报告上并没有对分数范围的含义进行解释,因此使用者是否理解该部分信息仍有待研究。最后,Duolingo报告还在底部通过“了解更多”信息告知考试使用者有关测试评分详细信息的网址,并用橙色字体进行提示。Duolingo的分数报告简洁清晰、可读性强,没有过多的信息堆积,在空间组织、颜色运用和图表、文字、数字搭配上科学合理,符合有效的分数报告的基本原则,给考生提供分数范围也是一个亮点。然而,有研究发现报告使用者通常难以理解分数精确度的相关信息[7](如标准误差和置信区间等),如果能辅以适当解释可能会有更好的效果。图3为PTE的分数报告。该报告包含四个分区。第一分区是考生考号和注册信息,右侧是考生总分,并通过图形化和背景色方式突出信息重要性。第二分区是听、读、说、写四个交际技能的单项分,同样通过图形和颜色进行强调。第三分区分为两个部分,左侧用柱状图再次呈现单项技能得分和总分,更直观地展现分数间的对比;右侧呈现考生信息。第四分区位于报告底端,是考场信息。当考生在线阅读PTE报告时,还可看到包含口语和写作的开放式作答、短篇写作等八个子技能的个人技能档案,同时还有技能的概述和个性化建议。其中,个人技能档案部分用耳机、书本、对话框和钢笔等图形形象地展示了所涉及的单一或多种技能,并用柱状图展示该领域的能力水平,建议部分则采用要点罗列的文字叙述。这些针对考生个体的详细的诊断性信息可以帮助考生了解自己语言能力的强弱项和未来学习的方向,有助于考生进行有针对性的自主学习。从内容上看,PTE分数报告信息丰富,除报告考生和考试信息、总分、单项分以外,还提供详细的诊断性信息和未来建议,提升考试的促学功能;从呈现方式来看,报告有效地将数字、文字和图表结合起来,但第三分区右侧考生信息部分的排版或可进一步优化,如合并到第一分区中可能会更加清晰。总体来看,上述报告展现了一些优秀的分数报告的样式和内容,包括利用不同形式呈现信息(包括文字、数字、图表)、对重要信息进行突出强调、根据内容重要性合理分区、提供分数解释性指南等;但也存在一些问题,如部分报告缺乏个性化反馈信息、缺少其他资源的具体位置信息等。五、对我国教育考试分数报告改革的启示我国教育考试的种类多、规模大、社会影响深远,对促进教育公平和社会稳定发挥着重要作用[26]。考虑到考试分数对社会的巨大影响,考试机构应充分认识考试分数报告的重要意义,积极探索分数报告的改革。具体而言,借鉴参考国际先进经验做法,我国未来的相关研究和实践可从以下三个方面展开。第一,整体规划考试项目,从研发最初阶段即对分数报告进行全面的设计和考虑。主要有四方面需要提前重点规划:1)确定考试的性质和目的,充分考虑教师、学生、学校等相关方面的信息需求和测评素养;2)将分数解释指南等辅助性材料的研发纳入设计方案,例如,在研发和评价分数报告样例时,应运用不同的实证研究方法(如有声思维、问卷、访谈、眼动实验)调查各类报告使用者(如学生、教师、教育管理人员)对分数报告的态度、偏好、理解,并依据使用者的反馈进行相应修改;3)分数报告发放后,采用追踪研究、个案研究、民族志研究等研究方法持续调查报告使用者依据报告做出的决策和采取的行动,特别要关注分数报告对学生学习和教师教学的导向作用;4)积极借鉴国际前沿的分数报告开发框架和优秀案例,并详细记录和评价具体开发流程,收集分数报告开发的效度证据。第二,进行理论构建和创新,形成本土化的分数报告开发和评价的行为准则和指导方针。理论构建包括分数报告的基本特征、开发步骤、评价方法和效度验证等方面。行为准则和指导方针是对优秀分数报告应该遵循的原则和标准的界定,具体可参考2014年版《教育与心理测量标准》中有关分数报告的行业标准[16]119-144,以及国际测验委员会(International Test Commission)于2014年发布的分数报告质量标准的指导纲要[27]。建立本土化分数报告的行为准则和指导方针,有助于规范我国教育考试分数报告的实践,提高分数报告质量。第三,积极探索信息技术,特别是人工智能辅助下的在线互动型分数报告的设计开发和应用。在线互动型分数报告允许报告使用者选择和排序所展示的信息、探索更深层次的信息、改变信息呈现的方式,使针对性、个性化的立体多维的分数报告成为现实。然而,开发互动型报告的步骤和应遵循的原则与传统书面报告有哪些异同,在技术上如何实现突破,都值得进一步研究探索。在线互动型分数报告的研制离不开跨学科领域专家团队的通力合作,应充分挖掘认知科学、信息设计学、美学、用户界面研究等领域在分数报告设计开发中的应用和作用。对考试分数的解释始于人们阅读分数报告,因此,分数报告的设计和发放直接影响考试效果[17]。优秀的分数报告应该以考试利益相关者能理解的方式给他们提供所需要的信息,从而帮助他们采取合理的行动[2]。在深化新时代教育评价改革的背景下,国内相关领域应转变和创新分数报告的设计理念,深入挖掘考试数据以提供多维、有效的分数报告,为教学和学习提供丰富的信息反馈。通过帮助和引导大众正确理解和使用测试结果,构建和推进科学的教—学—评联动体制,从而提升教育考试的整体质量。参考文献略。

王佶旻:建设服务国家战略的教育评价学:教育评价与治理专业建设与实践探索

2024-05-20

引用格式:王佶旻. 建设服务国家战略的教育评价学: 教育评价与治理专业建设与实践探索[J]. 中国考试, 2024(5): 13-16.作 者王佶旻,北京语言大学国际学生教育政策与评价研究院院长,教授。一、教育评价学学科的源头与内涵2024年1月发布的《研究生教育学科专业简介及其学位基本要求(试行版)》(以下简称《研究生专业简介及要求》)首次将教育评价学正式列为目录内的二级学科[1],这标志着教育评价学在教育学一级学科内有了正式的学科地位和身份,学科建设自此也有了明确的目标、要求和标准。教育评价学虽然刚刚取得正式的学科身份,但并非新生事物,相似的学科或专业在心理学和教育学中早已有之。因此,在学科建设之初有必要先厘清学科体系,明确学科定位及内涵。探索分析教育评价学的源头,可以从教育评价学科的发展脉络开始梳理。《第四代评估》中提到,教育评价的发展大致经历了测量、描述、判断、建构及综合等阶段[2]。随着社会的不断进步和教育的高质量发展,教育评价的目标不断升级,从追求测量与测量结果的标准性、客观性到对事实的描述和解释,再到以多元化的价值标准评判个体发展、以评价建构认知过程和思维模型[3],教育评价的作用越来越重要。从学科发展背景来看,我国的教育评价理论研究起步较晚。自20世纪80年代以来,有关教育评价理论和方法的研究发展迅速,并逐渐呈现评价内容全面性、方法多样性、主体多元化以及日益注重评价的教育性和发展性功能等特点[4]。在此基础上,教育评价的学科内涵得以进一步厘清。《研究生专业简介及要求》中明确指出,教育评价学是一门研究教育测量与评价的理论、方法、技术、工具,为教育督导、监测、诊断、决策、改进提供科学指导的基础性、应用性和综合性学科[1]。由此可以看出,教育评价依据一定的教育价值观或教育目标,运用可操作的科学手段,通过系统地搜集信息、资料并对其进行分析和整理,以实现对教育活动、教育过程和教育结果的价值判断。教育评价的本质是一种价值判断,可操作的工具是实现价值判断的必要前提。因此,教育评价学兼具价值属性与工具属性、基础性和应用性,且具有较强的综合性,在学科建设和人才培养上也应具有高度的综合性目标。教育评价的内涵还可以从不同的范畴和视角进行阐释。从标准范畴来看,教育评价可分为相对评价、绝对评价、个体差异评价、常模参照评价及标准参照评价;从功能范畴来看,可分为诊断性评价、形成性评价、终结性评价;从对象范畴来看,可分为整体评价和单项评价、群体评价和个体评价;从过程范畴来看,可分为高等学校评价、中等学校评价、初等学校评价、职业学校评价、专业学校评价、师范学校评价、特殊教育学校评价;从主体范畴来看,可分为自我评价和他人评价;从方法范畴来看,可分为量化评价、质性评价等;从工具范畴来看,可分为经典测量理论、概化理论、项目反应理论、数据建模、德尔菲法等[5-7]。二、学科建设的理念与特色教育是一项复杂的社会系统工程。教育评价是指挥棒、风向标,也容易成为制约教育理念、教育制度、教育管理等方面长足发展的“卡脖子”难题。教育评价学科建设的理念应基于“国家需要什么、我们有什么”两个方面进行深入思考[8],北京语言大学教育评价与治理专业的建立较好地回答了这两个问题。为深入贯彻落实习近平总书记关于教育的重要论述,扭转不科学的教育评价导向,中共中央、国务院于2020年10月印发《深化新时代教育评价改革总体方案》(以下简称《总体方案》),明确提出“支持有条件的高校设立教育评价、教育测量等相关学科专业,培养教育评价专门人才”[9]。为积极响应、切实推进《总体方案》落地见效,系统化地培养教育评价领域的高素质人才,北京语言大学于2021年在教育学一级学科下自主设立教育评价与治理专业,并成为国内首个在该领域拥有硕士点的高校。教育评价与治理属于教育评价学,可谓开我国教育领域独立设置教育评价学的先河。在“国家需要什么”层面上,北京语言大学充分考虑国家教育评价体系未来发展的实际需求,找准教育评价切入点,优化教育评价理论工具,逐步推动构建了富有特色的教育评价学科体系。教育评价改革是全社会共同关心的话题,涉及社会的方方面面;因此,评价改革的主体既包括党委和各级政府,也包括学校、教师、学生及社会用人单位等组织。基于此,“教育评价与治理”学科以服务国家战略为总目标,以构建新时代教育评价理论与人才培养体系为基本目标,紧跟社会需求的“做实”理念,结合教育实践,为国家和社会培养、输送教育评价领域的专业化高素质人才。在“我们有什么”层面上,应结合高校、院系的客观实际,充分发挥自身优势办教育、建学科。北京语言大学根据自身办学基础和特点,将教育评价与治理专业定位为以教育学为核心,以心理学、语言学、计算机科学等学科为支撑的交叉学科;在发展方向上,教育评价与治理专业以教育评价为本,立足既有学科和研究基础,突出自身优势和特色。目前,北京语言大学“教育评价与治理”学科的主要研究方向有三个:一是国际学生教育评价与治理,具体内容包括国际教育评价与政策研究、国际中文教育拔尖创新人才培养研究、教育对外开放动态监测数据库建设、国际中文教育评价与治理智库建设、国际学生教育质量与评价标准研究、中文教师发展与评价研究等;二是少数民族语言教育评价,具体内容包括少数民族地区国家通用语言文字教育监测、少数民族国家通用语言文字教育评价智库建设、少数民族语言测试和标准化等;三是儿童语言发展与评价,具体内容包括特殊儿童语言发育评价、儿童语言发育异常评测、自闭症谱系语言评测、语言障碍的发病机制和干预策略、儿童语言康复、特殊儿童语言资源库建设等。教育评价与治理学科有两个突出特点。一是交叉性和融合性。与传统的教育学科不同,教育评价学将测量学、统计学、认知神经科学、管理学、计算机科学等学科有机融入教学和科研,为学科建设提供多方面支撑。在学科建设过程中,以拓展新的学科增长点、丰富学科内涵、构建良好学科生态作为衡量学科高质量发展的重要目标,以扎实的理论研究和创新实践为依托,切实使新兴交叉学科发展成为推动新文科建设的动力。二是在学科内涵与外延上体现国际化、开放性。北京语言大学是一所国际化程度很高的大学,素有“小联合国”之称,在国际化教育评价方面具有不可替代的作用,也为教育评价的国际推广创造了有利条件。因此,学科建设的关键点之一是建立教育评价国际化的交叉学科平台,结合国家教育发展需求,培养具有国际视野的教育评价与治理人才。三、学科建设的路向与发展目前,我国教育评价学的学科建设具有共性特征,其发展路向和重点是回答好“我们要做什么”的问题,目标是建立教育评价学的自主知识体系和人才培养体系,构建中国特色、世界一流的教育评价学。在建立教育评价学自主知识体系中应做好三方面工作。首先,要以我国实际情况为研究起点,提出具有主体性、原创性的理论观点,助力构建彰显中国特色、体现世界水平的学科体系、学术体系和话语体系。其次,要以“引进来,走出去”的方式深入研究国际前沿的教育评价理论,探索国际认可度高的教育评价方法和国际通行的评价体系,使其服务于我国的教育评价改革实践。最后,还应针对当前教育评价理论创新主导能力不强、实践普及和应用范围不广、专业人才匮乏等问题,建立既符合本土教育发展要求又具备较高国际认可度的教育评价体系,并对其进行创新性实践[10]。在人才培养方面,应积极探索新时代学科建设的理念及创新做法,以“德才兼备、学科交融”为导向进行课程体系构建,加深专业基础、加强学科交叉融合。在学术团队建设方面,应着眼于学科的长远发展,构建“专而特”的教师和学术研究队伍。以北京语言大学设立的教育评价与治理学科为例,学校及院系在人才培养方面积极思考、勇于探索富有特色的培养模式,逐步实施专业导师贯通制培养模式。所谓贯通制培养,是指研究生入学后不仅可以选定一位指导教师和一个专门的研究方向,还可以根据自己的研究兴趣选修其他教师的精品导师课。同时,该学科的每位导师都要推出一堂或几堂精品导师课作为公开课,这样不仅可以拓宽学生的视野和研究领域,还有助于培养一专多能的人才。目前,北京语言大学的教育评价与治理专业已经招收两届硕士研究生,这些学生的来源广泛、专业背景多样,本科修读专业涵盖了数学、管理学、教育学、文学等多个一级学科。这样的生源结构虽然符合教育评价学“专而博”的特点,但对人才培养的理念和方法也提出了更高的要求。未来,学校和院系在学科建设和研究工作中,将专注于课程体系建设、科研实践创新、一流人才培养、合作渠道拓展等四个主要任务,构建服务于新时代教育评价改革的自主学科体系,致力于培养教育评价领域的专业人才。具体措施包括以下四个方面:1)完善课程体系,打造精品课堂。在专业设立之初,学院开设40门专业课,主要包括基础课、主干课和选修课等。在专业建设过程中,学院有关部门逐渐意识到精品课程的重要性,并迅速制定精品课程计划,希望通过优秀的样板课程逐步提升教育教学质量。2)搭建研究平台,鼓励实践创新。教育评价学是一个实践性很强的专业,学生不能只局限在书本和课堂中,一定要有实习或实践经验。因而,学院与多家单位建立实习合作平台,鼓励学生走出校门,积累实战经验。3)加强师资建设,培养一流人才。与教育评价人才短缺的情况相似,教育评价学的师资也极为匮乏,因此,亟须借助教育评价学科建设之机,加强师资队伍建设,为培养一流评价人才打好基础。4)汲取先进经验,拓宽合作渠道。在学科建设过程中,学院有关部门收集了大量国内外高校和科研机构关于教育评价专业人才培养的方案、课程、实践模式、就业渠道等资料,并结合我国学科建设的实际情况汲取先进做法。未来,学校还将持续拓宽学术交流渠道和平台,与国内外知名大学、考试机构建立合作平台和联合研究中心,并尝试开展实质性合作项目。总之,教育评价学的建立和发展是时代之需、社会之需,理应在新时期为国家教育评价改革和教育强国建设提供理论、技术及人才的支撑和保障。 参考文献略。(免责声明:本文转载于《中国考试》公众号,转载旨在分享与交流,版权归属于原作者,文章观点与本栏目无关。如涉侵权,联系立删!)

余清臣:面向良好教育生态的教育评价学学科建设

2024-05-20

引用格式:余清臣. 面向良好教育生态的教育评价学学科建设[J]. 中国考试, 2024(5): 8-12.作 者余清臣,北京师范大学教育学部副部长,教授。作为热门的研究与实践领域之一,教育评价对教育根本价值的实现与教育质量的提升所具有的推动作用越来越受到重视。2024年1月,《研究生教育学科专业简介及其学位基本要求(试行版)》发布,教育评价研究迈入学科化时代,教育评价学自此将以学科的身份和组织形式开展研究探索和知识积累。在推进教育评价学的学科发展中,深化和扩展教育评价学的社会使命担当至关重要,如何从学科整体建设的角度确保教育评价为建设良好教育生态作出应有的贡献,是一个特别值得关注的问题。一、教育评价与教育生态教育作为一项重要的社会事业在每个历史时期都有着发展的使命和追求,在当前更是要以高质量发展为核心战略任务。在谋划教育高质量发展的过程中,坚持系统观念和问题导向是两个尤为重要的指导思想。在这两个指导思想的指引下,教育的高质量发展就是教育的系统发展,也是教育突破一个个重大问题以达到系统性升级的过程。要实现教育的高质量发展,首先要从系统上认识和思考教育,教育生态的理念和思想在这个方面有着丰富的研究积累。正是在促进教育整体发展和优化教育各类参与主体存在状态的目标引领下,生态系统的思想理论开始被用来解读教育问题和筹划教育发展。在这个方面的众多研究中,范国睿的相关研究具有代表性。他对教育生态系统的理解建立在这样的生态系统观之上:“生态系统是指一定地域(或空间)内生存的所有生物与环境相互作用的具有能量转换、物质循环代谢和信息传递功能的统一体。”[1]与此同时,他提出教育生态学的两个基本理念——生态系统和生态平衡。这些观点表明,教育生态的根本思想就是以生态系统的观念认识理解教育,并在此基础上推动教育发展达到生态系统意义上的动态平衡发展状态。可以说,教育生态的视角和方法对追求教育高质量发展具有重要意义,对当代教育高质量发展的追求和追问可以按照教育生态发展的逻辑进一步展开。在问题导向理念的指引下,当代教育特别要重视较为严重的教育生态问题。2018年下发的《国务院办公厅关于规范校外培训机构发展的意见》和2021年中共中央办公厅、国务院办公厅印发的《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》是应对教育生态问题的两个代表性文件:前者指出“开展以‘应试’为导向的培训,造成中小学生课外负担过重,增加了家庭经济负担,破坏了良好的教育生态”,后者提出“构建教育良好生态”的重要指导思想[2-3]。可以看出,教育生态已成为国家重大教育政策的重要主题,构建良好的教育生态已成为党和国家的一个奋斗目标。在教育生态失衡或被破坏的多方面表现中,一个比较核心的影响因素就是作为教育评价形式之一的考试。可以说,以考试为主要形式的教育评价带来学生沉重负担、教育内卷化、学校-家庭-社会教育协同失序和公众教育焦虑等不少教育生态问题。教育评价在实质上是教育质量管理的一个必要手段,其支撑的各种教育质量管理措施在根本上影响着各种教育生态主体的存在状态,扭曲的教育评价导致多种教育生态主体及其相互关系的异化。关于教育评价的定义和解释,存在很多不同界定,其中较为独特的是泰勒的教育评价观。泰勒认为,教育评价“已被看作是在教育情境中找出实际发生的事情,从而指导计划和行动的过程”[4]。同时,也有不少对教育评价内涵的概括性解读。有研究者指出:“目前在广义上使用这个概念(即教育评价)时,它包括了所有的和教育活动有直接或间接关系的实态的把握以及价值的判断。”[5]对待这样的教育评价定义分歧,一个相当可行的办法就是在结构层次上有机组合它们,由此得出对教育评价的系统解读:教育评价在主体过程上是对教育的实态把握和价值判断,此层面教育评价的结果是关于教育特定实际状态和价值的认识和判断;教育评价在功能机制上是依据某种实际发生的教育来指导教育的计划和行动,此层面教育评价的结果是基于教育实际把握的教育计划和行动指导。此外,“计划和行动指导”这个教育评价功能表述意味着,教育评价的根本功能就是促进教育计划和行动,即对教育质量进行管理提升。在这个意义上,教育评价一直坚持追求更高教育质量。事实上,教育评价的出现和发展源于对教育质量把握和提升的需求,因而也是把握和提升教育质量的教育实践活动。一般来说,教育具有选拔和培养两个方面的基础功能,无论是为选拔筛选提供依据还是为培养促进提供方向,都需要通过教育评价把握教育现实。正是在为教育质量提升提供支撑的逻辑上,教育评价直指服务于选拔筛选和培养促进,因而其从根本上会影响教育生态主体的存在状态。从根本上看,良好或平衡的教育生态应该是这样的:特定领域中多种教育主体在动态关系上相互适应和契合,多种教育生态主体在特定领域中都能从所处环境中获得生存发展所需的能量、物质和信息。从现实情况来看,教育评价时而会出现一些扭曲问题,当前最为典型的就是“五唯”教育评价。从教育评价的功能机制来说,教育评价的结果通常主要用于教育质量管理意义上的选拔筛选和培养促进,这个基本定位既适用于学生评价又适用于教师评价。“五唯”教育评价的实质是以片面维度的评价作为实施特定整体教育质量管理措施的核心依据,这实质上也是“小评价大应用”问题或片面独断型教育评价问题。在片面独断型教育评价中,各种教育生态主体因为教育评价不全面、不科学和不公平而被归入不合理的教育生态位置,逐渐割断与周围世界的合理关系。罗萨认为,加速的世界对于主体来说“已经变得沉默、冷淡、默然”,这种“自我与世界之间的沉默、冷淡、默然”就是最外显和深层的异化形式[6]。从现实表现来说,扭曲的教育评价所导致的教育生态失衡风险常常突出表现为以下三个方面。第一,扭曲的教育评价容易导致学生在教育中的异化。就较受大众关注的教育生态危机而言,仅以部分科目的考试成绩来评定和对待学生的做法,极易使学生陷入拥挤竞争地带,进而对所处教育生态环境产生沉默和冷淡。扭曲的教育评价还会导致内卷化、刷题和疯狂的校外补习等一系列教育生态失衡问题。第二,扭曲的教育评价容易导致教师在教育中的异化。与学生的情况类似,教师在日常教育工作中也是被频繁评价的对象。实际上,专业工作需要专业知识的引导和支持,而专业知识生产领域中作为学科规训方式的考试评分也必然会渗透到各种专业工作领域,这就是霍斯金所揭示的考试评分做法在现代社会中的蔓延[7]。实际上,“五唯”教育评价同样会把教师挤入拥挤竞争地带,进而导致教师对所处教育生态环境更沉默和冷淡,即教师在教育生态环境中的收缩状态。这种教育生态无法使教师在更广泛和积极的关系中得到自身发展所需要的能量、物质和信息,更无法使教师向学生或其他教育生态主体积极传递应该传递的能量、物质和信息。第三,扭曲的教育评价还容易导致学校、家庭和社会的教育异化。在理想的教育生态中,多种育人主体能够积极地围绕培养人的核心任务结成紧密的关系网络。一旦片面独断型的教育评价在教育生态中蔓延,各种教育主体也会因此把自身的活动收缩到片面独断型教育评价所定位的领域空间中:家长只关注孩子的考试成绩,教师只关注如何写论文,学校、家庭和社会也不可能围绕学生的全面发展结成丰富的教育生态关系。在这种相互割裂或断链的状态下,教育生态对多个育人主体不再富有营养,教育生态的平衡发展更是无从谈起。二、建设面向良好教育生态的教育评价学学科的根本含义是被学术主流承认的组织结构性知识分化,教育评价学的学科建设在不断巩固发展对应知识板块的同时,要从根本上追求更大范围和更高层次的承认。在衡量一个研究领域是否够得上学科水平的问题上,不少人提出专门研究队伍、专门研究方法、专门学科组织、专业学术出版物等方面标准的要求,但这些硬性标准与不少学科的发展状况也常有或多或少的出入。因此,在关于学科性和学科内涵的探索上,有观点认为:“学科的概念并不是完全直接明了的……这取决于起主导作用的学术机构在多大程度上承认它们以组织结构形式进行的分化,也取决于国际学术共同体的独立程度,如是否有自己的专业协会和专业期刊。”[8]在这种学科观中,学科发展要特别关注学术主流承认、组织结构性知识分化和学术共同体独立性等特征,其中最重要的是学术主流承认。无疑,一个研究领域得到学术主流承认,并不只是因为其研究成果或知识品质,一定还包括是否分担了知识界应该担当的社会责任与使命。就教育评价学所属的教育学科来看,要担当的社会责任与使命在最为直接的意义上就是为持续推动教育改革发展作出贡献,即为高质量发展的教育负责。只有教育评价学独立自主地分担高质量教育发展的相应责任与使命,才可能让自身的研究成果和学术共同体得到更高水平的学术主流承认。实际上,教育评价的伦理问题已经引起不少关注,这既源于教育评价本身具有的社会实践性,又源于教育评价之于教育实践发展的重大意义和风险。有研究指出:“教育评价备受重视,但教育评价伦理准则尚未系统地建立起来,这就导致教育评价问题严重,而且致使教育评价成为我国教育改革与发展的桎梏。”[9]在教育评价发展较快的发达国家,教育评价的伦理问题也逐渐成为教育评价研究的一个重要领域。有研究指出,美国在20世纪80年代以后就开始对教育评价伦理问题进行研究[10]。已有教育评价伦理研究所提出的具体教育评价伦理准则存在视角和侧重点上的不同,但均体现出教育评价要为教育发展和教育中的人负责的明确意识。教育评价学的学科化发展要为教育生态负责,要面向良好教育生态,这是教育评价学更能得到学术主流承认的一个重要基础。一方面,既往教育评价实践凸显了其对教育生态状况的积极或消极影响;另一方面,教育评价在功能逻辑上要支撑人才选拔筛选、对学习的促进和对人的培养,而这必然会改变教育生态主体的位置与境遇。基于教育评价与教育生态之间的密切关系,教育评价学的学科化建设要特别注重从学科使命、研究主题、研究过程和研究成果四方面加强教育生态意识,以提升教育评价学对良好教育生态建设的贡献度。第一,教育评价学要明确学科发展的教育生态使命。在学科化发展的进程中,教育评价研究要实现更高水平的组织结构性。为此,要把教育评价学学科发展的根本使命和行动战略变为所有学科建设者都要遵守的规范,以此保障教育评价学的长久发展。换言之,从根本上讲,要建设保障教育评价学科化发展的学科规范,即人们常说的学科规训制度,而为教育生态负责就是教育评价学学科规范的一个重要组成部分。学科规范就是一个学科事实上承认和遵守的章程,主要用以明确本学科的性质、使命、原则、领域设置、组织机制等内容。为教育生态负责,意味着教育评价学的学科规范在使命、原则甚至领域设置中要体现教育生态使命。学科规范可以在很多方面发挥作用,其中最为重要的就是,它是学科内最通行和最重要的考核和评价标准。为教育生态负责的使命,最终要渗透到教育评价学学科内部考核和评价的广泛标准中。第二,教育评价学要强调研究主题的教育生态审视。具有教育生态关照意识的研究选题是教育评价学担当教育生态使命的一个必然要求,这就需要对教育评价学研究主题选定进行引导和规范。一个学科的发展离不开重要研究主题的选择,而依据什么标准来选择重要的研究主题就成为需要进一步探讨的问题。从当今流行的教育研究思路来看,问题导向是比较主流的共识和方向,即教育研究应注重紧扣时代脉搏、聚焦中国问题和突出问题导向[11]。无疑,从问题出发确定研究主题,突出问题导向,也是教育评价研究的主流趋势。在一些专门研究中,问题常常被界定为期待的状况与现状之间的落差[12]。基于这个定义,教育评价学要在研究主题上找到有价值的问题,就是要从教育评价相关的现状及其相应的理想之间确定落差。遵循这个逻辑,教育评价学要面向良好教育生态,为教育生态负责,就需要做到如下三点:首先,要关注与教育评价密切相关的教育生态失衡现状,从中分析教育评价现状;其次,要确定与教育生态失衡现状相对应的教育生态理想,从中分析教育评价理想;最后,对比教育生态及相关教育评价的现状与理想,找出教育评价在理想与现状之间的落差。总体上说,教育评价学的学科发展强调在对教育生态审视中发现教育评价问题,以此作为教育评价学的重要研究主题。第三,教育评价学要加强研究过程的教育生态思维。在不当教育评价可能导致教育生态风险的逻辑中,非常关键的环节主要有以片面维度的指标作为对评价对象进行整体判断的核心依据,基于这种片面独断的评价结果进行选拔筛选或培养促进。为了避免教育评价导致教育生态风险,教育评价学在发展中要特别强调研究过程中的教育生态思维渗透。这实际上包括两个方面:一方面,教育评价学在评价方法研发研究中要特别强调全面意识、科学意识和公平意识,要精准把握评价指标对评价对象的指示性范围和程度,不让片面的评价指标直接等同于对象整体;另一方面,教育评价学在评价功能研究中要特别强调对教育生态主体进行必要的保护和尊重,在根据教育评价结论进行的选拔筛选和培养促进策略设计中要贯彻生态平衡思维,避免在教育评价结论的功能实现中让相关教育生态主体的存在发生异化和扭曲。第四,教育评价学还要系统提升研究成果的教育生态价值。教育评价学要面向良好教育生态和为教育生态负责,除了做好学科规范、研究主题选择和研究过程中的思维渗透外,还要有一个重要的努力方向,这就是建立教育评价生态学的专门研究范畴。从非学科化发展到学科化发展阶段,必然要求学术研究活动的组织结构化,而组织结构化的学术研究在整体目标上就是建设内在契合、衔接紧密和覆盖全面的学科研究体系。对教育评价学来说,坚守教育生态使命、强调教育生态审视、加强教育生态思维渗透等均能提升相关研究的教育生态价值。但是,这里面还有一个缺失,即教育评价学如何在整体和系统层面持续为教育生态发展负责。为弥补这个缺失,教育评价学应从学科范畴上作出筹划和努力,具体就是要通过不断积累和积极筹划在教育评价学的学科中发展出教育评价生态学的新研究范畴或学科分支。可以期待,教育评价生态学以教育评价的教育生态使命、原则以及相关的重要主题为主体内容,在综述已有相关教育评价研究的基础上推进对教育评价生态问题的系统思考与持续探索。 参考文献略。(免责声明:本文转载于《中国考试》公众号,转载旨在分享与交流,版权归属于原作者,文章观点与本栏目无关。如涉侵权,联系立删!)

安雪慧 张琨:信息技术增效作业育人改革的困顿与突破

2024-04-09

摘要:如何借助信息技术特点和优势增进作业育人功能,是当前教育教学改革中需要关注和解决的现实问题。近年来,各地和学校开展了信息技术助推中小学作业育人改革的积极探索,但也出现了一些实践困顿:将传统作业简单电子化、库存化,信息系统平台建设缺乏整体规划,作业设计从题库里简单“拿来”,作业批改简单依赖系统“对错式”标记,作业点评反馈异化为系统推送作业,作业教研机械依靠系统或第三方平台,家校协同简化为系统平台搭建。未来,以信息技术增效作业育人改革,需要对信息技术增效作业育人功能有充分认知,将作业管理信息平台建设纳入省域基本公共教育服务,建立区域作业管理大数据库,充分依托作业管理信息系统数据开展教学基础研究,加强参与者应用作业系统及资源的能力建设。关键词:信息技术;作业育人;作业管理;作业改革随着信息技术的不断发展与完善,新技术在教育领域的广泛应用已成为一种现实和趋势。如何在中小学育人实践中用好信息技术,成为新时代信息技术与教育教学深度融合的难点和热点问题。从国家教育综合改革制度设计和实践路径看,改革已深入课堂教学环节。2021年7月,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》(以下简称“双减”)。国家明确“双减”政策要求后,各地采取各种措施推动作业管理改革,力求减轻学生作业负担,其中充分利用信息技术助推中小学作业改革是一个重要方面。借助信息化手段、教育智慧平台和大数据,各地和学校积极探索,尝试从作业供给、筛选、批改、反馈、互动等方面推动作业改革,实现减负目标。但需要明确的是,教育是育人活动,对信息技术在作业改革中的应用不能简单奉行“拿来主义”,须与教学需要、学生成长规律紧密结合,始终以实现育人目标为导向,以服务学生学习、成长发展为核心,为精准教学提供有力支撑。因此,如何借助信息技术特点和优势,把握信息化背景下中小学作业的育人方式和新特征,梳理目前各地探索借助信息技术推进作业改革的实践现状及遇到的新困顿,对于进一步优化作业育人功能和提高育人质量具有重要的现实价值,是教育教学改革实践领域需要关注和解决的问题。一、中小学作业减负改革呼唤信息技术助力(一)作业改革实践矛盾问题化解需要科技支撑中华人民共和国成立以来,从教育发展改革路径看,作业管理一直与中小学减负政策紧密联系。1955年,教育部颁发《关于减轻中、小学校学生过重负担的指示》,这是国家首次明确学生减负的政策性文件,强调减少课外作业量、减轻学生过重的课外作业负担。1984—1999年,减负政策对各学段学生作业时间的要求更加具体,提出作业难度要适当。2000年至今,作业减负政策关于作业时间的要求有所调整,开始强调多样的作业形式,明确作业减负责任主体。2018年,教育部等部门印发《中小学生减负措施》(教基〔2018〕26号)明确要求“小学一二年级不布置书面家庭作业,三至六年级家庭作业不超过60分钟,初中家庭作业不超过90分钟,高中也要合理安排作业时间”,明确了学校、校外培训机构、家长、政府的减负责任。2021年,《教育部办公厅关于加强义务教育学校作业管理的通知》(教基厅函〔2021〕13号),对学校作业管理提出具体指导意见。2021年国家“双减”政策再次要求“作业布置更加科学合理”。从上述可看出,中小学作业减负政策从最初要求减少课外作业量到控制各年级作业时间、强调作业难度适当和作业形式多样化、明确作业减负主体责任等,作业减负政策逐渐细化,对作业育人的要求不断升级。比如,要求教师分层精准设计作业、注重作业形式等。按照传统的作业管理模式,要实现这些细化要求,无疑会增加作业管理各相关主体的工作量和难度,有些要求可能也很难实现,这就导致在具体实践中产生了诸多两难矛盾。比如,控制作业时间,但同时还要提高教学质量;开展作业分层设计,但教学基础数据不足,无法准确掌握学情;学生有个性化学习需要,但作业资料同质化严重;落实教师减负,但要求教师及时精准地批改、点评、反馈作业。从信息技术发展及在社会各领域广泛应用看,科技赋能可能是化解作业改革和减负政策中诸多两难矛盾的有效途径之一。可以说,作业减负几十年的实践也在呼唤科技赋能,深化作业管理改革,满足教育教学育人需要。(二)广泛覆盖的信息技术环境为作业创新提供了基础支撑从信息技术基础设施建设情况看,目前我国信息化水平已达到全面普及,学生具备在学校或家里利用网络完成作业、获取教师支持的基本条件。目前,全国中小学(含教学点)网络接入率达100%,出口带宽100M以上的学校比例达99.92%,98.35%的中小学拥有多媒体教室,学校网络教学环境不断改善。随着5G技术应用,我国成为全球首个基于独立组网模式规模建设5G网络的国家,固定宽带由百兆迈向千兆跨越升级。2022年,我国建立“国家中小学智慧教育平台”,国家数字教育资源公共服务体系服务规模稳步扩大,已接入各级平台221个,其中32个省级平台全部接入,累计汇聚上架了93家应用服务商的224个应用,平台资源覆盖中小学86个学科。各地、各校和参与主体可充分利用国家平台资源作为深化中小学作业改革、提升作业育人质量的重要途径和有力抓手。按国家教育App备案有关要求,截至2022年3月底已有1037家企业的2288个教育App完成备案,共计31.72万所学校(不含学前)完成使用者备案。在广泛覆盖的信息技术环境支撑下,作业各参与主体创新作业内容、形式及布置方式,开展及时、有效的作业评价和教研,建立新的家校合作方式,促进了作业活动的多元化和丰富性,满足了学生个性化发展需要。二、信息技术延展和深化作业育人方式信息技术环境不仅改变着教学环境,也影响着教育教学生态和观念认识。《中国教育百科全书》把作业定义为学生为完成既定学习任务而进行的一系列活动。《教育大辞典》把“作业”分为“课堂作业”和“课外作业”两大类。课外作业也称家庭作业或课后作业,是指学生根据教师的要求在课外时间独立进行的学习活动。本文探讨的作业是指以书面作业为主的比较宽泛的课后作业。随着信息技术逐步拓展运用到作业环节,新技术深化作业育人方式,在传统作业基础上拓展了新内涵和功能特征,技术赋能效应逐步呈现。从作业活动参与的不同主体看,其传统作业观念的延展和深化,影响着他们在教学关系中的参与路径和关注重点。(一)学生作业学习的自主性、个性化和多样化增强对学生而言,完成作业是一项学习活动,是学生在教师教学计划下进行的自主学习活动。从学习活动过程看,完成作业是学生对知识的巩固或技能的实际操练,能够深化他们对知识、技能的理解;从学生发展角度看,作业是培养学生运用所学知识独立思考、解决问题能力的一种重要形式。作业专家哈里斯·库珀(HarrisCooper)认为,作业的长远意义是促进学生一般学习实践能力的形成,诸如批判性思维的发展、处理信息能力以及自我管理自我引导能力的提升。信息技术在作业领域的使用,使得学生自主学习的机会增加,作业管理信息系统或者数据教学资源平台能根据学生作业完成情况及时给予反馈,比如推送同类型题目、关联微课、参考资料等,学生可根据系统推送内容自主学习,也可自主选择其他相关内容进行学习。从不同学生角度看,系统可根据每位学生作业完成情况,推送或者反馈适宜的进一步学习内容,可实现每位同学从作业智能系统得到的反馈有差别、多样化。同时,在信息技术支持下,学生作业的内容和形式不仅限于书面作业,还包括其他与学习相关的实践活动,比如在作业智能管理平台的虚拟场景中进行各种相关实验、参观体验和场景感受等。需要说明的是,学生所有作业都是基于一定学习任务开展的活动,其目标是为促进学生的全面发展。(二)教师进行作业设计、批改的精准性和课堂教学的针对性提高对教师而言,作业是一个教学环节,是教师根据教学目标和学生特点有目的有组织的教学活动,是教师发挥教学自主权的载体,是教师课堂教学的延伸。借助作业管理信息系统,教师可以减少很多机械重复工作,有更多时间用于教学准备。教师可通过作业管理信息系统优化作业设计,提高作业针对性,及时批改作业,反馈学习指导,强化课堂教学知识传递效果。借助作业管理信息系统大数据处理功能,教师可快速精准地掌握班级学生完成作业的整体情况,及时掌握学生学习情况,调整下次课堂教学方案,并对有特殊学习需要的学生给予针对性支持,从而进一步增强教学针对性,提高教育教学质量。教师可使用大数据对不同单元作业完成情况进行纵向关联分析,不同学科作业之间进行横向关联比较,以便对不同年级和学科作业的协同教学提供精准基础分析,提高整体教学质量和效果。(三)学校运用大数据提升作业教学管理效能对学校而言,作业是教学管理的一项内容。学校作为教学管理的组织者,需要统筹作业与其它教学环节、学科作业融合、年级作业之间的有效衔接和平衡,提高作业管理效率,实现作业与其他教学环节的相互支撑。借助作业管理信息平台,学校可引导教师优化作业内容选择、形式设计,提高作业的针对性和科学性,合理安排作业量和时间,保证学生作业学习活动的有效性。研究表明,作业量与学生学业成绩之间存在曲线关系。有研究者发现,家庭作业时间在一定时间内与学生学习成绩呈现正相关,一旦超过临界时间,关联性就减弱。学校可充分运用作业管理信息系统大数据分析各年级作业、学科作业、不同形式作业与学生发展及教师发展之间的关联性甚至因果性,为学校作业的统筹管理提供基础数据支撑,从而因校制宜研究确定科学合理的作业量、作业形式等,提升作业管理效能。(四)以作业管理信息化教研撬动提质增效“大杠杆”对教研部门而言,作业是开展教研活动的重要内容。“双减”政策明确提出“将作业设计纳入教研体系”。实践经验证明,积极有效的作业教研活动是以“小切口”撬动教育教学提质增效的“大杠杆”。有了作业管理信息系统,可促使地方和学校教研部门加大教研量、提升教研质量,借助系统开展多种形式的教研、充分运用大数据为教研服务,将作业教改教研与课堂教学质量优化、学生核心素养提升、教师专业化发展、学校管理水平提升相结合,发挥作业对课堂教学的延伸、拓展功能,达到事半功倍的教学效果。(五)“家-校-生”互动交流打破时空局限从家校关系看,作业是学生、教师、学校和家长协同沟通的桥梁。依托作业管理信息系统,能让处于不同时空的各相关主体共同参与学生的发展过程,打破空间局限,实现主体间的时时互动交流合作。及时便捷的作业平台交流,有助于家长和教师相互了解学生在校和在家的情况,形成教育合力,及时为学生在学习中遇到的问题提供支持与辅助;有助于拓展家长与学生间的交流方式,改善亲子关系;有助于教师将作业批改、点评等结果及时反馈给学生,学生得到相应辅导,实现学生和教师的有效对话与融通,优化师生关系;有助于丰富学生互动模式,增强学生间的同伴效应。三、信息技术助推作业育人改革的实践探索特点近几年,各地运用信息技术助推中小学作业改革的需求大、实践积极性高、探索方式多样,建立了各种作业管理信息(智能)系统,助力提升中小学作业育人效果。信息技术在作业改革方面的应用不仅或多或少改变了教与学的方式,而且已经开始深入影响教育教学的理念、文化和生态。从实际探索看,各地积极探索多种信息技术助推作业改革的实践,相应主体的参与方式、教学关系都有些许变化。总体来看,各地运用信息技术助推中小学作业育人改革的做法有以下特点:(一)地方和学校积极探索,方式灵活多样从各地看,个别省是全省统筹推进信息技术增进作业育人质量探索,大多省是市域、县域层面统筹开展,还有大量学校自主开展。比如,江西以省级教育部门为主体,统筹搭建“智慧作业”作业管理信息系统;济南、青岛等地以区(县)教育管理部门为主体,统筹建设相应系统,并在区域范围内建立统一的平台规范和标准;无统筹探索地区则是学校根据实际情况自主探索。在统筹方式上,江西省和山东省济南市历下区将“智慧作业”系统纳入地方教育资源公共服务平台,扩大“智慧作业”使用覆盖率,整体提高作业管理效率;一些地方和学校则单独开发作业管理信息系统。在开发模式上,有些地方统一开发系统,统一使用,统一标准;有些地方和学校则通过购买服务等方式,由相应第三方企业提供系统或市场化产品服务。虽然个性化特点明显,但存在产品或服务标准不一的情况,尤其是学校层面的探索。在管理模式上,各地根据统筹层级的职责权限,建立相应的省市级、区县级、校级作业监管体系,通过区域整体大数据分析,科学督导区域、学校作业管理情况,提升区域、学校教育教学质量。(二)将传统作业学习结果数据化,为学生提供精准化学习帮助各地和学校开发使用的大多数作业管理信息平台,不改变学生传统纸质作业习惯。比如,江西省、山东省青岛市崂山区使用配套(点阵)作业本或答题纸,在学生完成作业后,可通过高速扫描仪、智能笔等设备将作业电子化。作业管理信息系统根据电子化后的作业学习数据,可及时给出作业客观题批改(对错)结果,部分系统还分析学生作业知识点的薄弱点,自动生成学生专属错题本,智能推送举一反三试题和作业解析微课,帮助学生个性化学习,强化作业育人功能。部分平台还以游戏化、情境化、沉浸式的方式使作业变得生动美观,增强学生的学习兴趣。(三)协助作业“设计—批改—反馈”,切实为教师减负在作业设计阶段,作业管理信息系统多提供海量题库,教师既可使用配套(点阵)作业本中的题目,也可借助题库资源实现智能组题、设计并发布作业,减轻教师选题负担,个别系统还提供全过程AI评估功能,保障作业质量。在作业批改阶段,部分平台不改变教师批改习惯,部分平台可以实现客观题自动批改减轻教师负担,但系统均可采集作业数据并生成错题及学情分析报告等,帮助教师减轻重复机械工作、提高备课和教学针对性。在作业反馈阶段,部分系统支持教师运用文字对学生作业完成情况进行反馈,也可推送相关微课或自制微课,确保学生掌握相应知识内容,提高教学质量。比如,江西“智慧作业”平台综合分析班级学情自动生成作业讲解稿,为教师和学生推送名师微课;还有平台(网)支持教师运用文字和录制微课的方式进行作业点评和反馈。(四)衔接各级教研力量,激发区域整体教研活力作业管理信息化的统筹层级越高,作业管理信息系统越有助于衔接省、市、县、校各级教研力量,精确分析学生作业数据,建设区域作业资源库,加强教研教学,整体提升区域教育教学质量。比如,江西组织全省教研员和中小学名师按学科、按作业难度,设计录制系统的作业解析微课,统筹设计分层作业。这些做法既可统筹规划区域整体教研工作,带动教研力量薄弱地区和学校做好教研,缩小区域、城乡教育差距,又可通过评优评先激励机制有效激发全域教研活力,提升区域整体教研质量。在学校层面,可实现学校动态监测作业用时、作业题量、作业次数等数据,并用作业数据开展有针对性的作业管理与教研,辅助各学科作业总量、时段的衔接与管理,切实保障作业减量增效。在具体运行中以作业教研推动区域整体教研工作,各层次、各学段、学科甚至区域间建立教研关联,能够相互支撑、协作、共享,共同推进教研工作有效性提升。四、信息技术助推作业育人改革的实践困顿随着作业改革的深入和作业样态的变化,一些地方和学校在实际探索中也存在一些亟待解决的问题。(一)传统作业简单电子化、库存化,信息系统平台建设缺乏整体规划从一些地方作业管理信息平台看,大部分作业管理信息系统仅简单以信息技术为载体,没有实现系统(设备)技术与作业育人功能的深度融合,三类问题比较突出。一是仅实现传统作业的电子化、网络化、设备化,包括使用点阵笔、扫描机将学生已完成的作业电子化,对作业管理无实质性改变。二是作业辅导应用程序和网站繁多,将传统作业简单叠加为大容量电子作业库,作业题库可利用率低,且没有深度挖掘作业数据价值,不能根据学生使用情况对作业题库进行升级优化。简单的题库整合、数据采集,不能满足学生不断发展变化的个性化学习需求,尚未体现出“智能”特点。三是各种作业管理信息系统衔接性不足、低层次重复建设多。目前各地多以县(区)或学校为单元,通过点对点采购企业产品或服务的方式进行作业智能管理探索,存在大面积重复建设“低水平作业管理信息平台”的情况。系统建设缺乏整体规划,使得区域和学校间的作业管理信息系统难以衔接,作业数字资源使用效率低。(二)作业设计从题库里简单“拿来”科学的作业设计会提高学生作业效率,让学生在作业学习活动中获得预期“收益”。作业管理信息平台具有海量电子题库,能帮助教师设计并布置作业,但存在一些教师用“拿来主义”布置作业的情况。由于题库资源存在作业质量参差不齐、同质化等问题,教师仅依赖题库智能推送的方式布置作业,而不是根据课程设计目标、课堂教学和学生学习等情况严格筛选作业题目,编写和设计针对性作业内容,作业将无法与课堂教学形成有效配合,会导致作业效果差、无效作业时间多等问题,其实质是加重了学生作业负担。作业缺少调整和创新设计环节,容易导致作业形式单一,沉浸式、体验式作业少,难以改善学生学习体验、增强学习内驱力,未充分发挥出信息技术的优势。(三)作业批改简单依赖系统“对错式”标记作业批改是教学的重要环节之一,作业批改的目的不是评定等级,而是发现学生的知识点短板并帮助学生学习、巩固知识。作业管理信息系统有助于减轻教师作业批改的部分负担,但仅依赖系统批改学生作业,简单以“√”“×”或A、B、C等等级符号来标记,会弱化作业批改的反馈作用,难以准确发现学生作业中出现的问题及其成因,无法及时解决学生学习过程中遇到的实际困难。教师应充分用好系统提供的学情报告,结合过程性评价,进一步分析学生学习成效和短板,为下一步作业教学提供支撑。(四)作业点评反馈异化为系统推送作业作业点评是提高学生学习效率的重要方式,教师及时反馈才能完成以作业促进学生发展的教学目标。如果不给学生提供必要的点评和反馈,可能会异化作业的功能。在具体实践中,一些地方和学校的作业智能管理平台在自动批改作业后,根据作业完成情况为学生推送与错题相同类型、知识点的题目,让学生反复练习。如果仅依赖系统自动推送作业,而不是依据教学内容和学生知识点掌握情况进行点评反馈,那么看似有助于巩固和强化学生对易错知识点的反复练习,实则是“题海战术”的重演,容易忽视学生对于作业完成情况的主观感受和学生“同伴效应”的积极作用,降低作业育人效能。教育是培养人的活动,虽然信息系统可替代一些教学环节,但一些学科作业面对面的点评仍是必要的。(五)作业教研机械依靠系统或第三方平台由于信息素养不足、专业教研力量薄弱等多方面原因,一些地方和学校不知道如何在新模式下开展教研,过度依赖系统或第三方平台,甚至直接要求智能公司提供教研服务。人工智能系统的教研提示和作业推送方式,可帮助学校和教师让学生在反复训练基础上就能获得较高的测评分数,但机械式的推送模式可能会导致学校和教师减少教研,教研能力下降,作业脱离育人本位。因此,教研部门、学校须深度参与作业管理信息平台的建设、优化工作,主动提升信息素养,而不是被动式地接受技术绑架。(六)家校协同简化为系统平台搭建目前,一些地方和学校使用的作业管理信息平台设置了家长端口(账号),家长可以随时查看孩子的作业完成进度及结果报告,可与教师在线或通过其他途径进行沟通。这给家长创造了了解孩子的便捷窗口,建立了家长与教师的新交流平台。从某种程度看,作业管理信息系统能促进家校协同。但系统的窗口和平台功能不能保证对所有家长都适用,尤其是对文化程度低、信息素养相对缺乏的家长群体。因此,在作业管理信息系统基础上,仍需关注不同家长群体的诉求,完善家校协同路径。五、信息技术增效作业育人改革的突破路径未来,要加速推进信息技术与作业的深度融合,需充分认识到信息技术增强作业育人功能的重要作用,将作业管理信息平台作为有效工具,充分挖掘信息平台中的大数据资源和功能,以研究精准支撑育人服务,着力提升作业育人质量。(一)对信息技术增效作业育人功能有充分认知在信息技术环境支持下,人才的判断标准已不单纯是掌握知识和技能,能提出问题、解决问题及具有批判性思维也是数字化时代人才的评价标准,这对中小学育人目标提出了高要求。从作业环节看,信息技术也赋予了作业育人功能的新内涵。信息技术赋能教育教学搭建各层次教育教学资源平台,产生了大量教育教学数据要素,影响和改变着课堂内外教学关系,让处于教学关系中各方主体的角色功能不断调整变化。育人目标和角色功能的调整变化,在主动和被动倒逼中改变着各方的“作业观”,从新的视角审视作业内涵、作业功能以及思考如何借助信息技术赋予作业更有效的育人功能。当前,我们正处在一个充满易变性、不确定性、复杂性和模糊性的时代,外部生态环境的变化即便是一个微小的变化也有可能引发教学系统的巨大振动。因此,我们必须充分认识信息技术环境中的作业功能,用好信息智能技术,优化作业设计、布置、批改和反馈方式,切实减轻学生作业负担,有效提高作业育人效率、满足学生个性化的学习需求、提升学生提出和解决问题的能力。在观念认识基础上,分析如何通过信息技术提升作业育人功能,其基础条件是什么,如何建立信息技术赋能的基础质量标准,确保作业管理平台或智慧系统间的有效衔接。(二)将作业管理信息平台建设纳入省域基本公共教育服务建议省级教育行政部门统筹省域内作业管理信息平台建设工作,整体规划,系统设计,提升区域教育服务数字化普惠水平。建立省级作业管理信息平台,可与省级中小学智慧教育平台结合建设,充分用好国家智慧教育平台资源,将省域内不同版本教材和学科相关内容均纳入省级作业智能平台,为省域中小学提供基本公共教育服务。鼓励支持有条件的地市、县(区)和学校,按照省级规定的作业管理信息平台标准要求,根据区域教育、学校和学生特点,采取自建或向第三方购买服务等方式,探索建立满足自身教学需要的作业管理信息系统,相关单位一把手担任第一责任人。各级作业管理信息平台要充分用好上一级智能平台资源,避免重复建设,开发拓展性、特色化作业资源。省级教育行政部门牵头联合相关部门研制省域内作业管理信息平台建设标准,规范平台建设的基本程序,建立资源审核和效能评估机制,统筹各级平台网络安全监管工作。对地方作业管理信息系统进行备案审查,并定期监督其使用情况,重点关注作业内容、形式、数量和作业管理系统使用效果及可持续发展等方面,对重复率高、利用率低、效果差的平台,提出整改意见。改进监管技术和手段,进行常态化作业监测与公示管理,实现对平台的全过程监督,保护各相关主体的数据及隐私权益,及时纠正使用过程中损害学生利益、学习时间过度、微课时间超过规定时间、影响学生健康发展的做法。加强平台运行风险预警监督,确保共享资源安全可控、内容健康、满足学生学习需要,防止第三方(资本)垄断、架空学校。(三)建立区域作业管理大数据库统筹建立省域作业大数据库,将数据作为重要教学要素,为教学改革提供决策支撑。省级作业管理信息系统以县(区)为基本单位,设置学校、学生、教师、家长、教研和管理部门端口账号(唯一识别账号),供省内各方教育参与主体在不同层级平台免费获取资源,并作为作业管理者收集相关作业数据的关键抓手。比如,收集学生完成作业时间及准确率、教师批改时间及反馈情况、学生自主学习内容偏好、师生互动时间及内容偏好等。各层级平台间运用唯一识别账号建立垂直联系。建立优质资源共享机制,推动省域内各级智能作业管理平台互联互通,促进跨县(区)、跨校、跨学科作业资源共建共享。推动区域优质作业资源数字化,选评优秀作业典型案例进入省级平台,对于入选平台的典型作业案例,主管部门可给予相应激励,作为教学成果评定、评优评先和教师职称评聘的参考依据。各级政府可主动寻求出版社等企业和机构支持,丰富作业资源供给。作业管理信息系统不仅是一个作业系统,更是学生随时可获得支持的教学系统,支持教师布置能够提升学生学习能力和增强学习兴趣的作业。(四)充分依托作业管理信息系统数据开展教学基础研究省域内的研究机构、教研部门要充分利用各级平台丰富的学生作业数据、健康数据、学业数据、学校管理数据等,以唯一识别账号为数据连接点,挖掘作业相关数据价值,研究智能管理前后的作业时间与教学质量及学生体质健康的关系、学科间作业平衡关系,为作业管理决策及教学改革提供实证研究支撑。各级教研部门要充分结合传统教研和网络教研,分析作业智能设计、布置、批改、点评等各环节的优势和劣势,研究作业管理信息化如何与传统作业管理紧密结合,因地制宜建立“标准+”的多样化作业管理模式。鼓励支持教研人员和教师探索运用“AI+虚拟现实/增强现实/混合现实”等技术开发沉浸式作业,注重作业的社会性、参与性和实践性,激发学生内在学习动力,注重培养学生提出问题和解决问题的能力。地方教研部门可组织区域内学校和教师开展专门的作业管理信息化教研和广泛的作业教研活动,推动学科、年级优秀作业案例的收集评选工作。教师要充分认识信息技术对提升作业效率的重要性,关注学生作业行为习惯与学习效果的关系,助推教师创新作业设计、作业批改和点评等,提高教师教学能力。(五)加强参与者应用作业系统及资源的能力建设省级统筹、各级教育主管部门负责,通过线上(直播、录播、短视频等)线下等多种方式,为各层级管理者、校长、教师、教研人员、学生、家长等各类主体提供差异化的作业管理信息平台使用指引和手册,开展精准专题培训,加强网络安全意识,提高各主体使用能力。各级教研机构要充分协同,加强信息技术助推作业管理改革研究,积极参与作业管理信息平台的设计、建设和优化工作,着力提升平台辅助学生学习、教师教学和学校作业管理的针对性和有效性。结合各级中小学教师培训计划,增加对教师在作业管理信息系统运用和作业设计、批改、点评与反馈等方面的培训和指导,提升教师信息素养。作业管理信息系统提供方要对系统设计人员加强教学和作业管理实践方面的培训,帮助他们准确了解教学一线作业管理需求,确保平台建设满足区域和学校作业管理需要。增强教研人员和教师应用各级数据、开展相关研究的能力,比如数据开发、数据运用等。高等院校在教师培养课程中,要增加信息素养、数字素养类课程,提升师范生运用信息技术开展教育教学的基本能力。来源|《中国教育学刊》2024年第1期作者|安雪慧(中国教育科学研究院区域教育研究所所长、研究员)、张琨(中国教育科学研究院实习研究员)