首页    >    教育资讯    >    教育科学研究详情

刘建达 等:乡镇英语教师测评素养调查

2024-09-10

原创 中国考试 中国考试 2222024年08月26日 16:57 北京

引用格式:刘建达, 崔婷婷. 乡镇英语教师测评素养调查[J]. 中国考试, 2024(8): 51-59.

作 者

微信图片_20240910090605.jpg

刘建达,男,广东外语外贸大学外国语言学及应用语言学研究中心教授。

微信图片_20240910090634.jpg

崔婷婷,女,广东外语外贸大学外国语言学及应用语言学研究中心在读博士生。

摘 要:建设教育强国和高质量教育体系要求教师具备良好的测评素养。调查乡镇教师测评素养现状,探寻乡镇教师测评素养发展路径,对提升乡镇学校教育教学水平具有重要意义。本研究采用定量和定性相结合的方法,通过问卷调查、访谈调查、课堂观察和文本分析对粤西地区乡镇英语教师的测评素养状况进行调查研究。结果表明,乡镇英语教师的整体测评素养较为欠缺,亟须从沟通测评结果、制定评分标准及评分程序、评估题目质量、开展课堂评估、提供促学反馈等方面加以提升,建议从加强培训和增强备课科组的测评意识等方面逐步提高其测评素养。


关键词:语言测评素养;乡镇学校;英语教师;语言测评活动

2020年,中共中央、国务院印发《深化新时代教育评价改革总体方案》,强调应重视结果评价,强化过程评价,探索增值评价,健全综合评价[1]。《义务教育英语课程标准(2022年版)》指出,教师应落实“教—学—评”整体育人观念,将教学评价贯穿于教与学的全过程[2]。相关要求表明,教师应具备较高的测评素养,承担起教学者和测评者的双重角色[3]。教师应明确评价的作用与原则,根据评价目标选择合适的评价内容与评价方式,充分发挥评价促教促学的功能。然而,相关调查发现,乡镇教师面临个体评价精神封闭、课堂评价文化失落、评价政策传达失语、评价课程培养缺位等问题[4]。在这种情况下,教师即便意识到评价的重要性,也难以将以评促学的理念落到实处。基于这一问题,同时也是为了贯彻国家“十四五”规划提出的“深入实施乡镇教师支持计划”的要求[5],开展乡镇教师测评素养现状调查,探索其测评素养的提升路径,具有重要的现实意义。有鉴于此,本研究以英语学科为例,对粤西地区乡镇教师测评素养状况开展调查研究,以期为后续研究和全面提升乡镇教师测评素养提供借鉴与参考。


一、语言测评素养研究回顾


1991年,Stiggins提出测评素养(assessment  literacy)的概念[6]。从此,不断有学者对教师测评素养进行系统性研究[7-8]。近10年来,教师测评素养更成为测试与教学领域的关注热点,相关研究主要集中在测评素养的构成[9-10]、测评素养测量工具的开发与验证[11-12]、教师测评素养的现状[13-14]、教师测评素养的发展路径[15]等方面。


有学者认为,教师测评素养包含教学内容知识、测评原理、测评技术知识、测评实践技能、测评理念(包括认知和情感因素)、实践语境等[16-17]。语言测评素养(language assessment  literacy)则具有语言学科的独特属性[9],与教师的语言知识紧密相关,同时具备建构性、交互性和应答性等学科特征[18]。在内涵界定的基础上,人们试图开发教师测评素养测量工具,其中影响力较大的包括课堂测评素养列表(Classroom Assessment Literacy Inventory, CALI)[19]、语言测评素养培训需求问卷(Assessment Training Needs of LanguageTeachers)[20]、利益相关方测评素养问卷(Language Assessment Literacy Needs of Different Stakeholder Groups)[21]等。


国内外有关研究表明,一线教师普遍存在测评概念理解模糊、测评结果解释能力不足、测评实践能力薄弱等问题[22-23]。专项培训是提升测评素养的有效途径,但其效果受培训周期、培训大纲、任务设计等因素的影响[24];掌握现代技术有助于实施有效评估和反馈[25],参与命题和题库建设等相关的测评活动以及对测评实践进行积极反思均有助于提升测评素养[26-27]


国外的有关研究起步较早,也为国内教师测评素养研究搭建了初步的理论框架和研究范式。目前,国内有关理论研究以通过书评引介新理念[28-29]和述评国内外教师测评素养研究为主[30-32],实证研究则以调查本土教师(主要为高校教师)的测评素养现状为主。相关研究表明,我国外语教师的整体测评素养处于初级水平,存在分数解释能力差、不善于根据教学目标选择合适的测评任务、难以提高学生在课堂评价中的参与度等问题[17],教师的评价意识和评价反馈质量也有待提升[33-34]


随着教师测评素养内涵的不断拓宽,有关研究重点关注的测评场景(assessment context)也逐渐从标准化测试转向形成性评价和课堂评估[14, 35]。从社会文化的视角出发,对不同文化背景、教育环境和测评场景下的教师测评素养进行本土化研究也在不断地为教师测评素养赋予新的内涵[36-38]。然而,国内现有研究对象的覆盖面不足,缺乏对不同学段和不同地域教师测评素养的现状调查与需求分析;同时,研究方法以量化为主,缺少实地质性研究,所采用的理论框架多为先验性框架,未必能切实反映实际情况[7]。因此,本研究拟采用问卷、访谈、课堂观察和文本分等多种方法探究以下问题:1)我国乡镇英语教的测评素养现状如何;2)乡镇英语教师的日常言测评活动有哪些;3)如何有效提升乡镇英语师测评素养。


二、研究设计与方法


(一)调查对象


本研究于2021年11月至2022年2月开展,研究对象选自粤西地区的16所乡镇学校。124名英语教师参加问卷调查,其背景信息见表1。6人(包括英语教研组组长A、英语教师B与C、教务主任D、校长E和教育局教研员F)接受半结构化访谈,3名不同年级的英语教师接受课堂观察并提供教学材料。

微信图片_20240910090704.jpg

(二)研究工具


采用问卷法、访谈法、课堂观察法和文本分析法对教师的测评素养现状及问题进行探究,借助SPSS25和Nvivo10软件对量化数据和质性数据进行分析。


1.调查问卷


问卷分为两部分:第一部分为背景信息调查,第二部分编译自CALI。CALI包含7个素养标准,每个标准下设5道题目,共35题。题型为多项选择题,教师需选择一项正确答案。本研究保留CALI框架与核心概念,但对情景、人名、知识内容进行本土化改编,使其更适合乡镇中学英语教学情景。由于问卷为多项选择题,故采用KR-20公式对其内部一致性信度进行检验,得出r=0.56,略高于Mertler将其用于在职教师测评素养研究的信度[39]。由于问卷包含多个维度,故采用McDonald’s omega信度检验方法[40-41]再次确认其信度,得出ω=0.898>0.8,说明具有较好的信度。


2.课堂观察量表


CALI主要聚焦测评理论和测评知识,具有一定的局限性,未能很好地体现语言测评素养对形成性评价的要求[42]。为更翔实地刻画乡镇英语教师的语言测评素养现状,课题组还改编了赵雪晶开发的教师测评素养观察量表[43],对英语教师在课前、课中和课后的评价活动进行观察,其中课前观察为重点。课前测评活动包括明确测评目标和制订相应测评计划。课前观察关注教师在授课前能否运用自评量表、测评任务等工具进行一定的学情诊断、选用的测评任务的质量是否过关等。课中测评活动主要包括介绍学习目标和测评目标、收集测评信息、提供测评反馈。课中观察重点记录教师在教学过程中收集学生学习信息的方式,如课堂观察、口头提问、随堂小测、同伴互评等。在观察提供测评反馈的情况时,重点关注教师如何向学生提供反馈、如何解释评分标准、如何反馈考试结果等。课后的测评活动主要包括作业布置、作业批改和试卷批改。课后观察主要关注教师布置作业的类型、质量及作业批改方式(如提供原始分数、等级分数或书面批语等)。


3.半结构化访谈


访谈话题聚焦日常教学,在明确常见测评场景(如布置作业、命制周测、修改作文等)后,围绕“在测评中遇到的困难”和“自身有何培训需求”两大主题展开,并根据回答进一步追问。


对访谈内容进行文本转写后,依据扎根理论,对基础数据进行编码和归纳分析,提炼出教师常见的测评场景和测评困难、主要培训需求及提升培训积极性的方法。


三、结果与讨论


(一)问卷调查结果


本次问卷调查共回收有效问卷113份,回收率为91.12%。数据分析表明,粤西乡镇英语教师的整体测评素养得分均值为12.92分,仅为满分(35分)的36.91%,测评素养总体上较为薄弱,详见表2。江进林曾对250位高校英语教师的测评素养进行诊断,得分均值为16.71分,为满分的47.74%,据此认为高校英语教师测评素养偏低[13]。相较之下,粤西乡镇英语教师测评素养的缺失则更为严重。

微信图片_20240910090734.jpg

为探究粤西乡镇英语教师的测评素养在不同维度上是否存在显著差异,课题组首先对相关英语教师在第一至七项素养标准上的得分结果进行方差同质性检验,得出F(6,782)=3.47,p=0.002,故采用Kruskal-Wallis检验探究各项素养标准的得分是否存在统计学上的差异。数据分析结果显示,H(6)=70.98,p=0.000,表明英语教师在7项素养标准上的得分存在显著差异。


为进一步探究哪些素养标准的得分存在显著差异,课题组进行了事后分析(post-hocanalysis),检验7项测评素养标准得分的平均值在成对比较中是否存在显著差异,见表3。

微信图片_20240910090804.jpg

结合表2的数据分析可以看出,教师在素养标准三(实施测试、评分,并解释分数)上得分最高,显著高于在素养标准一、素养标准四、素养标准五和素养标准六上的得分;教师在素养标准四(运用测评结果评估学生、规划教学、开发课程等)、素养标准五(开发有效的评分标准)和素养标准六(向学生、家长或相关人员报告测评结果)上则得分较低。其中,在素养标准六上得分最低,显著低于除素养标准五以外的其他素养标准的得分;在素养标准五上的得分则显著低于素养标准三和素养标准七的得分。


以上数据分析表明,粤西乡镇中学英语教师尽管具有一定的测评实施和评分能力,但在运用测评结果进行决策、对分数进行解释报告以及制定测评标准等方面的能力非常薄弱,而按照《中学教育专业师范生教师职业能力测评标准(试行)》中关于教学评价能力的相关要求[44],这些能力恰恰是不可或缺的。此外,课题组以性别、教龄、年龄和是否接受过语言测评培训为自变量,探究其对教师整体素养水平的影响。数据分析结果显示,各组得分不存在显著差异。


鉴于CALI的局限性,为更翔实地刻画教师在日常测评活动中体现的测评素养状况,课题组选取3位不同年级的英语教师,针对其课前、课中和课后的测评活动进行观察,发现3个主要薄弱点。


第一,在课前阶段,3位教师未能很好地确定评估目标并制订有效的评估计划。例如,由于教材内容较多,七年级教师A难以把握教学重点,加之对PPT制作较为生疏,其教学安排、教学目标和评估目标多参照网上课件资料。相比之下,九年级老师C较为年轻,善于制作PPT,但通常不会列出教学目标和评估目标。八年级教师B在授课前会列出本节课的具体教学目标和评估目标,但授课时未作解读,不利于学生课后自评。为进行课内评估,教师C经常直接从练习册中选取填空题和选择题放入课件,但由于未经改编,相关题目的质量往往不够理想。


第二,在课中阶段,教师未能清晰介绍学习目标和测评目标,未及时收集测评信息并提供促学反馈。在为期一周的观察中,课堂观察、口头提问和听写是3位教师评估学生学习成果最常用的方法,学生自评和同伴互评等其他评价方式则被忽视。3位教师有时会提供书面练习,更多时候则是采用口头提问的方式。回应教师口头提问的通常是坐在前排的学生,其他学生则缺乏回答积极性。另外,在一对一提问中,教师通常只关注正确答案,忽视对错误答案的反馈,如下例:

教师A:You please, what is your answer tothis question?

学生1:(摇摇头。) 

教师A: Deskmate, what is your answer?

学生2: 应该是C

教师A: Is it C? Anyone else?

学生3: 应该是 B,因为那个 smells fresh 一般是用来说空气新鲜的。

教师A: Yes. Good! The correct answer is B.The air smells fresh. Let’s move forward to the nextexercise.


第三,在课后阶段,教师批改作业时对主观题的评分较为苦恼。因学生人数多(每个班级约50人),作文批改周期长达一个月。教师B反映,很多情况下,当教师完成作文批改并将结果反馈给学生时,学生已忘记所写内容,致使作文评改效果很差。另外,虽然教师在命制日常试卷(周测、月测、期中考试等)时并没有感到困难,但命题质量不高。教师往往并不了解各类题型的命题原则与方法,尤其是选择题干扰项的设计原则和作文主题的设计技巧。选择题干扰项经常是无效干扰,作文的话题常常偏离学生日常生活,如“请你谈谈脱贫攻坚应该采取何种措施”。


(二)访谈结果


课题组通过课堂观察和半结构化访谈来调查粤西乡镇英语教师开展日常测评的情况。结果表明,在备课阶段,教师不太关注测评目标和测评计划的制定,而是直接进入挑选测评任务的环节。同时,被观察的3位教师也未能开展学生自评或者同伴互评。对此,他们的解释是,乡镇学生的水平不足以支持自评或互评,更何况教学安排紧张,难以实施多元化评价。

教师E:(课堂评估)这些对于我们农村学校来讲,好像很难做到这个啊……可能这个大城市比较多吧,因为我们每次去听课都会有这方面的评估。

教师F:我们这边是农村学校,跟大城市那边老是去培训班的(学生)有差距。

教师D:因为他们好像错的地方(作文互评时)还是比较难找出来。

教师E:(学生水平较低的话),我们主要是为了完成教学内容而已,时间很紧。


在授课阶段,测评活动以口头提问为主,较为单调。课后的测评任务主要是批改作业和日常小测。日常教学中,挑题组卷远多于命题组卷。为此,设计培训内容时,如时间有限,应优先讲授题目质量分析方法;同时,也不能忽视测评方式的选择、考卷质量的评估、试题的命制、测评软件的使用、评分标准的设定、促学评价的实操案例等方面。正如3位教师所反映的:


教师D:设计题目啊?一般都不是自己设计。我们一般都是针对性地找和这个内容有关的题目,让他们操练而已。

教师E:月测的话,好像是教研室啊,校长室那边,他去外面找一些题来考。

教师F:(评分标准)没有,都是个人根据自己的主观意识来判断的吧。如果是大型考试的话,我们就会商量。

教师E:自评表几乎每个学期都一样。同伴评估我们没有实施过,但是我听你说了之后也觉得蛮好的。


总之,粤西乡镇英语教师的测评素养现状不太理想,突出问题包括:不善于运用测评结果、不善于开发有效的评分标准、不善于向利益相关方报告测评结果。课堂观察与教师访谈显示:教师未能很好地确定评估目标,未能制定有效的评估计划,未能较好地收集测评信息以提供促学反馈;认为主观题评分难度较大,且不熟悉常见题型的命题原则。教师对学生自评、同伴互评等测评方式虽有一定兴趣,但因种种原因,态度较为保守,未曾付诸行动。


(三)原因分析


教学中出现这种“有心无力”的情况,原因主要有两个。第一,教师测评素养相关的课程培训供给不足。首先,教师的测评素养并未得到足够重视,未纳入教师专业素养结构,不属于教师资格证认定的必要条件,相关的职前教育或职后培训供给不足[13];其次,教师培训活动(如新教师培训、骨干教师培训等)大多聚焦纯粹的教学,极少涉及测评[22];再次,本研究显示,仅有52.5%的教师学过与测评相关的课程,且是否学过相关课程对教师测评素养水平并无显著影响,表明现有测评课程不足以帮助教师应对复杂的测评实践;最后,地域不同也导致培训资源存在差异。乡镇教师难以接触到高校等机构提供的教师发展资源,难以接触到新的测评理念和方法,也较少有系统学习过语言测评的教师或职前教师到乡镇地区任教或实习。第二,班级规模、学生水平、测评氛围等因素对教师测评素养具有重要影响。首先,班级人数多,使得教师难以在45分钟的课堂上开展分组活动或其他较为复杂的测评活动,也影响教师提供促学反馈的意愿和质量。特别是在批改作文时,若要为每位学生提供详细的批改反馈,需耗费巨大的时间精力,因此乡镇英语教师存在不愿布置作文或作文批改周期过长等问题。其次,受学生能力水平和学习态度的影响,教师认为乡镇学校的学生难以开展自评和同伴互评。最后,备课科组的测评文化也会显著影响教师测评素养的发展。访谈中,有教师表示,他们愿意开展学生自评,且课堂上采用备课科组统一制定的自评量表。但是,也有研究表明,年轻教师对在课堂上融入同伴互评等形成性评价感到焦虑,担心这会导致自己在教学进度和教学效果上落后于其他教师[45]


(四)提升路径建议


乡镇教师语言测评素养薄弱,需从多方面加以提升。


第一,应为乡镇教师提供针对性强的培训资源。乡镇学校教师人数少,学生人数多,课程压力重。因此,不宜大量增加教师的培训负担。可以采用信息技术,以录制短视频的形式开展教师培训,方便教师利用碎片化时间进行学习。培训主题应重点关注沟通测评结果、制定评分标准及评分程序、评估题目质量、开展课堂评估、提供促学反馈等方面。值得注意的是,掌握现代技术有助于实施有效评估和反馈[25],而乡镇学校老教师占比较大,其信息素养相对较低,应注意加强信息技术培训。针对形成性评价难以开展这一问题,应在培训中补充课堂评价的实操案例。


第二,鼓励备课科组建立良好的测评氛围。教师的测评活动受所在备课科组影响较大,如学生导学案是否包含自评量表、月考作文评分是否开展双评等,很大程度上是由备课科组决定的。因此,若难以开展全员培训,可对学科带头人、备课科组长等进行先期培训。此外,引导备课科组重视测评的一个有效方法是将测评融入科研课题或教学评比。职称评定与科研成果和教学奖励有着较为紧密的关联,如将测评知识转化为科研成果或教学奖励,会有助于提升教师学习和应用测评知识的积极性。同时,引导教师积极对测评实践进行反思,为教师提供参与命题和题库建设等相关测评活动的平台和机会,对提升教师的测评素养也会大有裨益。


四、结束语


本研究对粤西乡镇英语教师语言测评素养的状况进行了调查研究,并提出了相关思考和建议。当然,本研究也存在一定的局限性,乡镇英语教师的样本取自粤西地区,研究结果的代表性较为有限。未来可以对我国中西部更广泛地区的乡镇英语教师测评素养作进一步调研。同时,后续可以将研究对象拓展至其他利益相关者,特别是负责选购学生试卷和配套学习材料的相关人员,要关注学生试卷和配套学习材料的质量。同时,开展城乡英语教师测评素养对比研究对于揭示影响英语教师测评素养发展的多方面因素也具有一定意义。


参考文献略。