教育科学研究
EDUCATIONAL SCIENTIFIC RESEARCHS
周文 等:新文科建设背景下经济学拔尖创新人才选拔路径探索——以中国人民大学“中国特色经济学”实验班为例

2024-07-25

原创 周文 等 中国考试 2024年07月24日 14:47 北京引用格式:周文, 臧雪伊, 向冠春. 新文科建设背景下经济学拔尖创新人才选拔路径探索: 以中国人民大学“中国特色经济学”实验班为例[J]. 中国考试, 2024(7): 44-52.作 者周文,中国人民大学经济学院教授,中国人民大学全国中国特色社会主义政治经济学研究中心研究员,博士生导师。臧雪伊,中国人民大学在读博士生。向冠春,教育部教育考试院副研究员(通信作者)。摘 要:新文科建设中的经济学拔尖创新人才选拔与培养具有重要的现实意义,经济学拔尖创新人才选拔以价值引领和目标导向为原则,从人文素养、思维能力和技术适应力等方面设置选拔标准。通过设立全国首个以“中国特色经济学”命名的实验班,中国人民大学经济学院就拔尖创新人才选拔进行创新性探索并取得初步成效,主要经验包括高度重视选拔工作、坚持将理想信念作为第一要求、注重考查学生人文素养、让人才培养回归经济学教育本质、在选拔过程中实现交叉融合等。关键词:新文科建设;中国特色经济学;拔尖创新;人才选拔为落实科教兴国和人才强国战略,回应“钱学森之问”,2009年教育部联合中组部、财政部共同启动基础学科拔尖学生培养试验计划,也称“珠峰计划”。该计划以数学、物理学、化学、生物科学、计算机科学为试点,着力培养高素质创新型卓越人才[1]。计划实施近十年后,教育部等六部门于2018年联合发布《关于实施基础学科拔尖学生培养计划2.0的意见》(以下简称《意见2.0》),新增哲学、经济学、中国语言文学、历史学等十余个基础学科[2],与同时发布的其他六项卓越计划合称为“六卓越一拔尖”计划2.0。《意见2.0》明确将拔尖人才选拔、培养模式更加完善作为基础学科拔尖学生培养计划2.0的主要目标要求之一,提出科学选才鉴才要求,为基础学科拔尖创新人才选拔提供基本指导。“六卓越一拔尖”计划2.0于2019年4月正式启动,标志着新工科、新医科、新农科、新文科建设的全面推进,也开启了新时代我国高等教育“质量革命”和内涵式发展的崭新阶段。在全面开展一流专业和一流课程建设“双万计划”的同时,“六卓越一拔尖”计划2.0开始建设包括经济学等17个学科在内的基础学科拔尖学生培养一流基地。2020年9月,首批基地名单发布,中国人民大学经济学拔尖基地成功入选。2020年11月,教育部发布《新文科建设宣言》,全面部署新文科建设任务,提出积极发展文科类新兴专业,推动原有文科专业改造升级等要求[3]。为进一步优化新文科专业结构,建设新专业或新方向成为新文科建设的重点任务[4]。在这一背景下,经学校批准同意,中国人民大学经济学院增设经济学专业(中国特色经济学方向),并开设“中国特色经济学”实验班(以下简称“实验班”)试点探索。本文以高等教育新文科建设为研究背景,聚焦经济学拔尖创新人才选拔路径,在探讨经济学拔尖创新人才选拔意义、原则和标准的基础上,运用案例研究方法,以中国人民大学“中国特色经济学”实验班为例,结合具体的选拔方案、特征及成效等内容,总结梳理中国人民大学经济学院在经济学拔尖创新人才选拔方面的经验与做法。同时,提出并探讨选拔过程中存在的主要问题,以期推动经济学拔尖创新人才选拔更好适应新文科建设的要求,并为今后新文科建设过程中其他专业领域的拔尖创新人才选拔提供借鉴参考。一、新文科建设中经济学拔尖创新人才选拔的背景与标准在新文科建设背景下,经济学作为人文社会科学的一个典型门类,其拔尖创新人才选拔具有深刻的现实意义、明确的指导原则和具体的选拔标准。(一)新文科建设的时代背景目前,我国高等教育领域中文科的学科门类、专业种类及在校学生人数均占大多数[5],亟须加强文科建设。新文科建设为传统文科注入新内涵,强调学科建设与人才培养对新时代、新形势的适应与对接[6],其范围、指向、模式都具有鲜明特色。根据“六卓越一拔尖”计划2.0对新文科建设的定位和部署,新文科是发展社会主义先进文化的重要载体,因此要把握新时代哲学社会科学发展的新要求,推动哲学社会科学与新科技革命交叉融合,培养新时代的哲学社会科学家,提升国家文化软实力和中华文化影响力[7]。此外,面对新科技革命、产业革命,以及日益综合化、复杂化的社会问题,跨学科、跨专业的交叉融合发展是教育发展的主流趋势,新文科建设亟须适应这一要求。首先,构建以育人、育才为中心的哲学社会科学发展新格局是新文科建设的总体目标之一。经济学作为新文科建设中的重点学科,该领域的拔尖创新人才选拔必须坚持和遵循为党育人、为国育才,为解决中国问题选才鉴才,为建构中国经济学自主知识体系培养、储备人才。其次,《新文科建设宣言》明确指出,新文科建设应立足国情,坚持走中国特色的文科教育发展之路[3]。经济学拔尖创新人才培养应适应新时代我国经济社会发展的现实需要,选拔和培养大批立足中国实际、研究中国问题的本土经济学优秀人才。最后,推进新文科建设,归根结底是建构我国自主的知识体系[8],该体系的建构依赖于知识创新、理论创新和方法创新,依赖于具有拔尖创新能力的高层次人才,根本上依赖于基础学科教育和基础研究。因此,经济学拔尖创新人才培养应坚持走基础研究领域的人才自主培养之路[9]。与新工科、新医科、新农科建设一样,新文科建设是适应新一轮科技革命和产业变革新趋势、布局未来必争领域的一项人才培养战略。然而,与新工科、新医科、新农科建设不同的是,新文科建设更加强调服务国家软实力建设和文化繁荣发展,突出文科教育的价值导向,致力于文科教育的创新发展,推动形成哲学社会科学的中国学派。因此,新文科建设中经济学拔尖创新人才选拔和培养应将价值引领和目标导向作为基本原则,培养出一大批怀有崇高的理想信念和远大的志向抱负,愿意把个人价值的实现与国家发展紧密联系,不断推进知识创新、理论创新、方法创新,致力于为国家民族富强而奋斗的优秀人才。(二)选拔标准选拔是人才培养的入口和首道程序,如何从学生群体中甄选拔尖创新人才,关键取决于人才标准的界定。目前,学界普遍关注基于拔尖创新学生自身禀赋特征的选拔标准,主要包括四个方面:1)作为创造力基础的智力与知识标准,如智商高、求知欲和学习主动性强、知识深加工能力强等;2)与创造力高度相关的人格特征[10],如独立性、冒险性、目标性、自信心、包容度、意志力、想象力、幽默感、直觉、渴望认可等;3)内在动机,如内在激情、好奇、兴趣等,人们受到内在动机激励时,会表现出较强的创造力[11];4)批判性思维,具有批判性思维的人更加敢于质疑和创新,对于文科基础学科来说,批判性思维尤为重要[12]。同时,国际上的资优学领域近年来逐渐将拔尖创新人才选拔标准从天赋智商转向成功智能[13],学科兴趣、学术理想、学术潜力、创新能力开始成为教师和教育管理者认同度较高的选拔标准[14]。值得注意的是,拔尖创新人才的选拔标准还会受到国家、地区乃至历史阶段差异性的影响,如有一些标准具有普适性,可以适用于不同国家和地区的不同阶段;而另一些标准则具有特殊性,仅适用于某些特定国家和地区的特定阶段。目前,我国正在施行的《意见2.0》,是在原有政策要求基础上增加哲学、经济学、中国语言文学、历史学等人文学科,由此突显新文科建设的重要现实意义;同时将科学选才鉴才作为重点举措,明确提出选才与鉴才结合,真正发现和遴选志向远大、学术潜力大、综合能力强、心理素质好的优秀学生[2]。依据文件要求,结合学界已有研究及经济学学科特点,新文科建设背景下我国经济学拔尖创新人才选拔应包括三个方面的标准。第一,人文素养标准。无论是传统文科还是新文科,都以人和人的社会活动及意识活动作为主要研究对象,都以对真善美的追求作为学科的核心特征,因此,人文素养是经济学拔尖创新人才选拔的首要标准。人文素养通常体现为人本精神、对人和社会有研究兴趣、有积极向善的人文关怀等。新时代背景下,人文素养被具象化为家国情怀,以人民为中心的治学理念,传承中华优秀传统文化,有政策眼光和大局意识,有破解人类发展难题的远大志向等。面对全球化发展趋势,人文素养还体现为宽阔的国际视野和世界胸怀,能够在国际舞台上讲好中国故事。落实到实践层面,人文素养表现为社会实践、沟通表达、团队合作能力等。第二,思维能力标准。由于文科人才培养一直存在周期长、见效慢、难以量化评价等特征,且新文科建设起步较晚、涉及面较广,因此,在新文科拔尖创新人才选拔过程中,尤其要注重文科教育特点和人才成长规律。经济学属于人文社会科学,较难通过可量化的指标体系就其核心思想和价值判断进行评价和归因。正因如此,强调对学生思维的训练进而促进人文思想的形成,就成为包括经济学在内的人文社会科学教育的本质要求。从学科特点出发,经济学拔尖创新人才选拔也应回归经济学教育本质,将学生的思维能力作为重要的选拔依据。经济学的思维能力主要包括分析性思维、比较性思维和创新性思维,具备这三种思维能力的学生在遇到问题时会主动积极地思考和探索,快速形成怎么想、怎么做、做什么的科学逻辑,进而展现较强的分析问题、解决问题的能力,以及创新批判、敢为天下先的勇气。第三,技术适应标准。已有研究发现,人文社会科学的发展首先经历从文史哲传统文科向社会学、心理学、经济学等社会科学大文科的转向,继而发生与数学、计算机科学相关的人文社会科学的统计学转向,目前正处于与信息技术爆炸式发展相适应的新阶段[15]。本质上,人文社会科学的每一次转向,都是适应生产力发展和科技进步、求新求变的过程。生产力和科学技术的重大变革,同时引发经济学革命,具体表现为不断拓宽经济学研究视野、带来经济学新的研究方向和研究内容,向经济学提出新问题、新挑战,推动经济学向前发展,使经济学研究手段和分析工具日益丰富,等等。因此,对新技术的接受和适应能力,以及运用新技术并将其转化为创造力和创新意识的能力,成为经济学拔尖创新人才选拔的又一项重要标准。二、“中国特色经济学”实验班的选拔程序、特征与成效中国人民大学利用入选首批“经济学拔尖学生培养计划2.0”基地的契机,于2020年9月正式设立中国特色经济学实验班,这是全国第一个也是唯一一个以“中国特色经济学”命名的实验班。实验班严格遵循基础学科拔尖学生培养目标要求,做好系统设计,突出培养特色,汇聚优质资源,全面改革创新,致力于构建“人大特色、经院风格”的中国特色经济学拔尖创新人才培养体系和培养模式。截至目前,实验班已招收四届学生,每届选拔录取20人,并在2024年6月迎来首批毕业生。实验班在创办宗旨、选拔模式、课程体系、学程衔接、培养措施等方面进行了积极探索,以下对实验班的选拔试点情况进行梳理和总结。(一)实验班选拔程序为科学准确地将志向远大、学术潜力大、对中国特色经济学具有浓厚兴趣的优秀学生选拔出来,实验班项目积极创新选拔模式,大胆尝试新理念新做法,将拔尖创新人才选拔作为一项系统性、长期性工作来抓,同时制订详细的选拔方案,涵盖选拔项目及宣传、选拔对象、选拔名额、选拔流程、选拔方式等内容。以2023级实验班学生选拔为例,整个选拔过程分为四个阶段[16]。第一阶段:宣传,包括确定选拔范围及前期宣传。实验班项目为落实首批国家经济学拔尖学生培养计划2.0而设立,旨在培养掌握中国特色经济学理论和发展前沿,具有经济思想史和经济史深厚素养和广阔视野,质性与量化分析方法并重,扎根中国大地,参与中国经济改革与发展实践,分析思维、历史视野和问题意识交叉融合,服务于建设社会主义现代化强国亟须的一流高端理论人才和建设人才。2023年实验班选拔对象主要面向全校范围内的2023级本科新生,不限文理,并特别提示在高考录取时明确有专业调整限制的新生在申请时要符合高考录取相关要求。项目宣传主要是针对选拔项目开展宣讲活动,请学院领导、项目负责人、往届学生等介绍项目相关情况,并将确定的选拔对象、选拔规模等信息,通过公众号、项目咨询群、宣讲会等方式进行宣传。第二阶段:报名与审核,主要包括学生自主报名和报名审核两个步骤。首先,学生要在规定时间内通过“微人大教务链接”和“问卷星报名链接”两个系统完成自主报名,并按照系统要求填写高中阶段获奖及其他情况。其次,学院对申请人提交材料及其报名资格进行审核和综合评定,确定参加选拔考试的学生名单,并在项目咨询群中发布。第三阶段:选拔性考试,主要分为笔试和面试两个环节。笔试注重考查学生的分析能力、批判性思维能力、文字表达能力,不涉及专业知识;面试注重考查学生的逻辑思维、语言表达、学习潜力、自我认知、应变能力等。进入选拔考试名单的学生要在规定时间前往指定地点参加笔试和面试,未参加考试的视为自动放弃。第四阶段,选拔结果公示与录取。学院根据学生的笔试和面试成绩并参考高考成绩依序录取。同时,学院将录取结果在经济学院网站公示,并在“人大经济学拔尖学生培养基地”公众号和项目咨询群中同时发布录取结果信息。通过公平公正选拔和多方研究讨论,2023年实验班最终录取20人。(二)实验班选拔特征实验班学生的选拔过程具有六个明显特征:其一,依据新文科培养理念选拔人才,注重考查学生的价值信念和济世品格,并将其作为首要要求。其二,考查学生的综合素质而不仅仅是智力水平,采取包括笔试和面试的非智力测验,实现选拔方式多样化。其三,面试环节注重把握学生特质,尤其是学术志趣和创新潜质,关注学生与项目要求的契合度。其四,在全校范围内开放报名,具有报名资格的学生均可参加考试,面向当年入学新生择优录取,实现了生源群体的多元化。其五,发挥高考在人才选拔方面的积极作用,将高考招录与入校选拔有机结合。其六,选拔程序规范化、制度化,通过宣传宣讲、建群答疑等方式确保参选学生知晓项目,由相关专业的教师组成选拔团队,采用相对统一的选拔标准并严格执行选拔程序。以2020年首批实验班学生的选拔为例,经济学院在开学前提前组建选拔小组,包括政治经济学、经济史、经济思想史三个教研室共六位教师。选拔小组充分发挥教师专业优势,协同合作,高质量高效率地完成宣讲、咨询、命题、笔试、阅卷、面试、录取、公示、组班等一系列工作。据统计,2020年全校共有134名学生报名,参加笔试、面试并获得成绩的学生有85人,按照笔试、面试成绩加权并参考高考成绩依序排列后最终录取20人。本次选拔的每个环节都是一次新的尝试和探索。例如,在宣讲环节,考虑到学生当时尚未入校,先针对非经济学类学生线上宣传,邀请学院院长和主管副院长宣讲,吸引了大批学生踊跃报名;学生报到进校后,又专门面向经济类学生开展线下宣讲,两次宣讲的内容各有侧重。再如在笔试环节,先由四位教师分别单独命制一道材料题,试题选材内容各异,不涉及专业知识,目的是考查学生对问题的理解和分析能力,考试时由学生在四道题中自主选择一题进行作答,为学生充分发挥自身能力提供空间。又如在面试环节,由六位教师分成两个小组展开多对一面试,通过随机提问的方式考查学生的综合素质及与项目要求的契合程度。(三)实验班选拔与培养成效中国人民大学创办“中国特色经济学”实验班,对于落实国家重大战略要求、培养中国特色经济学教学与研究高级人才、推动新时代中国经济学发展具有重要意义,也为新文科建设探索了改革经验。人才培养是一项长期事业,因此对拔尖创新人才选拔成效进行检验和评价尚需假以时日。短期来看,学生在校期间的学业水平、科研表现,以及毕业去向能够在一定程度上体现选拔与培养成效。根据公开数据,自开班以来,实验班学生在国家大学生创新性实验计划项目、全国大学生数学竞赛、美国大学生数学建模竞赛等多个项目或竞赛中都取得优异成绩[17-19],具体见表1。这些成绩在一定程度上说明实验班学生具备较强的学科功底、学术水平、创新能力,以及运用数学工具解决实际问题的能力。以2020级实验班的一位同学A为例,该同学在校四年间分别荣获吴玉章奖学金、国家奖学金、中国人民大学学习学术类一等奖学金、胡乃武学术青苗奖学金、2021年第十三届全国大学生数学竞赛北京赛区非数学类一等奖等多个奖项,同时以本科生身份参加第十届中国博弈论年会、第五届微观经济理论论坛等高级别学术会议,还在组织经济学领域的顶刊上发表合作论文。从毕业去向看,截至2024年5月,首届中国特色经济学实验班学生中有17人被国内外顶尖知名大学研究生项目录取,其中有12人选择在中国人民大学继续攻读研究生学位。三、“中国特色经济学”实验班人才选拔的经验与启示“中国特色经济学”实验班就经济学拔尖创新人才选拔模式进行探索和尝试并取得初步成效,有必要对其招生选拔过程中的经验进行总结,并提出需要进一步思考和探讨的问题与方向。其主要经验包括以下五个方面。第一,将选拔工作作为项目重要环节予以高度重视。实验班项目以“扎根中国大地”为宗旨,以本硕博贯通式培养为特色,建立和实施“一论二史、史论结合”的课程体系,培养以马克思主义理论为指导,能够对中国特色社会主义重大理论和现实问题进行分析和回应,有理想、有担当、懂理论、懂历史、会方法的新型经济学人才。人大经济学院高度重视这一具有时代意义的人才培养项目,不仅要求参与选拔的专业教师具有高度的思想政治觉悟和道德品质修养,而且从项目推介宣传到学生录取公示的每个选拔环节都予以大力支持,要求相关教研室的教师和行政人员积极配合选拔工作,最终高质量完成选拔过程中的各项工作。第二,坚持将理想信念作为人才选拔的第一要求。实验班项目在选拔学生时,始终坚持将学生个人的理想信念作为选拔的第一要求,要求学生有坚定的马克思主义理想信念,有理想、有道德、有文化、守纪律,有良好的品质和文明教养,有实事求是的踏实学风。实验班项目还重点关注学生对我国重大现实问题的分析和回应能力,以及学生对扎根中国大地、深入基层开展社会实践活动的接受程度。为了落实这一要求,参与选拔的教师需要在笔试环节的题目设置及面试环节的问答设计方面巧妙考查,目的是在不刻意为之的情境下对学生的理想信念和思想品德作出准确判断。第三,注重考查学生的人文素养。作为人文社会科学的重要学科门类,经济学不仅研究财富问题,也研究人的行为问题。因此,无论从学科类别还是研究对象上看,经济学拔尖创新人才的选拔必须重视学生的人文素养。人文素养的内涵和外延都极为广泛,如何通过有限的考试设计评估学生的人文素养需要重点谋划。实验班项目在选拔学生的过程中,将对学生人文素养的考查具体化为以下五项内容:一是对马克思主义经济学和现代经济学基础理论和发展前沿的关注,二是对经济思想史和经济史视野及历史分析方法的认同,三是对国情民情和社会发展趋势的了解,四是对根植于中国大地的重大现实问题的研究兴趣,五是对社会调查实践的偏好。实践发现,通过在面试环节就上述方面对学生进行提问或展开对话,可以较好地评估学生的人文素养水平。第四,让选拔与培养回归经济学教育本质。实验班学生的教学培养是回归经济学教育本质的一项探索。为此,项目组进行了以下几项尝试:一是通过极富中国特色和时代特征的课程体系,培养和发展学生在经济学领域的分析思维、比较思维和创新思维,教学生“怎么想”;二是通过开展现代数量分析方法和质性分析方法等经济分析工具的教学训练,教学生“如何做”;三是以我国实践问题为导向帮助学生树立问题意识,引导学生开展学术研究,教学生“做什么”;四是以培养学生的思维能力为目标,将试题选择权教给学生,使其思考和创造能力得到充分释放。最终,通过学习回归经济学教育本质的课程,学生的分析性、比较性、创新性思维得到进一步提高和巩固,勇于面对问题、善于解决问题的能力也得到进一步提升。第五,在选拔过程中实现交叉融合。这主要体现在两个方面:其一,不拘泥于学生的专业限制,面向全校各专业学生开展选拔工作,并注重考查学生史论结合、跨学科专业整合知识、解决复杂问题等能力。这种做法不仅契合了新文科建设所要求的学科交叉融合、专业深度融通的趋势,而且有助于选拔出善于总结规律、可以将实践经验上升为系统化经济学说的创新人才。其二,面对新的科技革命,经济学拔尖创新人才必须紧跟技术变革,关注变革产生的广泛影响,同时有能力使用新工具、新手段开展学习,并将技术变革的新发明、新成果运用于经济学研究。鉴于此,在选拔过程中注重考查学生对计算机编程、统计分析、人工智能等新技术的适应和接受程度,可以为实现新技术变革与经济学的有机整合做好人才准备。实验班项目在选拔和培养学生的过程中也发现一些问题,这些问题与已有研究结论具有一致性,值得研究者持续关注和进一步探讨。首先,学生经济学领域的能力素养与其价值信念不成正相关。这说明理想信念作为经济学拔尖创新人才选拔第一要求的必要性、科学性和合理性,也印证了已有研究提出的拔尖计划应进一步关注对学生兼济家国品格的培养、应引导学生确立更加成熟的价值信念[20]等观点,同时反映出学生思想政治教育工作任重道远,加强对学生价值观、人生观、世界观、使命观、责任观的教育和引导是培养五育并举的拔尖创新人才的当务之急。其次,学生的学术志趣随年级增长而发生一定的蜕变[21],因此要高度重视选拔工作,不断优化和完善选拔过程的各个环节,探索更加多元的选拔方式。例如,可以尝试增加评价频次、通过日常测试对学生进行二次筛选,建立科学的分流退出机制等。最后,随着拔尖基地规模的不断扩大,拔尖创新人才不断增加,为了让有限的资源充分发挥作用,应对人才的长期兴趣及专业忠诚度提出明确要求,同时在选拔时应遵循宁缺毋滥原则。四、结束语拔尖创新人才培养是我国高等教育“质量革命”的重要议题,国家选取多所大学共同实施基础学科拔尖学生培养计划,旨在鼓励高校立足自身实际,依托自身特色和优势学科,积极探索个性化的拔尖创新人才培养之路。这不仅给拔尖创新人才选拔标准的制定预留了政策空间,也在公正、合理、科学等基本要求之外强调了标准的多样性,为丰富和积累本土化实践经验、进一步完善和有效执行拔尖创新人才教育提供了多种机会[22]。每所大学都有其特有的资源条件和组织文化,拔尖创新人才培养模式也相对稳定[23],但身处不同学科的拔尖创新人才具有不同的特质;因此,为所有高校和学科设立统一的选拔标准和模式并不符合实际,但确定选拔原则和方向不可或缺。新文科建设从理想志向、学术潜力、综合能力、心理素质等方面,为基础学科拔尖创新人才选拔标准的设立指明方向。中国人民大学在新时代新文科建设背景下创办“中国特色经济学”实验班,既是对人才选拔的一项积极探索,也是满足国家战略需求、培养解决中国问题的本土经济学人才的积极实践。实验班以拔尖创新人才的学术志向为考查基础,加强对学生政治品德、人文素养、思维能力和技术适应能力的综合评价,严格遵循录取标准,最终形成富有特色的拔尖创新人才选拔模式。这对提升我国经济学教学与研究、建构经济学自主知识体系具有重要意义,也契合新时代我国经济学发展的新要求,为新文科建设探索积累了改革经验。参考文献略。

何沛芸 卿灿:我国小学生考试焦虑状况、影响及其成因——基于SSES2019调查数据的分析

2024-07-01

原创 何沛芸 卿灿 中国考试 2024-06-28 15:53 北京引用格式:何沛芸, 卿灿. 我国小学生考试焦虑状况、影响及其成因: 基于SSES2019调查数据的分析[J]. 中国考试, 2024(6): 90-99.作 者何沛芸,南京大学教育研究院在读博士生。卿灿,华东师范大学教育学部在读博士生(通信作者)。摘 要:行之有效的考试焦虑干预手段,对于保护中小学生心理健康具有重要意义。本研究采用SSES2019年调查数据对我国小学生考试焦虑状况、影响及成因进行初步探讨。研究发现:我国超过三成小学生存在考试焦虑现象,“考试不自信”是小学生考试焦虑主要表现形式;回归分析发现考试焦虑不利于小学生学业发展,阅读成绩受到的影响最为明显,且“考试不自信”对学生学业成绩的负向影响最大;教师期望和家长期望对小学生考试焦虑具有显著正向影响,学校和家庭因素是造成小学生考试焦虑的主要原因。基于此,研究提出三个方面改进举措,包括优化考试制度、建立情感支持体系,转变教育观念、营造和谐家庭氛围,倡导教育多元、加强家庭学校社会合作。关键词:考试焦虑;小学生;学业成绩;教师期望;家长期望一、问题提出考试焦虑(test anxiety)是学生在学习过程中出现的一种消极情绪状态,主要发生在评价情境中[1],具体是指个体处于考试或其他评价情境时所产生的紧张、不安、担忧以及相应的情绪唤醒[2]。我国学生考试焦虑现象在基础教育阶段较为突出,有调查研究显示,近15年来我国中小学生考试焦虑发生率居高不下,长期稳定在30%左右[3]。这严重影响到学生的认知与非认知能力发展,甚至危害其身体健康。考试焦虑是基础教育内卷现象的一种具体表现,东亚社会一直重视教育,孩子的良好教育需要从小抓起也已成为文化共识。为了“不输在起跑线上”,我国不少学生从小学阶段就被迫卷入以考试成绩为代表的激烈竞争,进而导致考试焦虑的低龄化。为促进学生的全面发展和健康成长,2021年7月,中共中央办公厅、国务院办公厅印发了《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》(以下简称“双减”政策),针对我国中小学生过重的作业负担与校外培训负担现象提出整改举措。2023年4月,教育部等17个部门联合发文《全面加强和改进新时代学生心理健康工作专项行动计划(2023—2025年)》,明确指出要加强学生心理健康工作体系建设,全方位强化学生心理健康教育,健全心理问题预防和监测机制[4]。由此可见,全面提升学生心理健康水平已然成为新时代人才培养的必然要求。考试焦虑现象也成为学界关注的重点问题,近年来国内外学者围绕学生考试焦虑的影响及成因进行了大量讨论。从其影响来看,研究发现考试焦虑不仅对学生智商、课程成绩与GPA、记忆力等认知能力具有显著的负向影响[5-8],而且不利于学生的情绪调节能力、专注度等非认知能力发展[9-10]。不仅如此,有学者指出长期的考试焦虑还会危害学生的身体健康水平,对学生的心肺功能、免疫系统等造成危害[11-12],考试焦虑严重时可能使学生产生抑郁情绪甚至自杀行为[3,13]。因此,分析考试焦虑的影响因素进而对学生考试焦虑进行有效干预十分必要。基于既有研究,可以将考试焦虑的影响因素大致划分为内部因素与外部因素两类。内部因素主要源自学生个体层面,包括基因遗传、情境自我评估、自我认知等。例如,有学者提出特质焦虑有50%左右的差异是基因遗传造成的[14]。同时,个体对所处评价环境的自我评估也会影响其情绪状态,当学生判定所处的考试评价情境对其自身具有一定难度或挑战性时便会表现出较高的焦虑情绪[15]。此外,考试焦虑还受到个体自我认知的影响,自我成就目标较高的学生通常比其他学生具有更高的考试焦虑情绪[16]。外部因素方面,既有研究则主要围绕学生家庭和学校两个方面进行探讨。例如,多项研究指出,父母的教育水平越低、家庭社会经济地位越低、对子女的教育期望越高、采取专制型的教养方式等家庭因素会导致学生更高的考试焦虑程度[17-21];同时,就读于重点中学、学校的课业负担重以及教师消极的教学行为等学校因素也会对学生考试焦虑造成负向影响[7, 22-23]。目前,已有不少学者围绕考试焦虑对学生的影响及成因进行了讨论。首先,从研究对象来看,多数学者主要针对中学生、大学生的考试焦虑,专门探讨小学生的研究并不多见。其次,从研究视角来看,多数研究主要围绕学生个体特征以及家庭因素就考试焦虑的成因进行分析,探讨学校特征尤其是教师特征因素影响学生考试焦虑的研究较少。此外,近年我国学生考试焦虑现象呈现出低龄化趋势,在这样的社会背景下亟须对我国小学生考试焦虑现象做出系统全面的分析,为有效提升学生心理健康素养提供经验证据,从而促进我国基础教育健康发展。基于此,本文尝试分析我国小学生考试焦虑状况,并探讨考试焦虑对小学生学业表现的影响,以及家长期望、教师期望和同辈期望对小学生考试焦虑的影响,以期找到干预小学生考试焦虑的有效办法。二、研究方法(一)研究设计本研究数据来源于社会情感能力调查(study on social and emotional skills, SSES)2019年中国小学生样本。该调查是OECD于2019年在中国、韩国、美国等9个国家开展的针对青少年社会情感能力的一项大规模国际性测评。项目采取两阶段抽样方式在中国苏州调查了3800余名小学生的详细信息,包括学生个人、家庭、教师等方面。首先,对问卷中的信息进行编码、合并,并对缺失值、异常值等进行处理,获得2927名小学生有效样本,其中男生样本1584名,占比54.12%;女生样本1343名,占比45.88%。其次,采用OLS回归方法构建模型分别探讨考试焦虑对小学生学业表现的影响和家长期望、教师期望以及同辈期望对小学生考试焦虑的影响。最后,采用夏普利值法(Shapley value method)深入探讨学生个体特征、家庭特征以及学校特征等因素对考试焦虑的影响程度。夏普利值法采取的是合作博弈论的思想,基于回归模型的估计结果,通过逐步剔除各影响变量展开分解并计算拟合优度的变化量,当拟合优度变化越大时则表明该影响变量对被解释变量的边际贡献度越高[24]。(二)模型与变量首先,根据OLS回归方法设定如下模型,探讨考试焦虑与小学生学业表现的关系:上式(1)中,s表示学校,i表示学生个体;gradeis表示小学生的学业表现情况,调查组收集了受访学生在数学、阅读、艺术三个学科的学校成绩信息,并对原始成绩做标准化处理以保证不同学校间成绩具有可比性,然后将其作为判断学生学业成果的依据之一;anxiousis为小学生考试焦虑情况,调查组询问了学生对“经常担心考试很难”“为了考试学习时会感到紧张”“即使准备很好仍然会担心考试”等问题的认可程度,回答均采用5点计分法(非常不同意=1;非常同意=5),然后根据得分情况计算了学生的考试焦虑指数。根据教育生产函数,影响个体教育产出的投入要素主要包括来自学生个体、学生家庭、教师以及学校等方面的投入[25]。据此在模型中控制一系列混淆变量:①学生特征变量(Xperson, is),根据数据可获得性,选取了学生性别(男生=1)、是否为独生子女(是=1)以及学生自评健康状况(很差=1;很好=5)。②家庭特征变量(Xfamily, is),包括学生父母的年龄情况(24岁以下=1;50岁以上=7)、父母受教育水平(文盲=1;博士=8)以及调查组给出的家庭社会经济地位指数(SES)。③教师特征变量(Xteacher, is),涉及教师性别(男性=1)、年龄、教龄以及教师受教育水平(小学及以下=1;博士=7)。此外,考虑到可能还存在一系列学校因素会影响青少年考试焦虑,模型还纳入了学校固定效应(δs)。εis为随机扰动项。其次,根据OLS回归方法设定如下模型,探讨我国小学生考试焦虑的影响因素:上式(2)中,expectis表示小学生受到来自家庭、学校以及同辈的期望,其中家庭层面来自问项“我父母希望我每件事都做得很好”“我父母总是希望我比别人做得更好”;学校层面来自问项“我老师希望我的作业完成得很好”“我老师对我要求很高”;同辈层面来自问项“我朋友对我的期待超出了我的能力范畴”“我朋友对我要求太多了”。所有问项的回答均采用了5点计分法(非常不同意=1;非常同意=5),为了便于分析,本文对每类变量进行加总处理,最终得到家长期望、教师期望以及同辈期望三个变量。模型中其余变量同公式(1)。各变量的描述性统计结果如表1所示。最后,借助夏普利值法进一步探讨学生个体、家庭以及学校等因素对其考试焦虑的影响程度。夏普利值的具体计算可基于如下公式:上式(3)中,Shxj(f)为变量xj的夏普利值;K为自变量的集合{xj};Θ(K)为K所有的排列组合;θ表示自变量的一组排列;MC(xj, θ)表示变量xj在θ中的临界贡献。三、结果与讨论(一)我国小学生的考试焦虑情况首先根据SSES2019调查中针对小学生考试焦虑所提的三个问题进行描述统计,以探清我国小学生考试焦虑状况,结果如表2所示。根据表2,我国小学生考试焦虑现象较为普遍,有接近70%的受访学生表示自己可能存在考试畏难、考试紧张以及考试不自信等考试焦虑情绪;超过三成的学生明确表示自己存在考试焦虑,且男生所占比例高于女生。从考试焦虑的各维度来看,有38%的小学生明确表示即使自己准备得很好仍然会担心考试,即考试不自信;其次是考试紧张与考试畏难,分别占比34%与33%。可以发现,我国小学生的考试焦虑现象较为普遍,亟须社会各界的广泛关注。他们可能承受着较大的压力,其中包括来自家庭、学校以及社会等方面的期望与要求,这些压力导致小学生即使认为自己已经为考试做好了充足准备,仍然会担心考试失利。同时,统计结果也发现大多数小学生不存在考试紧张问题,这或许是因为我国小学生参加了过多的考试选拔活动,已经逐渐适应了考试带来的紧张感。(二)考试焦虑对小学生学业成绩的影响鉴于我国小学生考试焦虑情况确实存在,有必要进一步探讨考试焦虑会对学生造成何种影响。本文主要从小学生学业表现视角进行了分析,小学生数学、阅读以及艺术成绩在不同考试焦虑组别下的均值如表3所示。根据表3,小学生数学、阅读以及艺术成绩在不同考试焦虑组别间确实存在显著差异,无论是考试畏难、考试紧张还是考试不自信,随着其焦虑程度的加重,小学生的各类成绩均有不同程度的下降,其中,阅读成绩降低最为明显,组间差异最大为2.96个标准分,且在统计意义上显著。为明确小学生考试焦虑是否对其学业表现具有消极影响,本文采用模型(1)进行回归分析,结果如表4所示。根据表4,在控制了学生、家庭、教师以及学校等各类因素的条件下,考试焦虑对于学生的学业成绩确实具有显著的负向影响。其中,小学生的阅读成绩受到考试焦虑的影响最大,考试焦虑指数平均每增加1分,其阅读成绩将会显著下降0.06个标准分。此外,本研究还就考试焦虑不同维度对小学生学业成绩的影响进行了估计,结果如图1所示。根据图1,考试不自信对小学生学业成绩带来的负面影响最大,其次分别为考试畏难与考试紧张;从各科学业成绩来看,依旧是小学生的阅读成绩受到的负向影响最大,其次分别是艺术成绩与数学成绩。由此可见,考试焦虑情绪主要对偏文学科成绩影响较大,而对偏理学科成绩影响较小。这可能与心理学提出的注意控制理论有关,阅读、艺术等偏文学科对个体所需的认知与记忆资源要求更高,因此受到的影响也就更大。(三)影响小学生考试焦虑的因素为探讨如何有效缓解我国小学生考试焦虑问题,本研究对小学生考试焦虑的影响因素进行了分析。表5为基于模型(2)的估计结果,来自家庭、学校以及社会等各方面的压力确实对小学生考试焦虑具有正向影响。在控制学生特征、家庭特征、教师特征以及学校固定效应的条件下,家长的期望程度平均每增加1个单位,将会显著提高小学生的考试焦虑指数0.886分;教师期望、同辈期望平均每增加1个单位,将会分别显著增加小学生考试焦虑指数1.581、0.710。为比较家庭、教师以及同辈等对小学生考试焦虑影响的大小,本文还同时将三个变量纳入回归进行分析。从表4中结果(4)来看,教师期望对小学生考试焦虑影响程度最大,家长期望次之,而相较之下,同辈期望对小学生考试焦虑的影响最小且不显著。类似地,本研究也采取与结果(4)相同的实证策略,就各类期望对小学生考试焦虑不同维度进行了估计。从图2的结果来看,对小学生考试焦虑影响最大的仍然是教师期望,尤其是会影响到小学生的考试畏难情绪;相较之下,家长期望对小学生考试焦虑影响较小,主要是会影响小学生考试不自信情绪;而同辈期望则依旧对小学生考试焦虑无显著的影响。可能的原因在于,小学生在校内与校外的活动中最为经常接触的就是教师与家长,他们的行为态度直接影响着小学生的学习状态与情绪变化。就考试焦虑而言,教师直接决定着小学生的学习任务、考试频率、测试难度等,因此教师对小学生的学业要求和期望越高,往往布置的学习任务越多、考试频率越高、测试难度越大,这将会直接影响小学生的考试焦虑,尤其是会让小学生产生考试畏难情绪。而家长则会通过安排校外学习活动以及平时的言传身教等方式,给小学生传达出对其较高的教育期望,也会对小学生考试焦虑具有一定影响。小学生尤其会担心自己在各种竞争性考试中失利而让家长失望,所以会出现考试不自信的消极情绪。相较之下,同辈对小学生的期望不具有约束性和强制性,因此对其考试焦虑的影响相对较小。最后,借助夏普利值法对模型(4)中各回归变量对小学生考试焦虑的影响程度进行分解,结果如表6所示。从各影响因素对小学生考试焦虑贡献率来看,教师和学校层面的因素确实是影响小学生考试焦虑的最主要因素,贡献率高达55.12%;家庭层面因素次之,贡献率达24%。学校和家庭是小学生活动最为密切的环境,他们的教育和生活都主要在这两个时空环境中进行。其中,学校提供了学习的场所和制度,而家庭则是小学生最早接触到的社会环境,都对小学生的情感、认知和行为发展有着深远的影响,因此学校和家庭对小学生考试焦虑影响的贡献率合计达到80%。而相较之下,小学生的社会圈子相对狭窄,通常在认知、情感和社会发展上还处于相对较早的阶段,因此社会因素对其考试焦虑的影响较小。但需要注意的是,虽然学校和家庭特征因素对小学生考试焦虑的影响较大,但其中实则存在了大量人为难以改变的因素,诸如父母年龄、父母受教育水平、教师教龄、教师受教育水平、学校区位、学校教育理念等等,现实生活中难以通过对这些因素的调控来减轻小学生考试焦虑的程度。因此,从可操作角度来看,外界附加在小学生身上的过高期望不容忽视。表6中的结果也显示,家长、教师以及同辈对小学生的期望对小学生考试焦虑贡献率总计达22.78%,其中影响最大的来自教师期望,其次为家长期望。可见,缓解小学生考试焦虑的着力点应放在教师与家长对小学生的期望上,降低对小学生的预期和要求。家庭与学校合力为小学生共同营造一个轻松积极的成长和学习环境是破解小学生考试焦虑现象的关键。四、结论与建议本文基于SSES2019年中国小学生样本数据,首先从考试畏难、考试紧张以及考试不自信三个方面对我国小学生考试焦虑进行了现状描述,发现我国有超过三成的小学生存在考试焦虑问题,且男生占据比例更大;其中,考试不自信是小学生考试焦虑主要表现形式。其次,通过组间差异分析探讨了小学生数学、阅读以及艺术成绩在考试焦虑不同组别间的差异情况,发现小学生各类学业成绩会随着其焦虑程度的加重而下降;通过回归分析也发现考试焦虑对于小学生的学业成绩确实具有显著的负向影响,其中阅读成绩受到考试焦虑的影响最大;从考试焦虑维度看,考试不自信对小学生学业成绩的负向影响最大,其次分别为考试畏难与考试紧张。最后,从家庭、学校以及社会等三个方面分析了家长期望、教师期望以及同辈期望对小学生考试焦虑的影响,发现教师期望和家长期望对小学生考试焦虑具有显著正向影响,并借助夏普利值法对模型各变量的贡献率进行了分解,发现学校和家庭因素是造成小学生考试焦虑的主要原因,贡献率合计高达80%。基于上述结论,本文从学校、家庭、社会三个层面提出如下几点建议。首先,学校应优化考试制度,建立学生情感支持体系。在中小学阶段,学校是学生生活的核心,其不仅是传授知识的场所,更是学生成长、交流和身心发展的重要场所,因此学校在缓解学生考试焦虑问题上应该发挥重要作用。为此,学校应优化考试制度,在考试频率、考试难度、考试内容、考试形式等方面应做出调整,采取多元化的学业测评方式,弱化传统考试在学生校内学习中的应用。此外,学校还应当建立情感支持体系,一方面要重视培养学生的心理韧性和自我调控能力,为学生提供必要的心理健康教育和咨询服务;另一方面学科教师也应适当降低对学生的学习要求和难度,在布置学习任务时要注意到学生间的个体差异,加强个性化培养。其次,家庭应转变教育观念,注意营造和谐家庭氛围。家庭是学生最主要的生活场所、是学生成长过程中的重要支柱,家长的行为态度、言传身教、教育方式等对于学生的情绪状态和性格养成有着深远影响,有效缓解学生考试焦虑离不开家庭的支持和参与。由于教育竞争激烈,学生面临着家长对成绩的过度关心和过高的教育期望,这容易给学生的教育学习带来沉重心理负担。为此,家长应转变教育观念,摆正对孩子学习成绩的态度,不过分强调分数和排名,合理调整对子女教育的期望,注重学生的全面发展和个性化培养;同时还应该营造和谐的家庭氛围,给予学生充分的情感支持和理解,在其遇到困难和挫折时给予鼓励和安慰,不要过分批评或施加压力,让家庭成为学生心理上的避风港。最后,社会应倡导多元教育,加强家庭学校社会合作。家庭的教育方式、学校的教学理念等都会受到社会教育政策和舆论等社会因素的影响。因此,社会应该倡导多元化的教育观念,使大众认识到教育的目的不仅是为了取得好的成绩,更重要的是为了培养学生的综合素质和个性发展。此外,还应加强家庭学校社会的三方联动,为学生提供多样化的学习机会和资源,鼓励他们积极参与各种实践活动和社会实践,培养他们的多种能力素养和创新精神,共同努力为学生营造一个轻松、积极的校内校外学习环境,推动教育改革和良性发展。“双减”政策对我国中小学生校内课程作业与校外补习培训方面做出明确规定,减轻了中小学生的显性负担。然而,有学者指出家长的教育焦虑情绪并未因“双减”政策的实施得到缓解[26],而这种教育焦虑情绪又具有一定的代际传递性,会对学生情绪和行为产生影响[27],给学生带来隐性负担。本研究从教育期望这一外部压力视角出发,探讨了如何从学校、家庭、社会等方面有效缓解学生的考试焦虑,为重构“双减”背景下的良性教育生态提供了新思路。当然,受数据限制,本研究还存有不足之处,后续可基于“双减”政策实施前后的数据做进一步探讨和验证。参考文献略。

孙杭 金艳:考试分数报告研发的国际经验及启示

2024-07-01

原创 孙杭 金艳 中国考试 2024-06-26 15:10 北京引用格式:孙杭, 金艳. 考试分数报告研发的国际经验及启示[J]. 中国考试, 2024(6): 79-89.作 者孙杭,上海理工大学外语学院讲师。金艳,上海交通大学外国语学院教授(通信作者)。摘 要:分数报告是考试结果的呈现形式,作为考试开发人员与考试使用者的沟通媒介,它在很大程度上影响着考试能否达成预期目的。十多年来,在教育与心理测量领域,分数报告的研究与实践取得丰硕成果。本文聚焦于国际前沿的分数报告开发流程和评价方法,对国内外大型外语考试分数报告案例进行分析,提出我国教育考试分数报告的改革和创新可以从整体规划、理论构建和加强信息技术运用等三个方面展开,为我国分数报告的理论和实践创新提供参考。关键词:分数报告;教育评价改革;研发框架;评价体系;国际经验作为考试结果的呈现形式,分数报告(score report)是实现考试功能的重要环节。Zapata-Rivera等指出,分数报告是连接考试信息和考试使用者决策或行动的桥梁[1]。无论一个考试的构思、设计和实施过程如何科学合理,假如考试使用者不能正确地理解和使用分数报告,则所有前期努力都将付诸东流[2]。分数报告作为考试的外部形象,是公众了解考试信息最直观的材料,直接影响着公众对考试的看法[3]。一直以来,考试研发人员将大部分精力放在如何开发技术上能够通过公众和专业人士严格审查的考试,而对如何组织、报告和使用考试结果的研究相对较少[4]。在很长一段时间里,大多数考试的分数报告几乎只包含总分及对考试使用者来说不太相关的信息,给人留下负面刻板印象,认为考试就是将每个考生标记成一个数字或提供一堆令人无法理解的信息[5]585。有研究表明,无论是教育决策者、教学工作者还是公众,在理解和使用考试结果方面都存在不少困难[6-8]。十多年来,社会公众以及教育界对考试后效(washback)不断反思,促使教育与心理测量领域重新认识和关注分数报告的重要性。有关分数报告的相关研究迅猛增长,已经逐渐成为一个重要且独立的研究领域。同时,分数报告的研究内容也不再局限于分析考试分数的心理测量学特质,而是扩展到如何在设计分数报告时充分考虑特定受众的需求和特征,如何利用不同的图示和支持性材料提高使用者对分数报告的理解,以及如何促进考试信息的合理使用等方面[9]。目前,我国大规模教育考试组织严格规范、命题质量高,但对考试分数报告的关注不足、相关研究也较少,尚未形成独立的理论体系和实践模式。国内有关研究发现,分数报告存在内容和形式单一、对教学和学习的导向作用不强等问题,考生认为现有大规模考试分数报告的丰富性有待提高[10-11]。同时,越来越多的国内学者意识到挖掘和利用考试数据、对分数报告进行改革和创新的重要性[12-14]。鉴于此,本文通过梳理和分析国际教育考试研究中分数报告的基本特征、开发步骤与评价方法,总结大型考试分数报告的实践现状,探索科学有效的分数报告内容和形式,以促进我国教育考试分数报告的理论研究和实践探索。一、分数报告的基本特征由于不同考试的考试目的和分数报告对象存在明显差异,因此并不存在一体通用的分数报告模式。然而,分数报告研发时应考虑的因素和分数报告的构成要素上存在诸多共性。有研究者在总结大量现有分数报告的基础上,构建了分数报告的基本特征汇总表[15],见表1。该框架将分数报告的特征分为八个基本要素,其中:1)报告对象,指报告的使用者,包括学生、家长、教师、教育管理人员等,在很大程度上决定报告的内容和信息呈现方式;2)分数量表,指分数的呈现形式,包括原始分、标准分、百分位数等多种形式,每种分数各有利弊;3)分数参照,指考试分数可以提供学生在学校、地区或国家常模群体中的位置(即常模参照),或学生对某些知识内容的掌握是否达到标准(即标准参照);4)评价单元,包含题目分、单项分和总分,总分是最常见的评价单元,特定知识/技能领域的单项分更能提供对教与学具有指导意义的信息,如提供诊断性反馈;5)报告单元,指报告可以提供给考生个人、班级、学校、地区等不同层面,且每个单元具有独特性;6)测量误差,指报告对考试的测量误差进行呈现和解释,如提供单项分的同时也提供该层面的测量误差;7)呈现方式,指报告中包含的数字、图表、文字叙述三种呈现方式;8)报告媒介,指报告传播的三种方式,纸质版是传统的报告媒介,网络版本(包含静态型和互动型)随着信息技术的发展愈发常见。在上述八个要素中,报告对象和报告单元是对报告目标受众的界定,分数量表、分数参照、评价单元和测量误差四项主要关注考试结果的报告方法,呈现方式和报告媒介强调报告内容的信息呈现方式和发放形式等。在研发分数报告时,考试开发人员首先应该考虑和确认这些基本特征。Zenisky和Hambleton在解析分数报告的基本要素时指出,应充分考虑分数报告的内容(描述和数据)、发放方式(纸质或电子版)、发放对象(个人或群体)[5]586-591。其中,报告内容的描述部分是对分数报告进行基本的描述和解释,具体包含考试名称/标识、考试日期、报告标题、报告目的、考试目的、介绍性引言、考生个体或群体信息标题、附加资源(如课程资料、解释性指南)的外部链接、分数使用指导、术语表、后续步骤等多项信息。数据部分是分数报告的核心,包括总结性结果、表现级别描述、单项表现、题目层面结果、常模参照结果、形成性或诊断性信息、进步情况预测和题目映射(item mapping)等七个主要内容。此外,根据2014年版《教育与心理测量标准》(Standards for Educational and Psychological Testing)要求,考试机构应帮助报告对象正确理解考试分数的意义[16]119。因此,分数报告应清晰、易于理解,且提供分数解释的相关信息,如提供计分方法和分数准确性的说明等。同时还应认识到,分数报告包含的最重要的信息和呈现这些信息的最佳方式取决于目标受众、考试目的及考试分数的心理测量学特质[17]。二、分数报告的研发框架与流程近年来,教育与心理测量领域发表了一系列有关分数报告开发步骤的研究。这些研究为考试开发人员提供了科学合理、基于研究支撑的研发框架,有助于收集相关的效度证据。其中,Zapata-Rivera[18]、Hambleton等[19]、Slater等[20]开发的三个框架应用较广泛,本文以主要研究者的名字命名其框架名称,每个框架的主要阶段划分和具体内容示例见表2。通过对比以上三个框架可知,Zapata-Rivera框架对应Hambleton等框架的前三个阶段,而后者在第四阶段强调发布后的分数报告进行持续调整和维护的重要性。Slater等框架增加制订分数报告研发进度表阶段(阶段二),并强调收集考试委托方反馈(阶段四)和使用者反馈(阶段五)的重要性。总体而言,上述三个框架都强调了报告研发前的准备工作、研发报告样例、收集反馈并加以修订、确定分数报告四个主要阶段。下面以Hambleton等框架为例,对考试开发者在各阶段应采取的行动和注意事项进行详细介绍。(一)阶段一:奠定研发基础Hambleton和Zenisky将分数报告研发的前期基础工作分为四步。第一步是对贯穿整个考试设计的分数报告应考虑的因素进行说明。例如,考试测量什么能力或技能?分数报告想要提供哪些信息?这一步的首要关注点是确保分数报告准确地反映考试想要达成的目标,并在考试开发的最初阶段厘清和说明考试、分数和分数报告的关系。第二步是确认报告对象,即明确根据分数报告做出决策或采取行动的利益相关者。例如,谁是分数报告的主要使用者?他们会根据分数报告做出哪些决策?不同群体对分数报告的需求不同,如教师可以根据分数报告调整教学,学生可以借助报告有针对性地开展自主学习,教育管理部门可以将报告作为评价、筛选的重要依据等。第三步是对报告对象进行需求分析。在与报告使用者的沟通过程中,应关注他们想要了解考试表现的哪些方面,哪些信息对他们有用以及如何获取和使用分数报告等[5]593。对报告对象的分析不仅包括鉴定他们的需求,还包括了解他们的测评素养[1]。测评知识较少的群体需要给他们提供更多的解释性、支持性信息以协助他们正确地理解报告内容。第四步是阅读相关文献,包括行业行为准则和有关实证研究[21]。这些行为准则和研究可以为考试开发人员提供科学可靠的参照。目前,很多考试机构都公开其分数报告样式,通过查阅分数报告实例,可以借鉴先进经验并避免重复他人犯过的错误[2]。(二)阶段二:研制分数报告样例基于阶段一收集到的信息资料,考试开发人员要设计一份或多份分数报告样例。分数报告样例也被称为预期分数报告(prospective score report, PSR),是最终版本的分数报告内容和呈现形式的模型[22]。按照考试开发流程,研发人员应在考试开发初期提前设计PSR,并在考试开发流程推进中根据发展变化对其进行相应的修订。然而,实际情况是很多分数报告经常是在考试开发的最后阶段才被提上研究日程,此时留给设计和修改分数报告的时间和资源都极其有限[5]591,由此导致分数报告可能无法提供一些重要信息。此外,PSR既要与测试目标和特定受众的需求相匹配,还要充分考虑整体设计和信息呈现的清晰程度和准确性,因此需要不同领域的专家通力合作。根据分数报告的形式和功能,专家团队包括专业领域专家、测量学专家、信息技术专家、图表设计师等[19]。(三)阶段三:获取反馈并进行修正这一阶段旨在获取相关人员对PSR的反馈信息,并根据反馈信息修正报告,是分数报告研发过程中不可或缺的重要步骤。首先,进行内部审核并达到满意结果,这需要考试开发人员根据收集到的信息对PSR进行几轮审查和修改。其次,采用问卷调查法、焦点小组法、访谈法、有声思维法、直接观察法或眼动实验等等多种研究方法进行外部审核,既要收集报告使用者的态度和感受,也要探究他们能否正确地理解报告内容。考试开发人员可以给报告使用者提供不同版本的分数报告,以了解他们偏向于哪个版本中的哪些特征[20]。最后,要认真、仔细地分析数据并作为依据修改报告。这是一个不断重复的过程,因为分数报告在版本确定和正式投入使用前必须经过多轮修改。(四)阶段四:评估和维护报告在分数报告正式对外发布后,考试研发人员还要对其进行维护。在阶段三中提及的数据收集方法也可应用于本阶段。评价分数报告需要大规模地收集报告对象的意见反馈,既包括对报告内容和形式的反馈(如信息的可读性、视觉化效果、对不同内容和呈现方式的偏好),也包括对分数报告的理解和使用情况的调查。例如,报告对象能否正确地描述分数的含义?他们根据分数报告做出哪些决策?此阶段应着重关注报告使用者在何种程度上理解(或误解)和使用(或误用、滥用)分数报告,以及由此产生哪些正面、负面的影响等。总之,研发框架可以为分数报告的设计提供科学、有效的模板,使考试开发工作有章可循、有据可依。上述研发框架具有一定的灵活性,可以应用在不同的考试场景中。此外,分数报告的研发步骤已经发展为迭代设计方法(iterative methodology design),即根据需要不断地利用后期搜集的信息修改和重复前期工作[17,19],这种重复的迭代方法在Zapata-Rivera的分数报告开发流程中得到体现,见图1。三、分数报告的评价体系为了确保分数报告的效度,需要对分数报告自身及研发流程等进行客观评估,为此不同学者设计了不同的评价系统,以下三种是比较典型的分数报告评价体系。与分数报告开发框架相对应,Zenisky和Hambleton针对每一阶段如何评价分数报告的研发进程同步设计了评价表,见表3[5]595。该评价表由开放式问题组成,旨在鼓励考试开发者清楚地记录分数报告开发过程中的细节。Zenisky和Hambleton认为,通过明确地记录和说明分数报告的开发过程,考试机构可以积累分数报告开发的效度证据以支持报告的合理使用[5]597。此外,Zenisky和Hambleton还就如何评价分数报告提出37个指导性问题,涵盖八个方面。这里,每个领域仅列举一个代表性问题,具体如下:1)总体方面,了解分数报告是否反映主要利益相关者的信息需求;2)报告介绍和描述方面,了解分数报告是否说明考试目的;3)考试分数和表现级别方面,了解分数报告是否详细描述了所使用的表现级别或心理状态,如合格、不合格,基础、熟练、通过等;4)考试表现指标方面,了解分数报告是否通知报告使用者分数的精确程度;5)分数报告内容的其他方面,了解分数报告是否提供电话号码、网站等联系方式以便报告使用者有问题时可以进行咨询;6)语言表述方面,了解分数报告是否去除对报告使用者来说难以理解的统计学或其他专业术语和符号;7)设计方面,了解报告是否清晰且合乎逻辑地被划分为不同部分以提高可读性;8)说明性指南和其他辅助性材料方面,了解说明性指南是否存在,能否提供清晰、有用的信息等。总之,这些指导性问题是对现有分数报告实践和研究的总结,可以为全面地评价分数报告提供支撑。从考试效度概念中对分数的解释和使用角度出发,O’Leary提出关注结果的分数报告评价方法(outcomes-focused evaluation of score reporting),该方法包含清晰度和实用性两个原则,具体分为七个要素[23]。清晰度要求分数报告能让使用者较为容易地理解,具体包含四个要素:1)设计特征,即分数报告的设计必须基于现有的最佳实践,包括当代最优秀的报告范例、行为准则以及文献建议;2)解释性指南,指分数报告必须是独立的,应将充分理解报告信息所需要的额外工作降到最少;3)呈现方式,指分数报告必须融合多种数据呈现方式;4)语言形式,分数报告的语言必须容易理解,而实用性则要求分数报告的目的、预期解释以及预期的行动与后果等三个要素必须明确。综上可知,上述三个分数报告评价体系存在一定区别,其中,Zenisky和Hambleton设计的第一个评价表,其目的在于评价分数报告研发流程,引导考试开发者对开发步骤进行自查;第二个体系关注分数报告本身,以提问的方式检查分数报告的各个组成部分;O’Leary提出的评价体系源于研究者对分数报告效度的要求,从结果使用角度出发对报告进行评估。考试开发机构可根据自身需要,选择合适的分数报告评价体系。四、国内外大型外语考试分数报告案例的分析比较推进和深化分数报告的改革和创新,应基于对现有实践的了解之上。因此,本研究以Ryan以及Zenisky和Hambleton的分数报告基本特征框架作为理论依据,选取国内外测试人数多、具有一定代表性和影响的七项语言测试的分数报告进行分析比较,结果见表4。上述七项语言测试分别为托福(TOEFLiBT)、雅思(IELTS)、剑桥高级英语证书考试(CAE)、培生学术英语考试(PTE-Academic,简称PTE)、多邻国英语考试(Duolingo English Test,简称Duolingo)、大学英语四级考试(CET-4)和汉语水平考试(HSK)。表4为七项分数报告目前包含的信息类型和信息呈现方式。由于这七项分数报告都包含基本信息(考生和考试信息),因此在表中未重复呈现。本研究关注的重点是考试的分数报告,因此在考试官网出现的其他信息未在表中呈现。由表4可知,现有大型外语考试的分数报告在内容和形式上既存在共性,也有相当大的差异。首先,考试总分是考生最关注的信息。上述七种考试的分制为9~710分不等,说明不同分数报告的评分系统差异很大。Zenisky和Hambleton认为,考试采用不同的计分方法,部分原因是考试机构希望将自己的考试分数与其他考试进行区分,以防止错误理解考试[5]590。然而,繁多且复杂的评分系统会使非测试专家,如考生、家长、教师等群体难以理解分数的真实含义。为了帮助考试使用者进一步理解分数的含义,部分考试提供分数与等级量表的对应关系。例如,IELTS和CAE在分数报告上直接体现分数与欧洲语言共同参考框架(CEFR)的比照;TOEFL和Duolingo虽然没在分数报告上直接体现,但在官网上可找到对应信息,Duolingo还提供与TOEFL和IELTS的分数比照,以帮助读者理解自身的能力水平。其次,在信息的丰富性上,虽然这几种考试对语言技能分类稍有不同,但都提供语言技能的单项分。此外,TOEFL还提供考生的历史最高分,HSK为帮助考生了解其分数在常模群体中的位置专门报告百分等级,CET-4在官网的分数解释中提供常模信息、单项分、总分的百分位表等信息。再次,在提供诊断性信息方面,PTE提供考生个人技能档案,并提供技能定义和个性化建议,以帮助考生进一步了解自己的强弱项。最后,在语言能力描述方面,Duolingo报告考生总体能力,CET-4报告口试中语言能力的三个等级,TOEFL等考试在官网上对不同技能和水平进行描述,但并未体现在具体的分数报告上。此外,上述考试多将比较详细的分数解释性指南放在官方网站上,但考生是否能快速找到这些信息,与分数报告上是否标明其位置有关,其中TOEFL、CAE、Duolingo、CET-4四类考试直接在报告上注明相关信息的位置。下面以Duolingo和PTE两个考试的分数报告为例进行分析,见图2、图3。由图2可以看到,Duolingo分数报告可分为三个区域。第一部分是考生和考试的基本信息。第二、三部分是报告的主体,分别为考生的总分和单项分。在第二部分,报告通过加大字号和橙色字体呈现报告使用者最关注的总分,同时采用要点罗列的方式简要描述考生的总体语言能力,以帮助报告使用者了解考生可以用英语完成的任务。除数字和文字呈现外,报告还用图示方式直观地展现考生分数在量尺上的位置。在第三部分,分别报告阅读和写作、阅读和听力、听力和口语以及写作与口语四个单项分数,同样用明亮的橙色字体进行标示,辅以简洁的文字描述和图形展示。值得注意的是,Duolingo报告在分数展示图中呈现考生总分和单项分的分数范围(score range),这涉及考试分数的精确度(the precision of test scores)。2014年版《教育与心理测量标准》一书中明确指出考试开发者应提供报告使用者有关分数精确度的信息[16]119,有研究认为分数精确度的信息有助于防止使用者对分数信息过度解读[7]。Duolingo以图示方式展示考生分数范围的作法,既遵循了优秀分数报告的实践标准,也对如何报告分数精确度进行了有益探索。然而,由于报告上并没有对分数范围的含义进行解释,因此使用者是否理解该部分信息仍有待研究。最后,Duolingo报告还在底部通过“了解更多”信息告知考试使用者有关测试评分详细信息的网址,并用橙色字体进行提示。Duolingo的分数报告简洁清晰、可读性强,没有过多的信息堆积,在空间组织、颜色运用和图表、文字、数字搭配上科学合理,符合有效的分数报告的基本原则,给考生提供分数范围也是一个亮点。然而,有研究发现报告使用者通常难以理解分数精确度的相关信息[7](如标准误差和置信区间等),如果能辅以适当解释可能会有更好的效果。图3为PTE的分数报告。该报告包含四个分区。第一分区是考生考号和注册信息,右侧是考生总分,并通过图形化和背景色方式突出信息重要性。第二分区是听、读、说、写四个交际技能的单项分,同样通过图形和颜色进行强调。第三分区分为两个部分,左侧用柱状图再次呈现单项技能得分和总分,更直观地展现分数间的对比;右侧呈现考生信息。第四分区位于报告底端,是考场信息。当考生在线阅读PTE报告时,还可看到包含口语和写作的开放式作答、短篇写作等八个子技能的个人技能档案,同时还有技能的概述和个性化建议。其中,个人技能档案部分用耳机、书本、对话框和钢笔等图形形象地展示了所涉及的单一或多种技能,并用柱状图展示该领域的能力水平,建议部分则采用要点罗列的文字叙述。这些针对考生个体的详细的诊断性信息可以帮助考生了解自己语言能力的强弱项和未来学习的方向,有助于考生进行有针对性的自主学习。从内容上看,PTE分数报告信息丰富,除报告考生和考试信息、总分、单项分以外,还提供详细的诊断性信息和未来建议,提升考试的促学功能;从呈现方式来看,报告有效地将数字、文字和图表结合起来,但第三分区右侧考生信息部分的排版或可进一步优化,如合并到第一分区中可能会更加清晰。总体来看,上述报告展现了一些优秀的分数报告的样式和内容,包括利用不同形式呈现信息(包括文字、数字、图表)、对重要信息进行突出强调、根据内容重要性合理分区、提供分数解释性指南等;但也存在一些问题,如部分报告缺乏个性化反馈信息、缺少其他资源的具体位置信息等。五、对我国教育考试分数报告改革的启示我国教育考试的种类多、规模大、社会影响深远,对促进教育公平和社会稳定发挥着重要作用[26]。考虑到考试分数对社会的巨大影响,考试机构应充分认识考试分数报告的重要意义,积极探索分数报告的改革。具体而言,借鉴参考国际先进经验做法,我国未来的相关研究和实践可从以下三个方面展开。第一,整体规划考试项目,从研发最初阶段即对分数报告进行全面的设计和考虑。主要有四方面需要提前重点规划:1)确定考试的性质和目的,充分考虑教师、学生、学校等相关方面的信息需求和测评素养;2)将分数解释指南等辅助性材料的研发纳入设计方案,例如,在研发和评价分数报告样例时,应运用不同的实证研究方法(如有声思维、问卷、访谈、眼动实验)调查各类报告使用者(如学生、教师、教育管理人员)对分数报告的态度、偏好、理解,并依据使用者的反馈进行相应修改;3)分数报告发放后,采用追踪研究、个案研究、民族志研究等研究方法持续调查报告使用者依据报告做出的决策和采取的行动,特别要关注分数报告对学生学习和教师教学的导向作用;4)积极借鉴国际前沿的分数报告开发框架和优秀案例,并详细记录和评价具体开发流程,收集分数报告开发的效度证据。第二,进行理论构建和创新,形成本土化的分数报告开发和评价的行为准则和指导方针。理论构建包括分数报告的基本特征、开发步骤、评价方法和效度验证等方面。行为准则和指导方针是对优秀分数报告应该遵循的原则和标准的界定,具体可参考2014年版《教育与心理测量标准》中有关分数报告的行业标准[16]119-144,以及国际测验委员会(International Test Commission)于2014年发布的分数报告质量标准的指导纲要[27]。建立本土化分数报告的行为准则和指导方针,有助于规范我国教育考试分数报告的实践,提高分数报告质量。第三,积极探索信息技术,特别是人工智能辅助下的在线互动型分数报告的设计开发和应用。在线互动型分数报告允许报告使用者选择和排序所展示的信息、探索更深层次的信息、改变信息呈现的方式,使针对性、个性化的立体多维的分数报告成为现实。然而,开发互动型报告的步骤和应遵循的原则与传统书面报告有哪些异同,在技术上如何实现突破,都值得进一步研究探索。在线互动型分数报告的研制离不开跨学科领域专家团队的通力合作,应充分挖掘认知科学、信息设计学、美学、用户界面研究等领域在分数报告设计开发中的应用和作用。对考试分数的解释始于人们阅读分数报告,因此,分数报告的设计和发放直接影响考试效果[17]。优秀的分数报告应该以考试利益相关者能理解的方式给他们提供所需要的信息,从而帮助他们采取合理的行动[2]。在深化新时代教育评价改革的背景下,国内相关领域应转变和创新分数报告的设计理念,深入挖掘考试数据以提供多维、有效的分数报告,为教学和学习提供丰富的信息反馈。通过帮助和引导大众正确理解和使用测试结果,构建和推进科学的教—学—评联动体制,从而提升教育考试的整体质量。参考文献略。

王佶旻:建设服务国家战略的教育评价学:教育评价与治理专业建设与实践探索

2024-05-20

引用格式:王佶旻. 建设服务国家战略的教育评价学: 教育评价与治理专业建设与实践探索[J]. 中国考试, 2024(5): 13-16.作 者王佶旻,北京语言大学国际学生教育政策与评价研究院院长,教授。一、教育评价学学科的源头与内涵2024年1月发布的《研究生教育学科专业简介及其学位基本要求(试行版)》(以下简称《研究生专业简介及要求》)首次将教育评价学正式列为目录内的二级学科[1],这标志着教育评价学在教育学一级学科内有了正式的学科地位和身份,学科建设自此也有了明确的目标、要求和标准。教育评价学虽然刚刚取得正式的学科身份,但并非新生事物,相似的学科或专业在心理学和教育学中早已有之。因此,在学科建设之初有必要先厘清学科体系,明确学科定位及内涵。探索分析教育评价学的源头,可以从教育评价学科的发展脉络开始梳理。《第四代评估》中提到,教育评价的发展大致经历了测量、描述、判断、建构及综合等阶段[2]。随着社会的不断进步和教育的高质量发展,教育评价的目标不断升级,从追求测量与测量结果的标准性、客观性到对事实的描述和解释,再到以多元化的价值标准评判个体发展、以评价建构认知过程和思维模型[3],教育评价的作用越来越重要。从学科发展背景来看,我国的教育评价理论研究起步较晚。自20世纪80年代以来,有关教育评价理论和方法的研究发展迅速,并逐渐呈现评价内容全面性、方法多样性、主体多元化以及日益注重评价的教育性和发展性功能等特点[4]。在此基础上,教育评价的学科内涵得以进一步厘清。《研究生专业简介及要求》中明确指出,教育评价学是一门研究教育测量与评价的理论、方法、技术、工具,为教育督导、监测、诊断、决策、改进提供科学指导的基础性、应用性和综合性学科[1]。由此可以看出,教育评价依据一定的教育价值观或教育目标,运用可操作的科学手段,通过系统地搜集信息、资料并对其进行分析和整理,以实现对教育活动、教育过程和教育结果的价值判断。教育评价的本质是一种价值判断,可操作的工具是实现价值判断的必要前提。因此,教育评价学兼具价值属性与工具属性、基础性和应用性,且具有较强的综合性,在学科建设和人才培养上也应具有高度的综合性目标。教育评价的内涵还可以从不同的范畴和视角进行阐释。从标准范畴来看,教育评价可分为相对评价、绝对评价、个体差异评价、常模参照评价及标准参照评价;从功能范畴来看,可分为诊断性评价、形成性评价、终结性评价;从对象范畴来看,可分为整体评价和单项评价、群体评价和个体评价;从过程范畴来看,可分为高等学校评价、中等学校评价、初等学校评价、职业学校评价、专业学校评价、师范学校评价、特殊教育学校评价;从主体范畴来看,可分为自我评价和他人评价;从方法范畴来看,可分为量化评价、质性评价等;从工具范畴来看,可分为经典测量理论、概化理论、项目反应理论、数据建模、德尔菲法等[5-7]。二、学科建设的理念与特色教育是一项复杂的社会系统工程。教育评价是指挥棒、风向标,也容易成为制约教育理念、教育制度、教育管理等方面长足发展的“卡脖子”难题。教育评价学科建设的理念应基于“国家需要什么、我们有什么”两个方面进行深入思考[8],北京语言大学教育评价与治理专业的建立较好地回答了这两个问题。为深入贯彻落实习近平总书记关于教育的重要论述,扭转不科学的教育评价导向,中共中央、国务院于2020年10月印发《深化新时代教育评价改革总体方案》(以下简称《总体方案》),明确提出“支持有条件的高校设立教育评价、教育测量等相关学科专业,培养教育评价专门人才”[9]。为积极响应、切实推进《总体方案》落地见效,系统化地培养教育评价领域的高素质人才,北京语言大学于2021年在教育学一级学科下自主设立教育评价与治理专业,并成为国内首个在该领域拥有硕士点的高校。教育评价与治理属于教育评价学,可谓开我国教育领域独立设置教育评价学的先河。在“国家需要什么”层面上,北京语言大学充分考虑国家教育评价体系未来发展的实际需求,找准教育评价切入点,优化教育评价理论工具,逐步推动构建了富有特色的教育评价学科体系。教育评价改革是全社会共同关心的话题,涉及社会的方方面面;因此,评价改革的主体既包括党委和各级政府,也包括学校、教师、学生及社会用人单位等组织。基于此,“教育评价与治理”学科以服务国家战略为总目标,以构建新时代教育评价理论与人才培养体系为基本目标,紧跟社会需求的“做实”理念,结合教育实践,为国家和社会培养、输送教育评价领域的专业化高素质人才。在“我们有什么”层面上,应结合高校、院系的客观实际,充分发挥自身优势办教育、建学科。北京语言大学根据自身办学基础和特点,将教育评价与治理专业定位为以教育学为核心,以心理学、语言学、计算机科学等学科为支撑的交叉学科;在发展方向上,教育评价与治理专业以教育评价为本,立足既有学科和研究基础,突出自身优势和特色。目前,北京语言大学“教育评价与治理”学科的主要研究方向有三个:一是国际学生教育评价与治理,具体内容包括国际教育评价与政策研究、国际中文教育拔尖创新人才培养研究、教育对外开放动态监测数据库建设、国际中文教育评价与治理智库建设、国际学生教育质量与评价标准研究、中文教师发展与评价研究等;二是少数民族语言教育评价,具体内容包括少数民族地区国家通用语言文字教育监测、少数民族国家通用语言文字教育评价智库建设、少数民族语言测试和标准化等;三是儿童语言发展与评价,具体内容包括特殊儿童语言发育评价、儿童语言发育异常评测、自闭症谱系语言评测、语言障碍的发病机制和干预策略、儿童语言康复、特殊儿童语言资源库建设等。教育评价与治理学科有两个突出特点。一是交叉性和融合性。与传统的教育学科不同,教育评价学将测量学、统计学、认知神经科学、管理学、计算机科学等学科有机融入教学和科研,为学科建设提供多方面支撑。在学科建设过程中,以拓展新的学科增长点、丰富学科内涵、构建良好学科生态作为衡量学科高质量发展的重要目标,以扎实的理论研究和创新实践为依托,切实使新兴交叉学科发展成为推动新文科建设的动力。二是在学科内涵与外延上体现国际化、开放性。北京语言大学是一所国际化程度很高的大学,素有“小联合国”之称,在国际化教育评价方面具有不可替代的作用,也为教育评价的国际推广创造了有利条件。因此,学科建设的关键点之一是建立教育评价国际化的交叉学科平台,结合国家教育发展需求,培养具有国际视野的教育评价与治理人才。三、学科建设的路向与发展目前,我国教育评价学的学科建设具有共性特征,其发展路向和重点是回答好“我们要做什么”的问题,目标是建立教育评价学的自主知识体系和人才培养体系,构建中国特色、世界一流的教育评价学。在建立教育评价学自主知识体系中应做好三方面工作。首先,要以我国实际情况为研究起点,提出具有主体性、原创性的理论观点,助力构建彰显中国特色、体现世界水平的学科体系、学术体系和话语体系。其次,要以“引进来,走出去”的方式深入研究国际前沿的教育评价理论,探索国际认可度高的教育评价方法和国际通行的评价体系,使其服务于我国的教育评价改革实践。最后,还应针对当前教育评价理论创新主导能力不强、实践普及和应用范围不广、专业人才匮乏等问题,建立既符合本土教育发展要求又具备较高国际认可度的教育评价体系,并对其进行创新性实践[10]。在人才培养方面,应积极探索新时代学科建设的理念及创新做法,以“德才兼备、学科交融”为导向进行课程体系构建,加深专业基础、加强学科交叉融合。在学术团队建设方面,应着眼于学科的长远发展,构建“专而特”的教师和学术研究队伍。以北京语言大学设立的教育评价与治理学科为例,学校及院系在人才培养方面积极思考、勇于探索富有特色的培养模式,逐步实施专业导师贯通制培养模式。所谓贯通制培养,是指研究生入学后不仅可以选定一位指导教师和一个专门的研究方向,还可以根据自己的研究兴趣选修其他教师的精品导师课。同时,该学科的每位导师都要推出一堂或几堂精品导师课作为公开课,这样不仅可以拓宽学生的视野和研究领域,还有助于培养一专多能的人才。目前,北京语言大学的教育评价与治理专业已经招收两届硕士研究生,这些学生的来源广泛、专业背景多样,本科修读专业涵盖了数学、管理学、教育学、文学等多个一级学科。这样的生源结构虽然符合教育评价学“专而博”的特点,但对人才培养的理念和方法也提出了更高的要求。未来,学校和院系在学科建设和研究工作中,将专注于课程体系建设、科研实践创新、一流人才培养、合作渠道拓展等四个主要任务,构建服务于新时代教育评价改革的自主学科体系,致力于培养教育评价领域的专业人才。具体措施包括以下四个方面:1)完善课程体系,打造精品课堂。在专业设立之初,学院开设40门专业课,主要包括基础课、主干课和选修课等。在专业建设过程中,学院有关部门逐渐意识到精品课程的重要性,并迅速制定精品课程计划,希望通过优秀的样板课程逐步提升教育教学质量。2)搭建研究平台,鼓励实践创新。教育评价学是一个实践性很强的专业,学生不能只局限在书本和课堂中,一定要有实习或实践经验。因而,学院与多家单位建立实习合作平台,鼓励学生走出校门,积累实战经验。3)加强师资建设,培养一流人才。与教育评价人才短缺的情况相似,教育评价学的师资也极为匮乏,因此,亟须借助教育评价学科建设之机,加强师资队伍建设,为培养一流评价人才打好基础。4)汲取先进经验,拓宽合作渠道。在学科建设过程中,学院有关部门收集了大量国内外高校和科研机构关于教育评价专业人才培养的方案、课程、实践模式、就业渠道等资料,并结合我国学科建设的实际情况汲取先进做法。未来,学校还将持续拓宽学术交流渠道和平台,与国内外知名大学、考试机构建立合作平台和联合研究中心,并尝试开展实质性合作项目。总之,教育评价学的建立和发展是时代之需、社会之需,理应在新时期为国家教育评价改革和教育强国建设提供理论、技术及人才的支撑和保障。 参考文献略。(免责声明:本文转载于《中国考试》公众号,转载旨在分享与交流,版权归属于原作者,文章观点与本栏目无关。如涉侵权,联系立删!)

余清臣:面向良好教育生态的教育评价学学科建设

2024-05-20

引用格式:余清臣. 面向良好教育生态的教育评价学学科建设[J]. 中国考试, 2024(5): 8-12.作 者余清臣,北京师范大学教育学部副部长,教授。作为热门的研究与实践领域之一,教育评价对教育根本价值的实现与教育质量的提升所具有的推动作用越来越受到重视。2024年1月,《研究生教育学科专业简介及其学位基本要求(试行版)》发布,教育评价研究迈入学科化时代,教育评价学自此将以学科的身份和组织形式开展研究探索和知识积累。在推进教育评价学的学科发展中,深化和扩展教育评价学的社会使命担当至关重要,如何从学科整体建设的角度确保教育评价为建设良好教育生态作出应有的贡献,是一个特别值得关注的问题。一、教育评价与教育生态教育作为一项重要的社会事业在每个历史时期都有着发展的使命和追求,在当前更是要以高质量发展为核心战略任务。在谋划教育高质量发展的过程中,坚持系统观念和问题导向是两个尤为重要的指导思想。在这两个指导思想的指引下,教育的高质量发展就是教育的系统发展,也是教育突破一个个重大问题以达到系统性升级的过程。要实现教育的高质量发展,首先要从系统上认识和思考教育,教育生态的理念和思想在这个方面有着丰富的研究积累。正是在促进教育整体发展和优化教育各类参与主体存在状态的目标引领下,生态系统的思想理论开始被用来解读教育问题和筹划教育发展。在这个方面的众多研究中,范国睿的相关研究具有代表性。他对教育生态系统的理解建立在这样的生态系统观之上:“生态系统是指一定地域(或空间)内生存的所有生物与环境相互作用的具有能量转换、物质循环代谢和信息传递功能的统一体。”[1]与此同时,他提出教育生态学的两个基本理念——生态系统和生态平衡。这些观点表明,教育生态的根本思想就是以生态系统的观念认识理解教育,并在此基础上推动教育发展达到生态系统意义上的动态平衡发展状态。可以说,教育生态的视角和方法对追求教育高质量发展具有重要意义,对当代教育高质量发展的追求和追问可以按照教育生态发展的逻辑进一步展开。在问题导向理念的指引下,当代教育特别要重视较为严重的教育生态问题。2018年下发的《国务院办公厅关于规范校外培训机构发展的意见》和2021年中共中央办公厅、国务院办公厅印发的《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》是应对教育生态问题的两个代表性文件:前者指出“开展以‘应试’为导向的培训,造成中小学生课外负担过重,增加了家庭经济负担,破坏了良好的教育生态”,后者提出“构建教育良好生态”的重要指导思想[2-3]。可以看出,教育生态已成为国家重大教育政策的重要主题,构建良好的教育生态已成为党和国家的一个奋斗目标。在教育生态失衡或被破坏的多方面表现中,一个比较核心的影响因素就是作为教育评价形式之一的考试。可以说,以考试为主要形式的教育评价带来学生沉重负担、教育内卷化、学校-家庭-社会教育协同失序和公众教育焦虑等不少教育生态问题。教育评价在实质上是教育质量管理的一个必要手段,其支撑的各种教育质量管理措施在根本上影响着各种教育生态主体的存在状态,扭曲的教育评价导致多种教育生态主体及其相互关系的异化。关于教育评价的定义和解释,存在很多不同界定,其中较为独特的是泰勒的教育评价观。泰勒认为,教育评价“已被看作是在教育情境中找出实际发生的事情,从而指导计划和行动的过程”[4]。同时,也有不少对教育评价内涵的概括性解读。有研究者指出:“目前在广义上使用这个概念(即教育评价)时,它包括了所有的和教育活动有直接或间接关系的实态的把握以及价值的判断。”[5]对待这样的教育评价定义分歧,一个相当可行的办法就是在结构层次上有机组合它们,由此得出对教育评价的系统解读:教育评价在主体过程上是对教育的实态把握和价值判断,此层面教育评价的结果是关于教育特定实际状态和价值的认识和判断;教育评价在功能机制上是依据某种实际发生的教育来指导教育的计划和行动,此层面教育评价的结果是基于教育实际把握的教育计划和行动指导。此外,“计划和行动指导”这个教育评价功能表述意味着,教育评价的根本功能就是促进教育计划和行动,即对教育质量进行管理提升。在这个意义上,教育评价一直坚持追求更高教育质量。事实上,教育评价的出现和发展源于对教育质量把握和提升的需求,因而也是把握和提升教育质量的教育实践活动。一般来说,教育具有选拔和培养两个方面的基础功能,无论是为选拔筛选提供依据还是为培养促进提供方向,都需要通过教育评价把握教育现实。正是在为教育质量提升提供支撑的逻辑上,教育评价直指服务于选拔筛选和培养促进,因而其从根本上会影响教育生态主体的存在状态。从根本上看,良好或平衡的教育生态应该是这样的:特定领域中多种教育主体在动态关系上相互适应和契合,多种教育生态主体在特定领域中都能从所处环境中获得生存发展所需的能量、物质和信息。从现实情况来看,教育评价时而会出现一些扭曲问题,当前最为典型的就是“五唯”教育评价。从教育评价的功能机制来说,教育评价的结果通常主要用于教育质量管理意义上的选拔筛选和培养促进,这个基本定位既适用于学生评价又适用于教师评价。“五唯”教育评价的实质是以片面维度的评价作为实施特定整体教育质量管理措施的核心依据,这实质上也是“小评价大应用”问题或片面独断型教育评价问题。在片面独断型教育评价中,各种教育生态主体因为教育评价不全面、不科学和不公平而被归入不合理的教育生态位置,逐渐割断与周围世界的合理关系。罗萨认为,加速的世界对于主体来说“已经变得沉默、冷淡、默然”,这种“自我与世界之间的沉默、冷淡、默然”就是最外显和深层的异化形式[6]。从现实表现来说,扭曲的教育评价所导致的教育生态失衡风险常常突出表现为以下三个方面。第一,扭曲的教育评价容易导致学生在教育中的异化。就较受大众关注的教育生态危机而言,仅以部分科目的考试成绩来评定和对待学生的做法,极易使学生陷入拥挤竞争地带,进而对所处教育生态环境产生沉默和冷淡。扭曲的教育评价还会导致内卷化、刷题和疯狂的校外补习等一系列教育生态失衡问题。第二,扭曲的教育评价容易导致教师在教育中的异化。与学生的情况类似,教师在日常教育工作中也是被频繁评价的对象。实际上,专业工作需要专业知识的引导和支持,而专业知识生产领域中作为学科规训方式的考试评分也必然会渗透到各种专业工作领域,这就是霍斯金所揭示的考试评分做法在现代社会中的蔓延[7]。实际上,“五唯”教育评价同样会把教师挤入拥挤竞争地带,进而导致教师对所处教育生态环境更沉默和冷淡,即教师在教育生态环境中的收缩状态。这种教育生态无法使教师在更广泛和积极的关系中得到自身发展所需要的能量、物质和信息,更无法使教师向学生或其他教育生态主体积极传递应该传递的能量、物质和信息。第三,扭曲的教育评价还容易导致学校、家庭和社会的教育异化。在理想的教育生态中,多种育人主体能够积极地围绕培养人的核心任务结成紧密的关系网络。一旦片面独断型的教育评价在教育生态中蔓延,各种教育主体也会因此把自身的活动收缩到片面独断型教育评价所定位的领域空间中:家长只关注孩子的考试成绩,教师只关注如何写论文,学校、家庭和社会也不可能围绕学生的全面发展结成丰富的教育生态关系。在这种相互割裂或断链的状态下,教育生态对多个育人主体不再富有营养,教育生态的平衡发展更是无从谈起。二、建设面向良好教育生态的教育评价学学科的根本含义是被学术主流承认的组织结构性知识分化,教育评价学的学科建设在不断巩固发展对应知识板块的同时,要从根本上追求更大范围和更高层次的承认。在衡量一个研究领域是否够得上学科水平的问题上,不少人提出专门研究队伍、专门研究方法、专门学科组织、专业学术出版物等方面标准的要求,但这些硬性标准与不少学科的发展状况也常有或多或少的出入。因此,在关于学科性和学科内涵的探索上,有观点认为:“学科的概念并不是完全直接明了的……这取决于起主导作用的学术机构在多大程度上承认它们以组织结构形式进行的分化,也取决于国际学术共同体的独立程度,如是否有自己的专业协会和专业期刊。”[8]在这种学科观中,学科发展要特别关注学术主流承认、组织结构性知识分化和学术共同体独立性等特征,其中最重要的是学术主流承认。无疑,一个研究领域得到学术主流承认,并不只是因为其研究成果或知识品质,一定还包括是否分担了知识界应该担当的社会责任与使命。就教育评价学所属的教育学科来看,要担当的社会责任与使命在最为直接的意义上就是为持续推动教育改革发展作出贡献,即为高质量发展的教育负责。只有教育评价学独立自主地分担高质量教育发展的相应责任与使命,才可能让自身的研究成果和学术共同体得到更高水平的学术主流承认。实际上,教育评价的伦理问题已经引起不少关注,这既源于教育评价本身具有的社会实践性,又源于教育评价之于教育实践发展的重大意义和风险。有研究指出:“教育评价备受重视,但教育评价伦理准则尚未系统地建立起来,这就导致教育评价问题严重,而且致使教育评价成为我国教育改革与发展的桎梏。”[9]在教育评价发展较快的发达国家,教育评价的伦理问题也逐渐成为教育评价研究的一个重要领域。有研究指出,美国在20世纪80年代以后就开始对教育评价伦理问题进行研究[10]。已有教育评价伦理研究所提出的具体教育评价伦理准则存在视角和侧重点上的不同,但均体现出教育评价要为教育发展和教育中的人负责的明确意识。教育评价学的学科化发展要为教育生态负责,要面向良好教育生态,这是教育评价学更能得到学术主流承认的一个重要基础。一方面,既往教育评价实践凸显了其对教育生态状况的积极或消极影响;另一方面,教育评价在功能逻辑上要支撑人才选拔筛选、对学习的促进和对人的培养,而这必然会改变教育生态主体的位置与境遇。基于教育评价与教育生态之间的密切关系,教育评价学的学科化建设要特别注重从学科使命、研究主题、研究过程和研究成果四方面加强教育生态意识,以提升教育评价学对良好教育生态建设的贡献度。第一,教育评价学要明确学科发展的教育生态使命。在学科化发展的进程中,教育评价研究要实现更高水平的组织结构性。为此,要把教育评价学学科发展的根本使命和行动战略变为所有学科建设者都要遵守的规范,以此保障教育评价学的长久发展。换言之,从根本上讲,要建设保障教育评价学科化发展的学科规范,即人们常说的学科规训制度,而为教育生态负责就是教育评价学学科规范的一个重要组成部分。学科规范就是一个学科事实上承认和遵守的章程,主要用以明确本学科的性质、使命、原则、领域设置、组织机制等内容。为教育生态负责,意味着教育评价学的学科规范在使命、原则甚至领域设置中要体现教育生态使命。学科规范可以在很多方面发挥作用,其中最为重要的就是,它是学科内最通行和最重要的考核和评价标准。为教育生态负责的使命,最终要渗透到教育评价学学科内部考核和评价的广泛标准中。第二,教育评价学要强调研究主题的教育生态审视。具有教育生态关照意识的研究选题是教育评价学担当教育生态使命的一个必然要求,这就需要对教育评价学研究主题选定进行引导和规范。一个学科的发展离不开重要研究主题的选择,而依据什么标准来选择重要的研究主题就成为需要进一步探讨的问题。从当今流行的教育研究思路来看,问题导向是比较主流的共识和方向,即教育研究应注重紧扣时代脉搏、聚焦中国问题和突出问题导向[11]。无疑,从问题出发确定研究主题,突出问题导向,也是教育评价研究的主流趋势。在一些专门研究中,问题常常被界定为期待的状况与现状之间的落差[12]。基于这个定义,教育评价学要在研究主题上找到有价值的问题,就是要从教育评价相关的现状及其相应的理想之间确定落差。遵循这个逻辑,教育评价学要面向良好教育生态,为教育生态负责,就需要做到如下三点:首先,要关注与教育评价密切相关的教育生态失衡现状,从中分析教育评价现状;其次,要确定与教育生态失衡现状相对应的教育生态理想,从中分析教育评价理想;最后,对比教育生态及相关教育评价的现状与理想,找出教育评价在理想与现状之间的落差。总体上说,教育评价学的学科发展强调在对教育生态审视中发现教育评价问题,以此作为教育评价学的重要研究主题。第三,教育评价学要加强研究过程的教育生态思维。在不当教育评价可能导致教育生态风险的逻辑中,非常关键的环节主要有以片面维度的指标作为对评价对象进行整体判断的核心依据,基于这种片面独断的评价结果进行选拔筛选或培养促进。为了避免教育评价导致教育生态风险,教育评价学在发展中要特别强调研究过程中的教育生态思维渗透。这实际上包括两个方面:一方面,教育评价学在评价方法研发研究中要特别强调全面意识、科学意识和公平意识,要精准把握评价指标对评价对象的指示性范围和程度,不让片面的评价指标直接等同于对象整体;另一方面,教育评价学在评价功能研究中要特别强调对教育生态主体进行必要的保护和尊重,在根据教育评价结论进行的选拔筛选和培养促进策略设计中要贯彻生态平衡思维,避免在教育评价结论的功能实现中让相关教育生态主体的存在发生异化和扭曲。第四,教育评价学还要系统提升研究成果的教育生态价值。教育评价学要面向良好教育生态和为教育生态负责,除了做好学科规范、研究主题选择和研究过程中的思维渗透外,还要有一个重要的努力方向,这就是建立教育评价生态学的专门研究范畴。从非学科化发展到学科化发展阶段,必然要求学术研究活动的组织结构化,而组织结构化的学术研究在整体目标上就是建设内在契合、衔接紧密和覆盖全面的学科研究体系。对教育评价学来说,坚守教育生态使命、强调教育生态审视、加强教育生态思维渗透等均能提升相关研究的教育生态价值。但是,这里面还有一个缺失,即教育评价学如何在整体和系统层面持续为教育生态发展负责。为弥补这个缺失,教育评价学应从学科范畴上作出筹划和努力,具体就是要通过不断积累和积极筹划在教育评价学的学科中发展出教育评价生态学的新研究范畴或学科分支。可以期待,教育评价生态学以教育评价的教育生态使命、原则以及相关的重要主题为主体内容,在综述已有相关教育评价研究的基础上推进对教育评价生态问题的系统思考与持续探索。 参考文献略。(免责声明:本文转载于《中国考试》公众号,转载旨在分享与交流,版权归属于原作者,文章观点与本栏目无关。如涉侵权,联系立删!)