教育科学研究
EDUCATIONAL SCIENTIFIC RESEARCHS
王娟 胡钦晓:美国教师增值评价的实践经验及启示

2024-03-07

原创 王娟 胡钦晓 中国考试 2024-03-07 16:44 北京引用格式:王娟, 胡钦晓. 美国教师增值评价的实践经验及启示[J]. 中国考试, 2024(2): 83-91.作 者:王娟,曲阜师范大学教育学院在读博士,聊城大学历史文化与旅游学院副教授。胡钦晓,曲阜师范大学副校长,教育学院教授。摘 要:教师增值评价是21世纪以来各国教育界广受关注的热点话题。美国教师增值评价的兴起和发展是政府、社会、学校和技术等多方面因素共同作用的结果。教师增值评价具有评价理念的先进性、评价过程的公平性、评价内容的独特性、评价方法的复杂性四个显著特征,可以发挥教育质量的诊断器、专业发展的增值泵、良好教学的指挥棒、教育决策的调控器等多重功能。然而,美国教师增值评价在有效性、透明性和应用范围等方面也存在争议,甚至面临伦理问题及法律风险。美国教师增值评价的实践经验,对我国教育评价改革具有一定启示意义。建设多元主体参与、多元评价方式融合的一体化教师评价体系,是我国教师评价改革的可行之路。关键词:教师评价;增值评价;教育评价改革;评价模型增值评价是一种以增值模型(value-added model,VAM)和统计方法为工具,对学生成长进步或教师发展程度进行测量的教育评价方式。作为诸多欧美国家开展基础教育评价的共同策略[1],增值评价实现了对传统评价模式的颠覆。美国是增值评价改革的先行者和引领者,其教师增值评价在教育评价体系中颇具特色。通过追踪教师所教学生某个阶段内的学业变化情况,教师增值评价运用增值模型测算教师对学生学业成绩的净效应,实现了对教师效能的评定,在提高教师教学质量、促进学生个人成长方面具有重要价值和意义。在我国深化教育评价改革的大背景下,本文从美国教师增值评价的发展动因切入,深入探讨其主要特征和基本功能,分析其对我国教师评价的启示,以期把握当代教师增值评价改革方向,为我国教育评价改革提供借鉴。一、美国教师增值评价的发展动因20世纪80年代以来,在国家竞争力战略和新自由主义思潮驱动下,美国教育政策的重心从教育投入转向教育产出。一方面,教师教学效能得到学校、政府和社会的广泛关注,以学生成绩增长衡量教师工作有效性的问责要求愈发强烈。各州普遍建立了学校问责系统和标准本位的绩效责任体系,将教师工资与其绩效表现挂钩。另一方面,教师专业化成为学校和教师关注的核心。教师评价是教师专业化发展的“发动机”,然而传统教师评价因主观性较强、区分度较差,并未起到推动教师发展的作用。传统教师评价主要依赖行政人员通过课堂观察产生的主观评分,评价结果仅有“满意”和“不满意”两种类型,几乎所有教师都获得了“满意”评级,教师的教学效能无法得到有效甄别[2]。就学生评价而言,当时美国大多数州的评价体系既不能解释学生群体学业成绩的变化,也不能衡量学生个体的学习发展情况[3]。因此,传统评价模式逐渐成为教师专业化发展的藩篱。为改革教师评估体系,美国田纳西州政府于1992年颁布《教育改进法案》(Education Improvement Act,EIA),将统计学家William Sanders提出的增值评价方法纳入法案,以学生成绩变化作为评价教师绩效的标准。田纳西州增值评价系统(Tennessee Value-Added Assessment System,TVAAS)成为美国教师增值评价的滥觞,之后其他各州纷纷效仿。2002年,美国联邦政府出台《不让一个孩子掉队》(No Child Left Behind Act,NCLB)教育改革法案,开启了一场基于考试评估结果的问责运动。研究发现,教师之间的教学有效性存在巨大差异,增值评价可以将学生成长发展中的教师、学校因素与家庭背景等非教育因素区分开来[4]。田纳西州教师增值评价的优势与问责运动的要求颇为契合,得到联邦和州层面的支持和推广,北卡罗来纳州、路易斯安那州、加利福尼亚州、俄亥俄州等在不同程度上采用了该州教师增值评价方式。此后,联邦政府继续深化评价改革,完善政策,增加资金投入。2006年,联邦政府设立了教师激励基金(Teacher Incentive Fund,TIF),对各州基础教育改革提供40亿美元资助;2009年,又启动了“力争上游计划”(Race to the Top,RTTT),要求各州根据学生进步程度评价和奖励教师,明确规定对学生成长的测量应在教师评价中占比40%,而其中25%必须来自增值评价[5]。各州积极响应政府政策,88%的州采纳或实施了教师增值评价[6]。教师增值评价在全国范围得到应用,成为各州教师评估系统的重要组成部分。值得一提的是,庞大的数据系统和高级统计分析技术,是开展教师增值评价的基础。2001年,全美教育峰会要求各州积极收集学生数据,以考试数据驱动教学改进,准确跟踪学生在不同年级阶段的进步程度[7]。联邦政府也投入大量财政资源,支持全州纵向数据系统(State Longitudinal Data System,SLDS)的开发。2005年,美国数据质量运动(Data Quality Campaign,DQC)更是掀起了全国性教育数据库建设的热潮。根据2011年DQC的报告,美国各个州都建立了可靠的纵向数据[8]。20世纪末期,加权数据处理、多重推断、缺失数据处理等数据统计分析技术迅猛发展,建立在复杂统计分析技术基础上的增值模型得以持续优化。二、美国教师增值评价的典型特征尽管美国州际、州内所使用的增值评价模型及方法各异,在教师总体评价中所占权重也有所不同[9],但仍然表现出诸多共性特征。(一)评价理念的先进性增值意即价值的增长,增值评价则是对价值增量的评判。教师增值评价的首要特征是以动态方式监测学生学业数据,客观考查学生成绩增值情况,将学生增值程度作为教师评价的核心。在评价过程中,教师增值评价将衡量重点从“学生现在如何”的绝对成绩转移到“学生进步如何”的相对成绩,实现了从静态取向的定点成绩到动态取向的成绩增长的转变,打破了以单次考试成绩评估学生学业进展和教师教学水平的传统评价模式。田纳西州正是凭借其完善的增值评估模式,在2015年被评为全美学生学业成就进步最快的州,该州学生无论在天赋和起点上存在多大差异,在学业方面均取得了显著进步[10]。教师增值评价通过利用学生学业数据信息,科学衡量学生学业增长,达到了提升学生知识技能、促进教师发展的目的。相对于以往根据标准化考试成绩和单一化课堂观察对教育质量的评价,教师增值评价更为科学有效。(二)评价过程的公平性教师增值评价是对教师个体的深度关注,但在具体实践过程中,学生成为评价的载体和依据。教师的最终任务是引导来自不同地域及社会经济背景的学生在自身能力基础上取得最大进步。教师增值评价既重视学生学习过程,肯定学生付出的努力,又鼓励学生不断超越自我,推进学生增值发展。区别于传统评价对学生个体初始差异的忽视,增值评价促使教师关照学生的复杂性和特殊性,推动每个学生均能在各自起点上得到适宜发展。在美国,移民学生数量占比较大,学生背景差异明显。增值评价通过增值模型控制变量,一定程度上消除了种族、贫富差距或社会经济地位等非教师因素对学生的影响,是一种相对公平的评价方式。在增值理念引导下,教师将以往对成绩优异学生的关注及期待迁移至全部学生,进而形成改善教育的巨大潜力。成绩增值的衡量标准对于优势地位学生和弱势地位学生同等适用。由此,教师增值评价创造了相对公平的竞争环境,营造了“人人皆可进步”的良好氛围。(三)评价内容的独特性在教师增值评价中,“增值”被解释为教师某时间段内对学生影响的“净效应”,并进而成为社会和学校对教师问责的证据。教师增值评价不仅衡量学生随着时间推移而产生的学习增长,还评估教师对这种增长的因果效应,强调教师对学生成长的独特贡献。这种评价方式基于三个核心假设:一是教师对学生进步程度的影响可以从其他影响学生的外部因素中剥离出来;二是通过控制相关变量可以客观计算教师对学生进步的“净效应”;三是教师与学生成绩增值之间呈因果性关系,而非相关性关系。事实上,教师效能早在20世纪90年代就已得到证明。1997年,Sanders等人研究发现,教师之间的教学效能存在显著差异,而教学效能是影响学生学业成绩的最大因素[11]。教师增值评价将教师的影响与家庭背景等非教师因素区分开来,在学生学业成绩与教师教学效能之间建立联动关系,彰显了教师对学生个体成长发展的持续性、独特性影响。(四)评价方法的复杂性教师增值评价相对于传统教师评价,在算法实施运用和底层方法技术上表现出极大的艰深性和复杂性。增值模型作为增值评价最重要的技术工具和测算方法,能够排除无关因素或控制外部变量,从统计学意义上描述并分析教师对学生学习进步程度的贡献度。增值模型的基本形式是通过特定周期内的学生考试分数,精准计算学生的成绩变化;较复杂的形式则是结合统计技术解释学生特征的差异以及之前教师和学校的持续影响等因素。增值模型类型繁多,包括线性回归模型、固定效应模型、方差成分模型、多级响应模型、交叉分类模型等,且模型之间可相互组合优化。不同的增值模型体现的是对教师教学效能不同维度的关注。田纳西州的增值评价系统作为被广泛认可的增值系统之一,运用的是混合模型方程,使用来自多元纵向数据集的协方差矩阵来评估教育系统对学生进步的影响[12]。在具体应用中,为了保证评价结果的科学性,任何一个增值模型都要经过复杂和严格的统计假设,并进行经常性的测试和监控。评价模型和方法的复杂性使增值模型的作用机理难以被人理解,很大程度上限制了评估数据的使用,削弱了增值评价结果的可推广性。三、美国教师增值评价的基本功能教师增值评价基于其统计模型的科学性和专业性,不易受人为主观因素影响,相对而言比较客观、公正,对中小学教育质量的提升、教师专业发展等具有诊断、改进、导向、决策等多重功能。(一)教育质量的诊断器诊断反馈是评价最基础的功能。美国教师增值评价既服务于教师教学效果的诊断,又运用于对学生学业成果的反馈,还适用于政府和公众对教育质量的问责。对教师自身而言,增值评价基于其纵向追踪数据库的设计,通过翔实的数据描述和分析,一方面能够使教师有效识别学生表现状态,观察学生成绩增长情况;另一方面,赋能教师利用详细的增值评价数据,分析自身教学的优势和不足。简言之,教师增值评价既是教师因材施教的起点,也是教师教学改进的基点。对政府和公众等外部问责群体而言,教师增值评价发挥着诊断教育质量的作用,是对教师效能进行衡量的重要指标。值得注意的是,通过增值模型所产生的丰富数据,仅仅是提供了数据利用的潜在可能性,只有教师及时、准确、高效地将评价数据应用于教学,才能发挥增值评价的实际效用。(二)师生发展的增值泵评价的最终目的不是诊断和证明,而是改进和发展。教师增值评价的内在价值是为教师提供教学和学习信息,进而促进教师自身专业发展。美国大多数州和地区教师评价改革的中心目标是支持教师改善教学,帮助所有教师提高教学水平;美国有83%的州明确将教师评价与专业发展要求联系起来[13]。增值评估凭借丰富的数据系统,不仅有助于教师主动改进教学,服务学生成长进步,而且能够促进教师自身的专业发展,支持教师的专业成长。一方面,在确保增值评价科学性、有效性和实用性的前提下,教师能够最大限度访问学生关键数据,加强对学生特征、学习需求的深入研究,开展数据驱动的个性化教学,确保所有学生皆能取得发展。田纳西州TVAAS提供的数据便是教师努力改善学生学习的核心资源[14]。依托丰富的学生增值数据,教师得以合理分配教学资源,并采取适切的教学策略。学生在教师指导下,也可以利用评估数据促进学业改进,实现个人学业成就的增值。另一方面,教师的专业发展不再单纯依托固化的教师培训内容和形式,而是转向基于增值评估结果的个性化辅导。增值评价为每位教师提供了更加全面细致的评价,不仅使教师的改进更加有针对性,而且使教师的教学效能得到逐步增强,教学技能和人格特征亦获得差异化发展。(三)良好教学的指挥棒教师评价是教师开展教学工作的指挥棒。教师增值评价在师生发展方面具有鲜明的导向和激励作用。在美国,教师增值评价的直接应用是以评价结果衡定教师绩效,进行教师薪酬分配。这种将薪酬与增值结果挂钩的政策,不仅有助于激发高素质人才的从教动机,吸引他们进入教师行业,也有助于激励在职教师改善教学实践,为学生的成长进步付出努力。有研究指出,教师与其他高增值教师交流或取得基于增值评价的报酬时,其增值成就往往会提高[15]。也有研究强调,相对于未接受增值评价的同龄教师,接受增值评价的教师表现更加出色[16]。这从一个侧面凸显了教师增值评价对教师导向和激励作用的影响力。增值评价将评估教师工作的重心指向学生成就的增值,鼓励教师关注学生学业增值背后隐含的学生努力程度,深入挖掘学生成长进步的诸多影响因素,对教师改进教学起到了指挥引领作用。此外,增值评价数据还具有丰富的预测潜能。即使是对教师一年内所教学生的学习情况进行简单增值评估,也可用以预测这些学生未来数年的学习表现[16]。教师凭借丰富的教学经验,合理利用增值评价数据,能够为每个学生的学业成长提供详细可靠的前瞻性预测,更科学地指导并引领学生终身发展。(四)教育决策的调控器教师增值评价的决策辅助功能体现在教师人事管理决策方面,如教师薪酬管理、教师晋升与解聘等。2009年,《美国复苏和再投资法案》(The American Recovery and Reinvestment Act,ARRA)提出,全力推动各州将基于教师表现的决策与学生表现情况联系起来,严格要求教师评价与教师薪酬、人力资本决策挂钩。由此,教师增值评价成为美国各地中小学教师职业生涯决策和薪酬分配的重要依据。首先赢得ARRA拨款竞赛的14个州,一致承诺使用学生成绩增值数据作为教师评估的重要组成部分,并使用评估数据进行人事决策[2]。美国多数州将教师增值结果设为教师人事决策的依据。教师增值评价还具有教学决策功能。教师通过多维度、全方位挖掘并整合增值评价数据,可以准确判断并分析学生成长进步的关键节点,采取与学生身心特征、学校教育政策相契合的教学策略。2019年,依托学生增值数据,美国86%的教师形成了教学计划,88%的教师为学生确定了学习目标[17]。教师以宏大的视野统筹利用评价数据,增值评价由此成为教师开展个性化教学的重要决策支撑。四、美国教师增值评价面临的问题与挑战美国教师增值评价以教师推动学生成长进步的幅度作为评价标准,使得教师教育质量的评估相对科学和客观。研究表明,与其他衡量标准(如教师经验、资格认证、任教资历和校长评级)相比,增值评价是更为有效的工具[18]。但是,世界上从来不存在任何完美无缺的单一评价方式,教师增值评价自产生以来也面临诸多挑战。首先,评价的有效性受到质疑。一方面,教师增值评价模型和分析方法必须依赖连续性的学生成绩跟踪数据,而美国学生流动性较强,加之学生缺勤、豁免考试等原因,学生数据不可避免包含不完整的成绩记录,数据缺失使评价结果的有效性大打折扣。另一方面,教师增值评价假定学生成绩仅受教师的影响,这种假设其实很难成立。事实上,教学活动类型、学生个性特征、家庭经济地位等非教师因素均会影响学生成绩,教师并非影响学生的唯一因素,教师增值评价的有效性也因此受到质疑。其次,评价的透明性面临非议。一方面,增值模型的开发人员从保护其商业秘密的角度,不愿提供增值模型的详细信息[19]。另一方面,增值模型方法艰深复杂,绝大多数教师缺乏相关的统计学和数据分析技能,难以理解增值模型。有些学区并不具备实施增值评价的专业知识,在政府和社会的问责压力下开展增值评价时必须聘请技术熟练的专家,或者将任务外包给专业咨询公司。增值模型的可理解性与可操作性较差,导致美国教师增值评价的主动权牢牢把控在具有强大专业能力的社会评价组织手中。再次,评价的应用范围有限。教学是一门极其复杂的综合性艺术,教师效能相应地具有多元特征,这就决定了学校不能像企业一样,仅通过计算“净效应”的方式评价教师。对教师教学有效性的评估,仅限于学生在标准化考试中客观外显的增值表现,显然是窄化了教师效能的内涵和价值。另外,美国中小学教师增值评价通常是基于各州数学、科学、语文等主要科目的标准化考试成绩,以增值分数代替教学质量的评价使学校教育质量简单化为学业质量,甚至被直接限定在学业成绩的范围内[20],教师教学逐渐功利化,教师对学生道德、审美和情感等方面发展的潜在贡献无法得到有效衡量。最后,评价存在法律和伦理风险。在技术向度增强、管理主义思维凸显的背景下,美国教师增值评估的结果被用于指导教师薪酬决策,成为一种高风险评估,致使教师面临着不同程度的伦理风险。教师个人数据被社会公开发布,洛杉矶、华盛顿、纽约等地主要新闻媒体均曾恶意公布教师增值分数[3],教师逐渐沦为政府和公众严密盘查和议论的对象,教师的终身教职被严苛限制、教职被无情解雇等不良现象时有发生,教师的隐私权和工作保障均受到严重侵蚀。功利主义的绩效观引发了许多法律问题,美国各地教师为阻止教育行政管理人员对增值结果的惩罚性使用,都在寻求司法途径。2011年至2015年,教师作为原告在联邦和州法院至少提起了15起诉讼[21]。教师增值评价看似是一种准确衡量教师贡献的评价方式,但远未达到对教师工作效率进行科学衡量的目的。2015年,奥巴马签署《让每个学生成功法案》(Every Student Succeeds Act,ESSA),赋予各州利用自主权修改教师评估系统的权力,州和地方学区由此获得了更多的教育自由裁量权。在理性审视和反思中,各州调整了增值评价的使用范围和权重,教师增值评价原有的“黄金标准”地位由此开始动摇。据2018年一项调查,在美国所有州和特区中,22个州明确表示不使用或不鼓励使用教师增值评价[22]。到2019年,11个州以学生学习目标(Student Learning Objectives, SLOs)取代了学生成长的客观指标,或完全放弃了基于测试的成绩指标[23]。可以看出,2015年以后教师增值评价在美国各地呈现明显收缩态势。五、美国教师增值评价对我国的启示教师评价不仅是国际教育改革的热点与重点,也是我国教育评价改革与发展的核心议题。2020年,《深化新时代教育评价改革总体方案》明确提出改进结果评价、强化过程评价、探索增值评价、健全综合评价[24],为我国深化教育评价改革指明了方向。“增值评价”一词前冠以“探索”二字,体现了我国增值评价的发展仍处于探索时期,尚未形成系统的理论和实践体系。美国教师增值评价的改革实践,对我国教师增值评价的未来发展有以下三点启示。(一)深化增值理念,凝聚评价共识评价是以人的需要为尺度的价值判断。深度理解并认同增值评价理念是有效开展教师增值评价的关键。在美国,作为评价关键要素的教师并未深度参与其中,丧失了评价的话语权和自主性,专业评价组织却因其技术优势“独享”了增值评价的主导权。为充分利用增值评价数据,发挥增值评价的持续改进作用,需要多方评价主体在融合不同价值取向和利益诉求的基础上,增进对于增值理念的理解与认同。第一,发挥政府领导效能。我国政府部门应通过相关法律或政策有效推进增值评价改革,以清晰具体的政策指向,赋予教师增值评价足够的权威性与公信力。第二,发挥第三方社会评价组织的专业作用。在当今大数据、云计算、区块链等新兴信息技术加持下,我国第三方评价组织可以充分利用信息科技,寻求增值评价技术和方法的突破,研发中国本土化的增值模型。在此基础上,与政策制定者、学校管理者、教师等群体展开对话,详细描述、说明和解释统计模型,提高教师对增值的理解度和接受度[25],对中小学教师和管理人员进行技术指导,不断弥合增值评价理论和实践应用脱节的鸿沟。第三,发挥中小学校和教师的主体作用。中小学管理者应挖掘教师的内部动机,提升教师实践增值评价的主观能动性。一言以蔽之,深化多元主体的增值理念,强化对增值评价的价值认同,将各方共同利益统摄到为学校教育目标服务上来,才能逐步生成切实有效的教师增值机制。(二)融合评价方法,拓展评价场域任何一种评价方法都不应成为教师评价的唯一依据。正如美国教育研究协会(American Educational Research Association,AERA)提出的建议,增值评价永远不能在教育工作者或项目评估系统中单独使用[26]。教师评估系统的理想模式是教师日常观察、形成性反馈体系、学生学习多种证据等多元评价方式的有机组合和交汇融通。在我国教育评价改革进程中,必须理性认识教师增值评价的优势和短板,肯定教师增值评价的统计技术优势和数据循证价值,弥合单一增值评价的可能缺陷和潜在隐患,真正提高教师评价的信度和效度。近几年,美国田纳西州便呈现出档案袋评价、课堂观察评价和学生分数增值构成的多元评价格局[27]。基于我国教育评价的文化背景和现实土壤,我们理应面向国际前沿,建构中国特色的多元教师评价体系,避免依赖单一的增值评价方式。在实施增值评价时,突破常规科目测试的局限,纳入技能、能力和情感等广泛的非认知因素指标,依托多元证据,对教师的实际贡献开展增值评价,发挥增值评价的独特优势。如此,既保证教师获得有价值的专业学习经验,也使学生多元发展得到较好保障。(三)优化评价制度,规避伦理风险当前我国教育正处于高质量发展进程中,通过教师增值评价激励教师和学校发展是教师评价的发展方向。我们应仔细审视美国教师增值评价出现的纷争,规避增值评价存在的缺陷和隐患,预防可能出现的伦理风险,致力建设一个真正提升教师质量的教育评价体系。首先,学校和整个教育系统必须超越现状,健全增值评价的配套制度体系。正如宾夕法尼亚大学公共政策学者Hershberg所言,增值评估需要与之互补的政策才能有效提高学业成绩[28]。其次,在政策和法律实施层面开展强有力的治理,为评价数据的合法使用提供保护。同时,在道德和伦理层面,营造恪守评价伦理规范的社会氛围,尊重教师的隐私权和申诉权等正当权利,有效规避评价数据应用的伦理风险。最后,政府和教育管理者应弱化增值评价带来的问责和惩罚功能,淡化绩效主义取向,回归激励教师专业发展的本体功能,将教师增值评价的功能重心回归到为教师提供更个性化的专业学习和更准确的教学反馈上,重塑教师信任文化,建设以人为本、富有生机的教师评价系统。六、结束语相对于传统评价模式,增值评价拥有更多促进师生双方成长和发展的优势,有力彰显了发展性、公平性的评价理念,深刻体现了教育即生长的哲学论断,成为美国教师评价发展中的重要里程碑。在学习和借鉴美国教师增值评价实践经验的基础上,我们也要清醒认识到,增值评价结果突出管理功能和绩效导向,服务高利害决策,存在较高风险[29],教师的教学效能和内在价值被冰冷的数字所异化,凸显了技术至上的工具理性取向,一定程度上形成对人的发展价值向度的遮蔽。概而言之,教师增值评价并非是一种尽善尽美的评价模式,也不是教师问责的灵丹妙药。面向未来,我们应更加关注增值评价的诊断和改进功能,推动我国教师评价向综合评价体系转型。唯此,方能真正实现教师增值评价促进师生协同增值的理想。参考文献

杜玲玲:基于中学物理竞赛的拔尖创新人才选拔机制研究

2024-03-05

原创 杜玲玲 中国考试 2024-01-26 16:17 北京原文刊载于《中国考试》2024年第1期第45—52页。作 者:杜玲玲,北京教育科学研究院副研究员。摘 要:我国的中学学科竞赛活动,是引导和培养具备科学家潜质的青少年群体的重要途径。40年来,中学物理竞赛促进了一大批学生科学素养的提升,促进了中学物理师资队伍建设和教育教学改进,也取得了优异的国际奥赛成绩,有利于拔尖创新人才选拔和培养。但在实践中也存在功利性强、竞赛教练资源缺乏、竞赛发展水平区域差异巨大、奥赛成绩辉煌但拔尖创新人才仍显不足等问题。为提升我国拔尖创新人才自主培养能力,促进高质量教育体系建设,应将物理竞赛对拔尖创新人才的选拔与激发学生学习兴趣相结合,保持选拔工具的科学性和有效性,重视拔尖创新人才的非认知能力培养,发挥竞赛对常规教学的促进作用,完善竞赛的体制机制建设。关键词:拔尖创新人才;选拔机制;物理竞赛;教育评价改革党的二十大报告提出加快建设高质量教育体系。全面提高人才自主培养质量,着力造就拔尖创新人才,成为新时期教育改革与发展的重点[1]。2009年国家首次推出“基础学科拔尖学生培养计划”,2018年教育部等6部门进一步实施基础学科拔尖学生培养计划2.0[2],其中数学、物理等基础学科受到广泛关注。拔尖创新人才通常是指具有创新意识、创新精神、创新思维和创新能力,并能在研究工作中取得创新成果的人才,本文中特指具有扎实理论基础和知识储备、强烈的社会责任感、创新精神和创新能力并存、具备科研潜质的中学生。研究发现,科学、技术、工程、数学领域的竞赛在影响学生日后的职业选择方面效果尤为显著,竞赛的成功参与者比同龄人更有可能从事相关学科的研究,并取得高于平均水平的成就,学科竞赛被视为学校教育之外,培养学生创新动机和提高创新技能的一种有力措施[3]。参加竞赛的高中生科学素养水平较未参加的学生提升更高[4]。学科竞赛对推进教学内容及课程体系改革、改善办学水平、培养学生创新能力和综合素质也有重要的促进作用[5]。在我国,基础教育阶段开展的学科竞赛活动历经多年发展,被视为引导和培养具备科学家潜质的青少年群体的重要途径之一。本文以参赛学生规模较大、发展较为充分的全国中学生物理学科竞赛为例,结合文献研究和重点调研、访谈,研究竞赛模式对于拔尖创新人才的选拔和培养作用、成效与问题并提出政策建议,探索加快建立健全拔尖创新人才培养体系的中国经验和模式。一、我国中学生物理竞赛的学生选拔及培养现状(一)中学生物理竞赛选拔机制全国中学生物理竞赛(中国物理奥林匹克,CPhO)自1984年首次举办至今,已有40年历史,和数学竞赛一起成为国内最受中学生欢迎、规模最大的学科类竞赛赛事[6]。以2021年为例,有来自5000多所中学的近90万名学生参加全国中学生物理竞赛。经过预赛、复赛,每年参加决赛的学生人数从1984年首届的76人增加到2021年的480人。决赛中的前50名选手入选国家集训队,集训队再选拔5名学生,于次年7月代表中国参加国际物理奥林匹克竞赛(International Physics Olympiad,缩写为IPhO),另外选出8名学生参加亚洲物理奥林匹克竞赛。其中,IPhO是最负盛名的国际中学生物理竞赛,主要目的是测试最高水平的知识、批判性思维、问题解决能力、演示和分析实践以及理论和实验物理等实际操作技能[7]。竞赛集训队成员,特别是获奖选手,成为各高水平大学争相录取的对象[6]。(二)物理竞赛的试题特点中学物理竞赛对学生的学科核心素养提出了更高要求,但没有脱离基础教育培养目标,仍然注重考查学生的基础知识、基本技能,激发高中学生热爱物理、钻研物理,持续提升分析问题和解决问题的能力,并帮助他们改进学习方法,学会学习、学会思考。通过综合梳理对竞赛试题的研究发现,我国物理竞赛试题特点包括以下7个方面。一是理论试题信息含量丰富[8]。近年来物理竞赛关注科技前沿成果,注重调动学生用物理知识解决实际问题,试题情境包含大量信息,要求学生不仅具备良好的阅读能力,也要具备良好的信息提取能力,从实际问题情境中看到事物的本质,提取关键且必要的信息,并建立恰当的模型,进行分析。二是力学和电磁学成为竞赛内容的重点和难点。力学和电磁学是高中阶段物理学习的主要内容,因此CPhO近5年预赛卷中高考考点比例平均为71%,2020年甚至达到87.5%,其中力学和电磁学模块占比超过总分的2/3,光学、热学、近代物理部分一共占1/3[9-10]。复赛、决赛的知识深度和广度都高于高考,对知识点之间的相互联系和结构的考查也比较综合。复赛中综合性试题平均占比在30%左右,几乎都是与力学知识点的结合[11]。决赛中综合性试题平均占比在60%左右,对参赛学生提出了更高要求[12]。三是注重考查学生的科学素养。物理核心素养包括物理观念、科学思维、科学探究、科学态度与责任4个方面。对CPhO预赛2014—2018年试题的研究发现,物理观念考查占预赛试题的14.5%,对科学态度与责任的考查占比在25%以下。科学思维则分为模型建构、科学推理、科学论证、质疑创新,其中预赛对科学推理的考查占65.5%,对模型建构的考查占27.4%,对科学论证的考查仅占7.1%,但几乎没有对学生质疑和创新能力的考查[10]。四是考查学生的高阶思维能力。CPhO预赛对能力的考查以运用为主,分析能力次之,评价、创新能力未直接体现,该结构体现了预赛的基础选拔作用和普适性特点[8]。有研究者运用SOLO分类理论,对CPhO复试2008—2018年试题进行分析,发现拓展抽象结构水平问题占比最高,学生须学会从抽象的物理情境中挖掘新的信息,将抽象问题具体化。关联结构类问题占比次之,单点和多点结构类问题考查较少。电磁学部分对思维能力的考查最为明显,其次为力学、热学、近代物理、光学[13]。五是对数学素养要求较高。物理竞赛需要用到大量数学知识和数学方法解题,对CPhO预赛2014—2018年的试题研究发现,抽象思维占23.7%,逻辑推理占3.1%,数学建模占1%,直观想象占13.4%,数学运算占58.8%。复赛、决赛中微积分内容的考查大幅增加了计算量,而且决赛中涉及的数学知识更复杂,思维难度要求也更高[12]。可见,物理竞赛对学生的数学素养提出了较高要求,需要具备从物理现象中抽象出数学关系的能力和数形结合能力。六是试题情境设置侧重生活实践和科学前沿。竞赛试题重视科学技术在社会生产、生活及发展中的应用,可分为联系生活实际、科学前沿成果、物理学经典理论3种类型。联系生活实际的试题是学生在日常生活中遇到的具体问题,需要举一反三,广泛联系所学知识。科学前沿试题以最新的科研成果为背景,将其研究过程予以模型简化引导,必要时给出一些已知条件,使学生体验科研工作,关注前沿物理学热点问题。物理学经典理论给出科学家当时研究问题的背景,再现研究思路、发现过程。七是复赛和决赛体现出对人才的较强选拔性和甄别性特征。有研究者对湖南省参加全国36~37届竞赛学生的成绩分析发现,复赛低分段所占比例达80%,决赛中间段占70%,这表明经过复赛选拔的学生具有扎实基础和优异思维能力,这也体现出物理竞赛的强选拔性和甄别性,决赛成绩未呈现两极分化,分布较为均匀[14]。(三)物理竞赛学生的培养情况根据竞赛流程,可以将学生培养分为两个阶段,一是决赛前学校教育中的常规培养,二是获得全国竞赛一等奖的前50名学生的集中培养。在第一阶段,并不是所有普通高中都能开设竞赛类培养课程。开展培养的学校,通行模式是在高一学年面向有兴趣和学科特长的学生开设物理竞赛选修课程,通过课程难度和学生接受程度自然淘汰,于高一学年末确定参加竞赛的学生。学校还会定期邀请高校专家对学生进行辅导,一些省份的高校物理学院会对进入省队参加全国决赛的学生进行集中培训,也有些学生会在校外机构学习竞赛内容,但仍以学校教学为主。课程的内容和教材,由每所学校的学科竞赛教练根据竞赛大纲自行决定或编写。通常而言,高一主要是学习课程知识,教师教授和学生自主学习相结合,高二以习题和实验为主,主要采用学生探讨的形式,培养思维能力和解决问题能力。一些物理竞赛的学生同时还参加数学竞赛。在第二阶段,获得全国竞赛一等奖的前50名学生组成集训队,通过短期集中培训,从中选拔能够适应国际竞赛和亚洲竞赛的选手,组成国家队参赛。中国自1986年组织参与国际物理奥林匹克竞赛以来,一直由北京大学、中国科技大学、复旦大学、南京大学、南开大学和清华大学轮流承担国家队集训选拔和国际比赛的任务。当年承担任务的高校组建奥林匹克物理竞赛工作小组,成员由若干教学、科研工作经验丰富的教师组成。一般在集训前会制定明确的集训、选拔方案,并收集有关物理竞赛的资料。通过和学生交流、制定详细教学计划,会在教学中有针对性地突出重点,通过科学、规范、严格的培训帮助学生用已有或给定的知识对所提出的问题进行分析、建立模型和解答。二、我国中学物理竞赛的成效及问题(一)竞赛取得的成效首先,促进了学生科学素养的发展。学科竞赛为学生提供了锻炼思维的机会,促进了他们获得新知、对问题进行深入探讨、增强学习兴趣,提高了解决问题的技巧性和创造性。对问题的科学探索和研究具有过程性,锲而不舍的钻研精神和科学态度,也有利于学生学习品质和学习能力的提升,促进了他们科学素养的早期培养。我国物理竞赛目前已形成较为良好的生态,每年参与初赛的学生人数已接近90万,为国家储备了大批对科学感兴趣,并且有一定科学素养的后备人才。其次,有利于拔尖创新人才的选拔和培养。学科竞赛能更好地关注学生的个体差异和发现学生的独特才智,是对我国人才评价方式的完善,符合以素养为核心的现代教育要求,有利于及早发现和培养青少年创新人才。竞赛的准备阶段主要靠选修课和集训完成,时间相对紧张,需要学生进行大量的课外自学和思考;竞赛中的探究性问题往往需要从多个角度思考和进行探索。竞赛还会改变学生原有的学习轨迹,要求他们不仅要制定科学的学习计划,还要有稳定、坚强的意志,有信心和勇气面对各种挫折挑战。因此,自学能力、高阶思维和问题解决能力、抗压抗挫能力是竞赛选拔出的资优学生最为重要的特征。再次,促进了学科教师队伍的建设。参加竞赛的学生大多智力超常,指导教师需要对竞赛的研究性、前沿性进行自觉学习、深入研究,一定程度上促进了中学教师拓宽视野。竞赛同时促进了中学物理教师教学水平的提高,涌现出一批业务成绩卓著的中青年教师,且多人获评特级教师,有利于教师整体队伍的建设[6]。又次,促进了物理学科常规教育教学的改进。竞赛题兼具综合性、创新性、思维延伸性特点,内容灵活多样、新奇有趣。这不仅为高中课堂教学注入了新的活力,也为中学教材和课程改革提供了参考,提高了学生的自学能力和逻辑思维能力,有利于高中课堂教学质量的提升。竞赛提高了物理实验教学水平,实验任务不仅促进了中学物理实验室的建设,也使那些对物理学习兴趣浓厚的学生显著提高了实验水平[6]。一些竞赛试题来源于相关学科的研究成果,具有新颖性、启示性和方向性,往往对中学物理教学起到导向作用。通过学科竞赛的教学试验,可以掌握现阶段学生学习知识的能力和全国学生能力的综合指数,通过对学生学习能力的相关数据及未来人才发展情况的分析,可以更好地制定高中物理课程新课改内容。最后,取得了优异的国际物理奥林匹克竞赛成绩。截至2022年,我国一共参加了36届国际物理奥林匹克竞赛,共选派出178位选手参赛,获得146枚金牌、21枚银牌、9枚铜牌,以及2个表扬奖[15]。近10年,我国每年参加国际奥赛的选手都获得金牌。中国队从2000年亚洲物理奥林匹克竞赛首次举办即开始参赛,截至2021年,共参加18届赛事,选派出153位选手,获得144枚金牌、7枚银牌、1枚铜牌,1个表扬奖,为国家赢得荣誉。(二)竞赛中存在的问题首先,功利性升学偏离了学科竞赛初衷。竞赛最显著的功能是发现、选拔、培养特殊人才,但目前这一功能已受到质疑,原因主要体现在:1)功利化倾向。学校、家长和学生参与奥林匹克竞赛更注重能否通过获奖取得顶尖大学的保送或入选“强基计划”等资格,逐渐违背了竞赛初衷,演变为学生之间激烈的升学竞争,带来巨大的学业压力。2)培训急于求成。很多学校采取集中强化培训的方式,让学生在很短时间内大量学习高深知识,课程进度过快而无法做到循序渐进,这种急功近利的短期培训方式很容易消磨学生的信心和兴趣,还会对其他学科的学习产生负面影响。3)过于强调应试技巧。目前的一些竞赛题往往设置诸多障碍,学生需要在审题和对应试技巧的摸索中花费大量时间,影响了对核心知识和必要能力的掌握,竞赛培训体系也有待改进完善[16]。其次,优质教练资源十分稀缺。关于竞赛课程的开设和竞赛学生的培养,最突出的问题是师资力量。承担竞赛课程的教师需要引导拔尖人才坚定探索物理学前沿问题的信念,但当前中学阶段的竞赛教练,无论从数量还是综合素质上都不能满足相应要求。高中物理竞赛教师队伍存在结构不合理、数量严重短缺、学科知识不足、稳定性不高、压力过大等问题[17]。再次,竞赛发展水平存在较大的地域差异。我国物理学科竞赛发展水平的区域间不平衡问题表现显著。2013—2021年入选国际物理奥林匹克竞赛国家集训队的学生,主要集中在湖南、浙江、湖北、北京、河北、上海等6省市,广西、新疆、内蒙古、甘肃、云南、贵州等10余个省(区、市)没有学生入选。此外,各省每年获得全国中学生物理竞赛一、二、三等奖的人数也存在省域差异、校际差异,前述竞赛成绩最好的6个省市,入选国家集训队的学生基本集中在省市内最好的几所高中[18]。又次,我国奥赛成绩辉煌却仍缺乏拔尖创新人才。竞赛从本质上来说是一种基于学科核心素养创造性设计的、需要短时间内完成的竞技性活动,对考试范围、性质都有明确规定;而从事科研创新则是以探索未知为主题、充满创造性的活动。历来对于中国奥赛成绩辉煌却仍缺乏拔尖创新人才的诟病不绝于耳,实际上这是有一定相关性、但本质不同的两个问题。首先,拔尖创新人才并不全靠奥赛培养,也不能把尖端人才的缺失归咎为奥赛制度本身。人才培养是一个长期过程,不能一蹴而就,中学只是成长的一个阶段。其次,常见的批判认为师生、家长过于看重名次,学生参赛只为获得名次而非出于兴趣爱好,加上竞赛模式过于看重应试技巧而不注重科研能力、综合素质,从而导致参赛学生未能成长为拔尖创新人才。实际上,有过奥赛经历的科学家普遍认可竞赛在识才、选才方面不可替代的价值,但也表示竞赛能够培养的,仅仅是从事科学研究需要具备的能力中的一小部分,过度训练反而事倍功半,在认知和心理上都阻碍了学生其他能力的发展。他们主张尊重教育规律和拔尖创新人才成长周期,强调平衡的教育,将竞赛视为整个科学甚至文化教育的一部分,跳脱其功利性的不良影响[19]。最后,学科竞赛活动对拔尖创新人才培养和选拔效果的研究不足。国外针对学科竞赛活动开展过不同角度的研究,主要包括追踪获奖选手的后续发展情况以考察竞赛选拔实际效果;调查竞赛对选手继续学习科学和从事科学事业的动机影响、为选手带来的成就感与归属感,以及分析竞赛活动为科学课堂教学带来的积极效果等。针对中学生5大学科竞赛,有研究发现,学科竞赛在提升学生的科学兴趣和价值观认同方面效果较为明显,对学生有良好的职业导向。具体表现包括:参赛选手深化学科兴趣并在后来的学术与职业生涯中取得杰出成就;学科竞赛活动能强化学生的自我效能,竞赛奖项为学生带来学术生涯中最具成就感的时刻,也为后续专业学习带来短期的相对优势,但这两项效果在我国竞赛活动中仅达到中等水平,有待加强[20]。总体而言,国内文献较多关注各学科奥赛试题介绍分析和备赛经验,对拔尖创新人才培养和选拔效果的研究较少。三、促进拔尖创新人才选拔培养的政策建议通过学科竞赛模式,可以较早发现拔尖创新人才,但我国各个学段的学科竞赛培训尚未形成贯通培养机制,多年积累的培训策略未能广泛转化和促进常规教学。竞赛发展不均衡、选拔人才总量有限、创新素养和创新能力培养尚未成为教育常态等,都大大制约了拔尖创新人才自主培养的质量和数量。基于上述研究,本文提出借鉴竞赛选才机制和培养策略的5条政策建议,以期加快建立健全拔尖创新人才选拔培养的中国模式。(一)坚持拔尖创新人才选拔与学生科学兴趣激发结合我国中学生物理竞赛分为5个阶段,不同阶段的选拔目标和侧重点各有差异,应坚持将识别拔尖学生和激发更多学生学习兴趣相结合。初赛和复赛阶段,应以鼓励更广泛的教师和学生参与为主,设置与IPhO相关、不容易找到解决方案的独特任务,以促进学生通过研究性学习加深对物理学科的了解。决赛和集训队阶段,一方面要强调学生的选择性和培训训练;另一方面也要保护其科学学习兴趣,保证能够参与并取得优异成绩的学生确实具备学科天赋、学习能力和心理素质。因此,可以开展丰富的竞赛学生与研究人员、同龄人之间的交流对话、短途旅行等活动,鼓励参加过比赛的学生参与评卷和交流互动。通过配合高中课程改革、高校招生制度改革和正向引导社会舆论,扭转学校、教练、学生和家长的功利性备考,让参与竞赛的学生回归到对科学本身的兴趣和对科学问题的积极探索中。就科学素养普及功能而言,竞赛试题完全可以面向全体中学生,但从发现和选拔人才的角度而言,竞赛的确只适合有浓厚兴趣和较强数理能力的少数学生。如果强制多数学生投入高强度的竞赛训练,则违背了教育规律。如何让超常学生在发展物理学科能力的同时感受灵活、理性的思维方式,始终保持对物理的学习兴趣,是开展竞赛活动首要考虑的因素。认知目标和情感目标间的相互作用是大多数选择参加竞赛学生的最初动机,保持对学科的兴趣比竞赛得奖更为重要。(二)提高竞赛选拔工具的科学性和有效性竞赛作为拔尖创新人才选拔的一种模式,选拔手段的质量会直接影响选拔效果。全国物理竞赛将试题+实验设计+操作作为选拔手段,不仅要选拔出物理学科的拔尖人才,作为指挥棒,也担负着引导物理竞赛教育方向的责任。目前对物理竞赛试题的研究主要集中在试题内容、解题方法、能力要求等方面,今后需要加强对选拔工具科学性和有效性的研究,一方面分析试题的难度、区分度和信效度,另一方面要保持试题质量的稳定性。从引导竞赛教育方向的角度,要明确试题的测评框架,既保证知识内容合理,又以素养为导向,同时能够贴近实际情境和物理学科的前沿动态,引导竞赛以培养学生的核心素养为目标。(三)重视拔尖创新人才的非认知能力培养能在竞赛中取得优异成绩的学生,具备成为拔尖创新人才的智力基础,教师在培养过程中还需要重视他们非认知能力的发展。在人格和个性方面,培养学生的独立性和批判性思维、强烈的好奇心、求知欲与浓厚的兴趣、高度的社会责任感和事业心、执着的追求和坚忍不拔的毅力;在创新素养方面,培养学生的创新思维、创新精神、创新意识和创新能力;在情绪管理方面,帮助学生学会识别、监控、管理自己和他人的情绪,并利用这些情绪信息指导自己的思想和行为;在领导和管理素养方面,帮助学生在学校一些特定的情境中充当领导和管理者角色,吸引和影响他人共同实现目标,包括战略思考和规划能力、应变协调能力和团队协作力等[21]。(四)发挥竞赛对日常教学的促进作用首先,培养学生对物理学习的兴趣。竞赛中有相当多的题目与当前物理研究热点有关,这在日常教学中同样重要。可以通过多种方式提高学生以物理学眼光探索世界的求知欲,培养学生的科研兴趣。其次,创设源于现实的物理情境,培养学生抽象建模能力。常规教学可以借鉴竞赛决赛试题,尤其是在进行抽象模型教学时,多设置一些源于真实世界的物理情境问题,有助于培养学生的抽象建模能力。最后,培养学生的推理、论证和问题解决能力。物理竞赛需要学生通过推理和论证,解决复杂的、陌生情境中的新问题,推理与论证的过程涉及大量公式推导、物理量关系运算、数学模型建构等,加强数学素养的培养,也是培养学生推理、论证能力的有效手段。此外,还应发挥竞赛对实验教学的促进作用。实验探究不仅是竞赛中的重要考试模块,也是高中物理课程的重要内容。物理实验在提出问题、猜想和假设、制订方案、实施过程和得出结论中渗透了较多的质疑和创新因素,可以考查学生的基本物理实验技能和创造性解决实际问题的能力。教师可以结合课程标准中“学生必做实验”“活动建议”和教材中的“课题研究”模块,把它们分成“实验室操作类”“实践活动类”内容,通过物理实验搭建适应创新素养培养的教学实施路径,为创新人才培养奠定基础。(五)完善竞赛体制机制建设首先,教育部门应加大对基层物理竞赛资源支持力度。大部分学校一方面缺乏了解、熟悉竞赛的优质师资,另一方面缺乏相应的实验设备,课程教学也处于摸索阶段。国家层面虽然大力倡导、鼓励学校开展面向创新人才选拔的竞赛教育,但缺乏相应的资源支持体系。国家层面除了在获奖名额上对薄弱地区倾斜外,更应该加大对师资培训和课程资源的支持。省级教育主管部门也应建立相应的保障体系,加大对县域中学开展竞赛教育的支持。其次,适当增加竞赛的集训名额。在大学进行集中培训,有利于学生更全面地认识和思考物理问题,在高中阶段就能从学科本质出发理解物理。目前的集训队只有50个名额,可以进一步将名额扩展到获得决赛一等奖的所有学生。考虑到高校所能承担的学生培训容纳量,可以让一等奖的学生分散在不同大学的物理学院进行培训,再选拔进入国家队。由此扩大资优学生的人才池,培养和引导他们成长为拔尖创新人才的几率也会大幅增加。最后,在教育条件较好的地区,可试点建设一批科技高中,探索中学和大学的人才贯通培养渠道,识别、筛选和培养一批天才少年,做好制度设计、创新课程设置和培养方案,超常规配置教学、科研资源和师资力量,培养拔尖创新人才。总之,基于中学物理学科竞赛在拔尖创新人才选拔和培养中的经验,应针对性解决其中存在的突出问题,探索面向更多学生的普惠培养方案,激发学生学习兴趣,大比例提升拔尖人才选拔和培养的基数,畅通具有天赋和潜力学生的选拔和培养通道,进一步优化相关体制机制建设,进而提升我国拔尖创新人才自主培养能力,促进高质量教育体系建设,为国家培养更多未来领军人才和国际一流科学家。参考文献

李传宗:新高考改革对大学生专业兴趣的影响研究

2024-03-05

原创 李传宗 中国考试 2024-01-29 15:30 北京原文刊载于《中国考试》2024年第1期第62—71页。作 者:李传宗,北京师范大学教育学部硕士研究生。摘 要:专业兴趣是衡量本科人才培养质量的关键指标。基于第3批高考改革省份高校3万余份学生调查数据,考察高考改革能否有效促进学生的专业兴趣及其作用机制。研究发现,新高考生源大学生专业兴趣显著高于传统高考生源大学生,专业匹配度在其中发挥关键的中介作用,新高考生源大学生的专业兴趣在专业类别、家庭背景和学校背景等方面存在群体差异。可通过完善生涯教育体系、改善教育资源配置等措施巩固改革成果,进一步提升学生的专业兴趣。关键词:新高考;高考改革;专业兴趣;专业匹配;生源质量;高考评估高考作为连接基础教育与高等教育的桥梁,具有“牵一发而动全身”的重要战略地位,是深化教育领域综合改革的杠杆和抓手。评估高考综合改革成效,对于深化完善先行试点省份改革、稳步推进后续推广省份改革以及凝聚全社会改革共识等具有重要意义[1]。服务选才是高考的基本使命与核心功能,也是高考改革评估的重要维度,新高考生源质量得到社会的广泛关注,被视为评价高考综合改革成效的重要参考。专业兴趣作为学生发展领域的重要议题和衡量本科人才培养质量的关键指标,能够反映新高考生源质量。越来越多的学生通过新高考进入高等教育阶段,他们的专业兴趣表现如何呢?本研究将围绕新高考能否有效促进大学生的专业兴趣这一问题开展调查。一、文献综述新一轮高考改革已推行近十年,就人才选拔的基本使命而言,现有高考改革评估研究主要集中于新高考能否促进公平选才和科学选才两个角度。就高考服务选才的公平性而言,一方面,研究者们讨论了招生计划分配、考试内容、考试方式和招生录取方式等新高考政策的公平性问题[2]。另一方面,研究者们关注新高考背景下弱势群体的教育获得问题和学校教育的补偿效应[3-4]。就高考服务选才的科学性而言,学者们主要从高考成绩与排名、学习适应性和学业表现等3个方面考察了新高考的生源质量[5-7]。研究表明,新高考促进了高中-大学教育衔接,能够帮助学生更好地适应大学学习和提升学业表现[8-9];但也有证据显示,理工科大学生似乎在新高考背景下面临更大的学习困难[10]。兴趣在教育活动中处于能动地位[11],是影响学生学业和生涯发展的关键因素,新高考背景下大学生的专业兴趣表现既关乎人才选拔的科学性问题,也关乎学生发展的公平性问题,值得进一步探讨。专业兴趣是大学生对其所学专业领域表现出的偏好,反映了大学生对学习本专业感到满足的心理和情感状态[12]。参照Hidi和Renninger提出的兴趣发展四阶段模型,专业兴趣介于最初的个人兴趣和稳定的个人兴趣之间,其发展具有长期性和相对稳定性的特点[13]。大量研究表明,作为重要的内部性动机,专业兴趣能够激发学生的求知旨趣,有效促进学生的学习投入和深度学习,是预测学生专业承诺、学业成就和科研创新的重要因素[14-17]。学生的专业兴趣不仅需要在高等教育阶段培养,还涉及基础教育与高等教育衔接的复杂过程[18]。学生在进入高校开始接受专业教育之前,便已经基于自己的特长、爱好,以及关于某些学科或职业的认知形成了初始兴趣。有研究表明,学生的初始专业兴趣受到个体、家庭、学校、政策等多种因素的影响,如个人学术动机与学业水平、家庭支持、学校生涯教育、志愿填报机制等[19]。一方面,学生在基础教育阶段形成的初始兴趣会影响学生的专业选择和大学期间的学业表现[20-21];另一方面,过重考量功利因素而做出的专业选择也可能会有损于学生在高等教育阶段的专业兴趣发展,导致教育过程的异化,妨害学生成长成才[22]。从我国高等教育实践来看,学生的专业兴趣不足始终影响人才培养质量,是提升我国拔尖创新人才自主培养能力必须攻克的难关[23-24]。高考综合改革以实现学生“学其所好,考其所长,录其所愿”为政策目标,旨在增加学生的选择,尊重学生的兴趣爱好和受教育权利,引导学生全面发展,提升人才选拔效率和培养质量[25]。引导学生根据兴趣和特长选择专业是新高考的重要价值导向,有利于提升学生初始兴趣与录取专业间的匹配程度,促进学生高等教育阶段的专业兴趣发展。目前,学界关于新高考生源大学生的专业兴趣表现尚未形成一致的研究结论。例如,鲍威和金红昊对浙江和上海新高考生源大学生的调查显示,新高考生源大学生在专业选择方面具有优势,学校生涯规划教育和新高考专业录取机制有利于提升学生同专业的适配度,显著提升了大学新生的专业兴趣[26];但沈彦彬等则得到上海新高考生源大学生的学习兴趣不足的结论[27]。总而言之,目前关注新高考生源大学生专业兴趣的文献相对较少,研究结论也尚未达成一致。通过新高考进入高校的大学生是否确如政策预期表现出更高水平的专业兴趣,还需要通过调查数据来分析评估。随着第4批和第5批改革省份高考综合改革方案的发布,以第3批推行高考改革的8省市为代表的“3+1+2”科目选考模式将成为未来全国高考的主要模式。因此,本研究将第3批改革省市学生作为新高考生源大学生的代表,考察新高考能否促进大学生的专业兴趣发展,以期为高考综合改革平稳推进及高校人才培养质量提升提出建议。二、研究设计(一)数据来源本研究数据来源于2023年6月针对第3批实施高考综合改革的河北、辽宁、江苏、福建、湖北、湖南、广东、重庆等8省市开展的大规模问卷调查。8省市于2018年启动高考综合改革,迄今共有2021级和2022级两届学生经由新高考进入大学。项目组在每个省市选取了“双一流”建设高校、普通本科院校和专科院校各两所作为研究样本,面向2021级(大二)和2022级(大一)的高校学生线上发放《关于考试招生制度改革的调查问卷》,依据填答时间和填答质量剔除不符合要求的无效样本后,本次调查共回收有效问卷55546份。为更好比较新高考生源大学生和传统高考生源大学生在专业兴趣方面的差异化表现,考虑到本科院校和专科院校在专业类型划分和人才培养模式等方面的不同,筛选出本科院校的学生样本,并剔除人数较少的军事学和交叉学科的学生样本;此外,考虑到不同批次启动新高考的省市实施的选考科目政策等有所不同,选取生源所在地为河北、辽宁等8省市的学生样本作为新高考生源大学生的代表,选取生源所在地为吉林、山西等2019年前暂未启动新高考改革省份的学生样本作为传统高考生源大学生的代表。最终得到33663份高校学生样本,其中男生16780份,女生16883份;新高考生源学生24685份,传统高考生源学生8978份;普通本科院校学生22283份,“双一流”建设高校学生11380份;2021级学生14128份,2022级学生19535份。(二)研究假设新高考相较于传统高考的突出特点之一便是打破高中教育文理分科的二元模式,实施科目选考制和走班制,有助于学生根据自身兴趣爱好和学科特长选择考试科目,提升高中学习和专业录取的获得感与满意度,进而满足多元化的教育需求,促进学生全面发展。基于此,提出研究假设1:假设1:不同生源类型学生的专业兴趣存在显著差异,高考改革对大学生专业兴趣具有显著促进作用。新高考推行平行志愿填报模式,能够降低专业调剂风险并引导学生在志愿填报时从“总分匹配”转为“专业导向”,进而提升学生与被录取专业之间的匹配程度[28-29]。新高考背景下,高中学校的生涯规划教育和志愿填报指导得到加强,有助于帮助学生理性选择选考科目和高考志愿,从而提升其对专业录取的满意度[30]。相较于传统高考,新高考注重引导学生关注个人长远的生涯发展,通过推行科目选考制、改革志愿填报模式、完善生涯教育等多项举措,提升学生同大学专业之间的匹配程度。基于此,提出研究假设2:假设2:不同生源类型学生同专业之间的匹配程度存在显著差异,高考改革对提升大学生专业匹配度具有显著促进作用。研究表明,专业匹配对学生的学习投入和学业表现具有显著的促进作用,专业匹配程度越高,学生对所学专业越喜爱[31]。基于此,提出研究假设3和研究假设4:假设3:专业匹配度对专业兴趣具有显著促进作用。假设4:专业匹配度在生源类型和专业兴趣之间发挥中介作用。综上,聚焦高考改革成效和高校学生发展,建立图1所示的生源类型、专业匹配度和专业兴趣的简单中介关系模型。(三)变量说明本研究的因变量为大学生的专业兴趣,即大学生对自己所学专业的个体倾向和情感状态,由“我对自己所学专业感兴趣”“我对学习本专业充满热情”“我非常热爱我的专业,不会选择转专业”3个观测题项的得分均值来表征(Cronbach's α=0.895),每个题项的赋值按李克特7点计分,得分越高表明学生的专业兴趣水平越高。本研究的自变量为生源类型,使用虚拟变量,将生源地为8省市的学生定义为新高考生源,赋值为1;将生源地为2019年前暂未启动新高考改革省份的学生定义为传统高考生源,赋值为0。本研究的中介变量为专业匹配度,即大学生的兴趣、能力、性格特点和教育背景等与自己所学专业之间的匹配程度,由“我对当前录取的专业满意”“我的选考科目与大学所学专业匹配”“我的综合条件比较适合学习本专业”3个观测题项的得分均值来表征(Cronbach's α=0.862),每个题项的赋值按李克特7点计分。本研究的控制变量包括3个部分。第一,控制个人基本特征变量。其中,性别使用虚拟变量,女生赋值为0,男生赋值为1;年级使用虚拟变量,2021级为0,2022级为1;专业类型使用社会类学科(包括经济学、法学、教育学、管理学)和理工类学科(包括理学、工学、农学、医学)两个虚拟变量表征,分别赋值为1,人文类学科(包括哲学、文学、历史学、艺术学)赋值为0。第二,控制家庭背景因素变量。其中,城乡因素使用虚拟变量,按照高考时的户籍所在地定义为农村家庭和城市家庭,分别赋值为0和1;家庭文化资本使用父母最高学历表征,父母最高学历为大学专科及以上定义为高文化资本家庭,赋值为1,反之赋值为0;家庭社会地位使用父母职业类型表征,父母至少有一人为管理技术人员(包括国家机关、党群组织、企业、事业单位负责人和专业技术人员)定义为高社会地位家庭,赋值为1,反之赋值为0。第三,控制学校背景因素变量。其中,高中学校背景使用学校类型表征,省会城市优质高中和地市优质高中定义为优质高中,赋值为1,城区普通高中和县域高中定义为非优质高中,赋值为0;大学学校背景使用虚拟变量,“双一流”建设高校赋值为1,其他本科院校赋值为0。此外,本研究还设置了首选科目、选科组合、志愿录取模式3个变量来对新高考生源大学生群体进行类别划分。具体而言,根据首选科目可划分为选考物理和选考历史两类群体;根据选科组合可划分为传统理科组合(选科组合为“物理+化学+生物”)、传统文科组合(选科组合为“历史+政治+地理”)、文理交叉组合(选科组合为其他类型)3类群体;根据志愿录取模式可以划分为院校专业组和院校+专业(类)两类群体。三、研究结果与讨论本研究主要采用独立样本T检验、多元回归分析、Bootstrap中介效应分析以及方差分析等方法进行数据分析,得到以下结果。(一)两类大学生专业兴趣的差异性分析使用独立样本T检验分析两类大学生的专业兴趣是否存在显著差异(见表1)。从专业兴趣的平均情况来看,无论是新高考生源大学生(M=5.22, SD=1.353)还是传统高考生源大学生(M=5.05, SD=1.389),都表现出了较高水平的专业兴趣。分年级来看,不同生源类型大学生专业兴趣的大二平均水平相较于大一平均水平,均出现0.1分左右的略微下滑。可能的原因是随着新高考改革政策的深入实施与不断完善,越来越多的学生能够进入到自己感兴趣的专业领域学习和探索;而进入高等教育阶段后,学生的专业兴趣本身又会随年级升高而发生变化。专业兴趣产生于学生对专业的认识和了解过程,随着年级的升高,大学生对自己所学专业有了更加清晰和全面的了解,其专业兴趣水平也会发生变化。有研究表明,大学生对自己所学专业感兴趣和不感兴趣的学生比例都会随着年级升高而增加,大二往往是学生专业兴趣发生转变的关键时期[18]。无论是全体学生还是各个年级的学生,分析结果均表明,新高考生源大学生的专业兴趣始终显著高于传统高考生源大学生,初步验证了研究假设1,即高考综合改革有利于促进学生的专业兴趣发展。(二)生源类型对大学生专业兴趣的影响使用多元回归分析进一步探索高考综合改革对大学生专业兴趣的影响。表2呈现了生源类型对大学生专业兴趣影响的逐步回归结果,从模型1到模型4逐步纳入核心自变量生源类型和控制变量个人基本特征、家庭背景因素及学校背景因素。模型1的回归分析结果与T检验结果相同,生源类型能够显著影响大学生专业兴趣,与传统生源大学生相比,新高考生源大学生表现出了更高水平的专业兴趣。模型2到模型4的回归结果表明,个人基本特征、家庭背景因素和学校背景因素都会显著影响大学生的专业兴趣。具体而言,男生相较于女生、2022级相较于2021级、人文类学科相较于社会类学科、高文化资本家庭相较于低文化资本家庭、高社会地位家庭相较于低社会地位家庭、优质高中毕业生相较于非优质高中毕业生,以及就读于“双一流”建设高校的学生相较于就读于普通本科院校的学生,均表现出更高水平的专业兴趣,且差异达到显著水平。同时,在逐步纳入控制变量的过程中,生源类别始终对专业兴趣具有显著性影响且回归系数符号保持不变,表明新高考生源大学生的专业兴趣显著优于传统高考生源大学生的分析结果具有稳健性,研究假设1得到验证。此外,鉴于模型4的解释变量均为二分变量,比较各解释变量的B系数可以发现,生源类型对大学生专业兴趣的影响力超过了性别、专业、家庭文化资本等其他因素,且在控制个人基本特征、家庭背景因素和学校背景因素的条件下,新高考生源大学生相较于传统高考生源大学生在专业兴趣方面的平均分高出0.393。这表明以增加学生选择性为突出特色的新高考有助于引导学生根据自己的兴趣特长选择科目与专业,高考改革在促进学生专业兴趣发展的过程中发挥了关键作用。(三)生源类型影响大学生专业兴趣的机制使用多元回归分析探索生源类型影响大学生专业兴趣的机制,回归分析结果如表3所示。模型5是以专业匹配度为被解释变量进行回归分析,结果表明在控制个人基本特征和家庭及学校背景因素后,生源类别能够显著影响专业匹配度,新高考生源大学生的专业匹配度显著高于传统高考生源大学生,研究假设2得到验证。模型6以专业兴趣为被解释变量,在模型4的基础上纳入中介变量专业匹配度。回归分析结果表明,在控制个体、家庭和学校背景因素后,专业匹配度对专业兴趣具有显著性影响,能够显著促进大学生的专业兴趣,研究假设3得到验证。与模型4相比,模型6的R2大幅跃升,表明纳入专业匹配度后模型的解释力度显著增强;生源类别的标准化回归系数有所下降,但仍然显著,推测专业匹配度可能在生源类型与专业兴趣之间起中介作用。为进一步验证专业匹配度的中介作用,使用Bootstrap法(5000次)对专业匹配度的中介效应进行检验,结果如表4所示。生源类型-专业匹配度-专业兴趣路径的中介系数为0.1989,总效应、直接效应和中介效应的Bootstrap95%置信区间均未包含0,表明专业匹配度在生源类型影响专业兴趣中的中介效应显著,占比高达69.30%,研究假设4得到验证。这一结果表明,新高考生源大学生之所以在专业兴趣方面的表现显著优于传统高考生源大学生,在相当大的程度上是因为新高考有效促进了学生高考录取的专业匹配度。(四)新高考生源大学生专业兴趣的群体差异使用独立样本T检验和方差分析探究8省市新高考生源大学生专业兴趣的群体差异,为便于呈现方差分析中事后比较的结果,分别使用a、b、c指代相应的选科组合或专业类型,分析结果如表5所示。新高考生源大学生专业兴趣在个人基本特征、家庭背景因素、学校背景因素和高考志愿录取因素方面均存在显著性差异。具体而言,在个人基本特征方面,男生高于女生、2022级高于2021级、首选科目为物理的学生高于首选科目为历史的学生、选考科目为传统理科组合的学生高于传统文科组合和文理交叉组合的学生、理工类学科的学生高于人文社科类学生、人文类专业的学生高于社科类专业的学生。就选科和专业差异而言,理工类科目和专业的学生专业兴趣更高可能与“3+1+2”模式下“重理轻文”趋势被强化有关[32]。在家庭背景因素方面,城镇家庭、高文化资本家庭和高社会地位家庭学生的专业兴趣显著更高,这意味着家庭社会经济地位对学生专业兴趣具有显著性影响,优势阶层家庭在获取高考政策和大学专业等信息方面存在优势[3],更容易帮助子女在科目选择和志愿填报方面做出理性选择,进而提升专业匹配度和专业兴趣。在学校背景方面,优质高中和“双一流”建设高校的学生专业兴趣显著更高。高水平学校学生的专业兴趣更高可能有3方面的原因。首先,就读于高水平学校的学生学业表现更佳,而学业表现和专业兴趣之间存在高度相关。其次,高水平学校教育资源丰富,生涯规划教育更加完善,能够有效提升学生的自主选择能力,促进专业匹配度和专业兴趣。最后,无论是高水平高中还是高水平高校,理工科学生占比更高,学校层次差异可能在某种程度上也像性别差异一样受到了选科或专业差异的影响。在高考志愿录取因素方面,实施院校+专业(类)志愿录取模式省份的学生专业兴趣显著高于实施院校专业组省份的学生。这表明取消专业调剂、更加突出专业导向的高考志愿录取政策能够有效提升学生的专业匹配度,进而提升学生的专业兴趣。四、研究结论与建议通过上述分析,本研究得到如下3点结论:1)新高考生源大学生的专业匹配度和专业兴趣显著高于传统高考生源大学生,高考综合改革有效提升了学生同所学专业之间的匹配程度,促进了大学生的专业兴趣发展;2)专业匹配度在生源类型和专业兴趣之间发挥着中介作用,中介效应占比为69.30%,高考综合改革主要通过提高学生同所学专业之间的匹配程度促进了学生的专业兴趣发展;3)新高考生源大学生的专业兴趣水平存在显著的群体差异,男生、2022级、选考科目和专业类型偏理工类、家庭社会经济地位较高、就读于高水平学校和志愿录取模式为院校+专业(类)的学生,专业兴趣更高。结果表明,就实现科学选拔人才的政策目标而言,新高考显著提升了学生的专业匹配度和专业兴趣,有利于提高高校生源质量和人才培养质量,促进学生全面而有个性的发展,是高考回归教育功能的突出表现。但新高考背景下,来自教育基础薄弱学校和弱势家庭的学生在专业选择和专业兴趣发展方面仍然处于劣势。为巩固改革成果,进一步提升学生的专业匹配度和专业兴趣水平,提出3点建议。首先,要坚持高考改革方向,兼顾个人志趣、学校发展和社会需求。新高考改革之“新”的突出表现在于充分尊重和保障学生的学习权和选择权,尽可能满足学生多元化、个性化的教育需求与教育期待,改革方向符合高等教育普及化背景下教育多元化发展的趋势。但高考在教育功能之外,还肩负着促进社会公平,满足经济社会发展需求等多重功能,需要在多方利益相关主体和多种价值取向之间取得平衡[33]。学生自主选择权的骤然放大可能导致学生功利化选科、科学素质下降等问题,影响高校人才培养质量。因此,在坚持增加学生选择性的同时,还要加以规范和引导,实现学生个人志趣同学校与社会的发展需求相契合。其次,要完善改革配套举措,强化学生同专业和选考科目的匹配度。在新高考实施科目选考制的背景下,提高学生的专业匹配度在相当程度上意味着强化学生-选科-专业的耦合关系。一方面,优化选考科目和大学专业之间的匹配度是提升学生专业匹配度的前提。《选考科目指引》以政策的形式实现了大学专业与相应选考科目的强制性关联,有利于提升学生-专业知识性匹配;但部分专业的选考科目要求值得进一步调研和商讨,如历史学类专业是否应该要求必须选考历史科目等。另一方面,引导学生在科目选考和志愿填报时做出理性的教育选择是提升学生专业匹配度的基础。保障学生学习权和选择权落到实处的关键在于完善生涯教育体系,提升学生的自主选择能力和生涯规划能力。最后,要促进资源均衡分配,保障基础薄弱学校和弱势阶层教育公平。新高考显著提升了学生专业兴趣水平,但出身于基础薄弱学校和弱势阶层家庭的学生在专业兴趣发展方面仍处于不利地位。应当进一步改善基础薄弱学校的教育教学条件,关键是加强教师队伍建设,通过吸引优质师资和加强职业培训提升教师的专业化水平和生涯规划指导能力。此外,要充分发挥学校教育资源对弱势阶层家庭子女的补偿效应,一方面帮助弱势阶层学生做好生涯规划,另一方面促进弱势阶层家长的教育参与。同时,还要借助教育信息化建设促进新高考背景下的教育公平,一方面要整合各方教育资源,面向全体学生提供生涯教育和升学指导;另一方面要建立数字化的跟踪评估系统,为学生的教育选择提供个性化指导。五、研究展望受各种因素的限制,本研究还存在一些不足,如研究对象未纳入前两批改革省市的学生、未控制省间差异等。主要有如下几方面的考虑,第一,本调查获取的前两批尤其是第一批改革省市的学生样本量偏少;第二,不同批次改革省份实施的高考改革方案在科目选考政策等方面存在较大差异;第三,新高考改革采取由点及面、分批推进的改革策略,其重要原因之一便是考虑到不同省市的发展水平差异,第3、4、5批改革省市均推行“3+1+2”选考模式表明这些省份在一定程度上存在相似的教育发展背景。此外,本文初步研究了新高考背景下的大学生专业兴趣,后续研究需要进一步探讨相关话题。第一,随着高考综合改革的逐步推行,继续考察新高考背景下大学生专业兴趣的变化及其影响因素,对指导教育实践具有重要意义。第二,教育公平性问题不可能仅仅通过高考改革彻底解决,但高考改革是否有助于缩小弱势学生群体在专业选择和专业兴趣发展方面的劣势需要进一步考证。第三,不同省份的新高考政策存在差异,本研究发现院校+专业(类)的志愿录取模式更有助于提升专业匹配度和专业兴趣,其他高考政策对专业兴趣的影响有待进一步研究。第四,本研究发现首选科目不同及专业类型不同的学生群体在专业兴趣方面存在群体差异,理工科学生的专业兴趣显著更高,新高考是否加剧了选考科目和专业类别间的地位差距及该现象可能带来的影响,值得进一步关注和探讨。参考文献

新高考投档方式对本科专业生源质量的影响 ——基于15省(市)高考录取数据的实证分析

2024-01-02

——基于15省(市)高考录取数据的实证分析原文刊载于《中国考试》2023年第11期第73—84页。作 者吴宇川,北京大学教育学院在读博士生。丁延庆,北京大学教育学院/教育经济研究所副教授,通信作者。摘 要:新高考投档方式通过缩小投档单位与录取单位之间的差异,可以释放考生的专业偏好、减少保守填报行为,并对本科专业生源质量产生影响。基于2016—2021年15省(市)的高考录取数据统计,通过双向固定效应模型分析得出3点结论:1)改革不仅提升了高偏好专业的生源质量,也提升了本科专业整体生源质量的平均水平;2)改革后不同专业生源质量的变化方向并不相同,高偏好专业相对低偏好专业在生源竞争中更具优势;3)选考科目要求相对严格的专业,其生源质量在改革中更容易受到冲击。基于上述结果,提出应加强对基础学科专业生源质量的监测与支持、设置专业选考科目要求时要平衡生源质量与学科发展之间的关系、规范高校以热带冷策略工具的使用等3方面建议。关键词:新高考;高考改革;投档方式;生源质量;平行志愿;双向固定效应模型1 问题提出  为了更加科学高效地选拔和培养人才,提升考生与高校之间的匹配度,我国的高考投档方式经历一系列变化。相较于更为传统的顺序志愿投档方式,新高考改革启动前各省(市)普遍实行的院校平行志愿投档方式被认为“缩窄”了院校录取分数范围,有效提升了考生—院校的匹配质量[1],但考生—专业的匹配问题并未得到学界的充分关注。在院校平行志愿时期,由于专业调剂规则的存在,考生可能被自己低偏好的专业录取,因此考生的专业选择自由也受到一定程度的限制[2]。随着中国高等教育从精英化阶段步入大众化、普及化阶段,人民群众对高等教育的需求早已超越“有大学可上”的低标准,考生及其家庭对自由选择专业的诉求愈发强烈。新一轮高考改革的突出亮点和目标之一就是增加考生的选择权[3],尤其是增加考生的专业选择权,这体现了国家加快推进教育高质量发展、办好人民满意教育的理念与价值追求。  根据《国务院关于深化考试招生制度改革的实施意见》提出的“改进投档录取模式,推进并完善平行志愿投档方式,增加高校和学生的双向选择机会”新要求[4],截至2023年,已经有14个省(市)的考生在新高考投档方式规则下参加了高校招生录取。新高考改革前,这些省(市)在本科招生批次均实行院校平行志愿投档,即各省(市)招生办以院校作为投档单位,将考生的电子档案依据平行志愿规则投送给高校,高校收到考生档案后再以专业作为录取单位对考生进行专业分配及录取。在该过程中,如果考生填报的专业均已录满且考生服从专业调剂,高校就会将考生调剂到尚未录满的专业。由此可知,专业调剂是投档单位与录取单位不一致的产物。新高考改革实施后,第一批新高考省(市)的投档方式转变为“专业组平行志愿”或“专业平行志愿”两种模式,前者以“专业组”为投档单位,以专业为录取单位,仍保留专业调剂规则,如北京、天津;后者将投档单位和录取单位统一为专业,不再保留调剂规则,只要符合专业报考要求,考生的投档专业和录取专业一致,如山东、辽宁。  投档方式的变化有可能改变高校的专业生源格局。新高考改革将院校拆分为若干专业组或专业进行招生,甚至取消专业调剂,这势必会降低冷门专业从校内其他专业获得高质量调剂生源的可能性。自高考改革启动以来,探讨改革对专业生源影响的研究较多。例如:有研究认为,新高考改革实施的平行志愿投档方式提高了学生的专业认同感,提升了学生的学业表现,同时也提升了高校相对强势专业的生源质量[3];还有研究认为,专业平行志愿投档造成高校内部生源质量两极分化,不同专业之间录取分数悬殊,冷门和弱势专业面临生存危机[5];有研究提出,新高考“专业导向”的投档方式能驱动高校优化专业布局、提升专业内涵、凝练专业特色[6]。  然而,上述这些论断多源于理论分析,缺乏足够的证据支持,并且对高考改革后具体专业的生源质量变化方向也未形成一致性意见。以对浙江省新高考改革前后“双一流”建设高校的录取数据进行分析为例,就存在着多种研究结论。例如:马莉萍等发现,人文、社科、经管、工学和实验班专业在改革后生源质量显著提升,而理学、农学、医学这3类专业的生源质量没有显著变化[7];卜尚聪等发现要求“必选多门”的专业生源质量在改革后有所下降[8];金红昊等研究发现医学类专业的生源质量在改革后有所提升,而材料工程类、土木工程类、能源工程类、电气工程类、机械工程类等工学专业的生源质量却出现不同程度的下滑[9];王旭辉认为优质生源主要是向医学、人文社科类的热门专业集聚[10]。从研究设计的角度分析,上述实证研究存在一定的局限性,如样本范围有限,只考察某一类高校或单一省(市),开展政策影响评估时只对比改革省(市)改革前后的生源质量,缺乏非改革省(市)的对照分析等。这些局限或许是上述各研究无法对改革后专业生源质量变化形成一致判断的重要原因。  优质生源是大学建设的重要基础,高水平大学之间的竞争始于优质生源的竞争[11]。科学评估新高考投档方式对专业生源质量的影响,可以为高校生源竞争举措提供实证依据,并对新高考改革政策调整具有一定的参考价值。鉴于此,本研究从理论和实证两个方面进行研究。理论分析主要阐释投档方式影响专业生源质量的传导机制;实证分析方面,以2016—2021年15省(市)的高考录取数据为基础,利用各省(市)改革进度差异所形成的自然实验机会,通过双向固定效应模型(two-way fixed effects model, TWFE)更加系统地考查投档方式变化对本科专业生源质量产生的具体影响。为尽可能地克服已有研究的局限,本研究将所有本科高校均纳入样本范围,不仅对比改革省(市)不同专业的生源质量变化,也有针对性地设置非改革地区的对照分析,且改革省(市)既包括实行专业平行志愿的地区,也包括实行专业组平行志愿的地区。2 理论分析与研究假设  高校的招生录取问题是经济学中典型的双边匹配问题[12-13]。在我国,每年的高考投档都关涉1000多万人的专业匹配问题,因此也被认为是当今世界上规模最大、影响最为深远的匹配实践[14]。高考投档方式影响考生的志愿填报行为,志愿填报行为影响考生—专业的匹配过程;因此,本研究认为新高考投档方式可以通过“改革→考生行为→生源质量”这一影响传导机制对本科专业生源质量产生影响。  新高考投档方式可以通过缩小投档单位与录取单位之间的差异,释放考生的专业偏好,减少考生的保守填报行为。一方面,改革释放考生的专业偏好。专业平行志愿规则将投档单位与录取单位统一为专业,考生可以直接填报高偏好专业而不用担心被调剂;专业组平行志愿虽然保留了调剂规则,但调剂范围从院校内各专业缩小至专业组内各专业,考生被调剂至低偏好专业的概率降低,因此考生的专业偏好也得到一定程度的释放。另一方面,改革减少考生的保守填报行为。改革前,考生如果要避免被调剂到低偏好专业,通常采取“保守填报专业志愿甚至院校志愿以确保专业录取”的保守策略。改革后,专业平行志愿规则下考生不会被调剂,即使是专业组平行志愿,考生也可以通过放弃填报低偏好专业所在专业组来规避低偏好专业,亦无需采取保守填报策略。总之,考生专业偏好释放、保守填报行为减少,即优先填报高偏好专业而不是低偏好专业,不仅影响考生—专业的匹配过程,而且影响专业生源质量。  参照前述已有研究思路,本研究建立考生—专业匹配模型,见图1。模型假设的4个前提条件分别为:S1、S2、S3、S4共4名考生,其高考成绩关系为s1>s2>s3>s4;某高校的两个招生专业分别为M1、M2,且每个专业招生2名;所有考生的真实专业偏好顺序均是M1优先于M2,即对所有考生而言,M1为高偏好专业,M2为低偏好专业;采用平行志愿规则进行匹配。根据上述条件可知,志愿填报存在两种可能情况。第一种,大部分考生优先填报高偏好专业,个别考生优先填报低偏好专业。如S1、S3、S4这3位考生的第一志愿是M1,第二志愿是M2,即优先填报高偏好专业;S2考生的第一志愿是M2,第二志愿是M1,即优先填报低偏好专业。按照平行志愿规则,匹配结果为S1→M1、S2→M2、S3→M1、S4→M2,且M1专业的录取分数最高为s1、最低为s3,M2专业的录取分数最高为s2,最低为s4。第二种,所有考生均优先填报高偏好专业,即S1、S2、S3、S4的第一志愿都是M1,第二志愿都是M2。按照平行志愿规则,匹配结果为S1→M1、S2→M1、S3→M2、S4→M2,且M1专业的录取分数最高为s1,最低为s2,M2专业的录取分数最高为s3,最低为s4。  对比两种志愿填报情况可知:当存在个别考生优先填报低偏好专业时,高偏好专业的录取最低分更低,低偏好专业的录取最高分更高;当考生都优先填报高偏好专业时,高偏好专业的录取最低分提升,低偏好专业的录取最高分下降。由此说明,用专业录取最低分衡量专业生源质量时,考生专业偏好释放、保守填报行为减少将会提升高偏好专业的生源质量,同时使低偏好专业的生源质量保持相对稳定,从而有助于专业整体生源质量平均水平的提升。  根据上述分析结果,提出以下3个研究假设:  假设1:新高考投档方式提升高偏好专业的生源质量。  假设2:较之低偏好专业,新高考投档方式使高偏好专业在生源竞争中更具优势。  假设3:就平均效应而言,新高考投档方式提升本科专业的生源质量。3 研究设计3.1 样本选择与数据来源  利用双向固定效应模型进行改革政策影响评估的前提是,改革与未改革省(市)的专业生源质量在改革前具有相近的变化趋势,即存在平行趋势假设。本研究在预研究中采用事件研究法进行探索性分析,以保证样本省(市)满足平行趋势假设且数量最大化。最终,以2016—2021年全国15个省(市)的高考本科专业录取面板数据(panel data)为分析基础,其中采用新高考投档方式的地区有北京、天津、山东、湖北、福建、广东、辽宁、河北、重庆,尚未实行新高考改革的地区有黑龙江、贵州、云南、江西、河南、安徽。之所以选择这些省(市),是因为在预研究时发现上述改革地区与未改革省(市)满足可比性要求。在利用自然实验进行政策影响评估时,需要划分具有可比性的实验组和对照组。为便于叙述,下文将已实行新高考投档方式的省(市)统称为“改革组”,即实验组;将尚未实行改革的省(市)统称为“未改革组”,即对照组。样本分类情况见表1。经过数据清洗与跨年匹配,最终得到覆盖14619个高校招生单位、76642个专业招生单位,5年(期)共计383210条本科专业录取数据,其中实验组数据208735条(54.5%),对照组数据174475条(45.5%)。高考录取数据主要来自各省(市)招生考试院官网及其出版的《志愿填报指南》一书,专业的学科门类划分参照《普通高等学校本科专业目录(2021年修订版)》,高校所在省(市)的经济相关数据来自国家统计局官网。3.2 模型建构与变量设计3.2.1 生源质量与可比性调整  衡量高校生源质量的方法众多,但多数实证研究以高考成绩作为衡量标准[15-18]。考虑到不同地区、年份的高考分数不具有等值性,本研究使用专业录取最低分对应的省(市)排名,即专业录取排名作为专业生源质量的衡量标准。同时,在新高考考试科目模式为“3+3”的省(市)中,其改革前区分文理科序列的排名值并不能与改革后不区分文理科的排名值直接比较,因此要对“3+3”省(市)改革前的排名数据进行可比性调整。已有研究主要采用两类调整方案,分别为单线调整方案和多线调整方案[9]。单线调整方案指根据某条既定的等值线(如本科线)对排名进行调整。如某省文理科本科线上考生总计10万,其中文科考生2万,本科线上考生总人数是文科考生人数的5倍。假设本科线附近文理科考生的生源质量相当,将文科本科线上考生的排名值乘以调整系数5,得到不区分文理的全省(市)排名。多线调整方案比较复杂:首先将改革省(市)在改革前的高考分数划分成700分及以上、600分段、500分段、400分段、400分以下5个区段,假设每条区段线附近文理科考生的生源质量相当;其次,计算文科或理科各区段的考生人数,以及各区段不区分文理科的考生总人数,将不区分文理科的考生总人数除以文科或理科考生人数作为该区段文科或理科排名的调整系数;最后,将文科或理科排名值乘以调整系数,即可得到不区分文理的排名值。以2019年北京高考分数为例,文理科600分段有考生9771人,其中文科考生1951人,文科600分段的调整系数为5.01=9771/1951。根据北京市2019年高考文科一分一段表,文科660分排名全市第122名,将122乘以调整系数5.01,即得到调整后不区分文理的排名为第611名。  本研究在基准分析中采用多线调整方案对“3+3”省(市)改革前的排名进行调整,并在稳健性检验中采用以本科线作为等值线的单线调整方案。3.2.2 模型与变量  政策影响评估要解决内生性问题,尤其要避免无法观测到的遗漏变量可能造成的评估偏误。双向固定效应模型可以通过差分形式将影响因素中不随观测单位个体和时间变化的因素剔除,是解决内生性问题的有效方法。参照吴宇川、丁延庆等研究[16,19],本研究主要采用双向固定效应模型评估新高考投档方式对专业生源质量的影响,具体模型如下。在上述模型中,i表示专业招生单位,j表示高考省(市),t表示年份。MRijt表示专业i在j省(市)t年的专业生源质量。由于不同层级高校录取排名值的绝对变化量所代表的生源质量变化程度不同,不能进行直接比较,因此要对MRijt取自然对数后再纳入模型。Refjt为“新高考投档方式”虚拟变量,是本研究关注的核心变量,标记高考省(市)j在t年的投档方式是否为专业组平行志愿或专业平行志愿(两种投档方式只需满足其一,则虚拟变量取值为1,基底为院校平行志愿)。Majorij表示专业个体的固定效应,控制专业之间无法观测且不随年份变化的固定差异;Yeart表示年份的固定效应(即招生年份的虚拟变量),控制年份之间无法观测且不随专业变化的固定差异;εijt表示随机误差。  X为一系列控制变量,具体包括:1)SRBijt与SRTijt,指专业i所属院校在j省(市)t年的院校录取最低与最高排名;2)Rehotij,t-1,指专业i在j省(市)t-1年的专业相对热度,计算公式为(院校录取最低排名-专业录取排名)/院校录取最低排名,标记专业i在所属院校所有招生专业中的相对热度;3)Numjt与Numj,t-1,指高考省(市)j在t年和t-1年的考生人数;4)Zynumjt,指高考省(市)j在t年的可填报志愿数量;5)Tier1jt与Tier2jt,指单批次和双批次虚拟变量,标记高考省(市)j在t年的本科批次设置是否为单批次或双批次,基底为三批次;6)DFMit,指双一流学科虚拟变量,标记专业i在t年是否已进入第一批“双一流”建设学科名单;7)GDPi,t-1与PCDIi,t-1,指专业i所属院校所在省(市)在t-1年的地区生产总值与人均可支配收入。  该模型本质上是对比2017至2021年改革和未改革省(市)之间专业生源质量的差别。如果Refjt的回归系数在统计学上显著,说明改革对专业生源质量产生显著影响。回归系数大于0,说明专业录取排名值增大,生源质量下降;反之,说明录取排名值减小,生源质量提升。由于模型中的MRijt取自然对数,因此核心变量回归系数的具体值表示录取排名值的变化率,β=0.01表示新高考投档方式使专业录取排名值增大1%。4 研究结果4.1 基准分析  由于专业的强弱与考生的偏好具有较强的相关性,因此本研究以相对强势、相对弱势专业分别表征高、低偏好专业进行分析检验。学科评估是教育部学位与研究生教育发展中心按照国务院学位委员会和教育部颁布的《学位授予和人才培养学科目录》,对具有博士硕士学位授予权的一级学科进行的整体水平评估[20]。虽然学科评估的对象是研究生专业,但考虑到研究生专业建设质量与本科专业建设质量具有高度一致性,本研究仍然使用具有权威性的学科评估结果对本科专业进行强弱界定。根据第四轮学科评估结果,“C+”及以上档级的专业在所有评估学科中排在前50%[20],因此本研究将“C+”及以上档级的专业界定为相对强势专业,将未参评专业界定为相对弱势专业。  表2为双向固定效应模型的回归结果,各回归均控制了相关控制变量与专业、年份固定效应,后续回归处理与此相同。回归1、2使用全部专业样本,回归3、4使用相对强势专业样本,回归5、6使用相对弱势专业样本。为了防止极端值对回归结果的干扰,回归2、4、6的样本中剔除了专业录取排名最小和最大0.1%的边缘样本。在回归1、2中,核心变量“新高考投档方式”的回归系数均显著小于0,这意味着在控制了相关控制变量及专业个体和年份的固定效应后,新高考投档方式的平均效应表现为提升本科专业的生源质量,由此说明研究假设3成立。回归3、4中核心变量的回归系数亦显著小于0,说明相对强势专业在改革后生源质量有所提升。由于相对强势专业是高偏好专业的表征,因此,可以认为新高考投档方式提升了高偏好专业的生源质量,由此说明研究假设1成立。与相对强势专业回归结果形成鲜明对比的是,回归5、6的结果显示相对弱势专业在改革后生源质量没有显著变化。考虑到相对弱势专业是低偏好专业的表征,可知较之低偏好专业,新高考投档方式更有利于高偏好专业的生源竞争,由此说明研究假设2成立。4.2 稳健性检验  为进一步检验基准分析结论的稳健性,采用更改专业生源质量衡量方法、更改可比性调整方案两种方式进行二次检验。  首先是更改生源质量衡量方法。基准分析中,因变量专业生源质量以专业录取最低分对应的省(市)排名即专业录取排名来衡量,稳健性检验1对应更改以专业相对录取排名来衡量。所谓专业相对录取排名由专业录取排名除以高考省(市)当年考生人数,反映录取排名值在该省(市)所有考生中的相对位置。相对应的,回归模型中院校录取最低与最高排名也类似处理,更改为相对指标。执行上述更改后重新对双向固定效应模型进行回归,核心变量回归系数的正负与显著性没有变化。  其次是更改可比性调整方案。在基准分析中,对“3+3”省(市)改革前的排名值以多线调整方案调整,稳健性检验2对应更改为以本科线作为等值线的单线调整方案调整。更改可比性调整方案后重新对双向固定效应模型进行回归,结果显示:全部专业样本与相对强势专业样本回归的核心变量回归系数显著小于0;相对弱势专业样本回归的核心变量回归系数不显著。  综上,两种稳健性检验的分析结果与基准分析结果一致,即与基准分析结论相同。4.3 异质性分析4.3.1 对不同学科专业生源质量的影响  考虑到部分学科门类专业样本量有限,本研究对专业的学科分类进行以下调整:1)合并哲学、文学、历史学、艺术学学科门类为“人文”学科;2)合并经济学、管理学学科门类为“经管”学科;3)单列法学类专业类为“法学类”学科,将法学学科门类下的其余专业(包括政治学类、社会学类、民族学类、马克思主义理论类、公安学类专业)与教育学学科门类合并为“其他社科”学科;4)其余专业学科分类保持不变。针对调整后的学科专业进行分样本回归,结果见表3。从表中可以看出,新高考投档方式对不同学科专业的生源质量存在异质性的影响:理学专业的生源质量因改革而降低,经管、工学、医学专业的生源质量因改革而提升,人文、法学类、其他社科、农学、实验班专业的生源质量并没有受到改革的显著影响。4.3.2 对不同专业类专业生源质量的影响  为了更加细致地考查新高考投档方式对特定专业类专业生源质量的异质性影响,对不同专业类分样本进行探索性分析,结果见表4。 表4呈现了部分具有代表性的回归结果,大致可以分为两类。第一类为高偏好专业类,如回归16~22中的公共卫生与预防医学类、建筑类、航空航天类、临床医学类等,这些专业类的专业生源质量有所提升,且提升的幅度超过所属学科的平均水平。第二类为低偏好专业类或传统专业类,如数学类、物理学类、化学类、交通运输类、纺织类专业等,其中部分专业类所属学科在改革后整体生源质量有所提升,但其专业生源质量并没有显著提升,甚至受改革影响而有所下降。可见,不论改革产生何种方向的影响,高偏好专业在生源竞争中总是处于相对优势地位,而一些低偏好专业、传统专业即使在整体利好的政策环境中也无法改变竞争弱势的境况。上述回归结果在一定程度上证明研究假设2成立。4.3.3 对不同选科要求下专业生源质量的影响  新高考改革前,在“3+文综/理综”的考试科目模式下,专业的选科要求或者全文、全理,或者不限选科。新高考改革后,专业选科要求更加多元,可分为不限选科、必选一门、必选多门。为了考察改革对不同选科要求下专业生源质量的异质性影响,本研究对不同选科要求的专业进行分样本回归。  表5中回归30~32为不限选科、必选一门、必选多门三类选科要求专业的回归结果。从回归结果可以看出,新高考投档方式可以提升选科要求为不限选科或必选一门的专业的生源质量,但选科要求为必选多门的专业,其生源质量有所下降。进一步分析特定选科要求专业生源质量受改革的影响。回归33~35为须选物理专业的回归结果,其中:回归33的系数不显著,说明对于要求选考物理的专业,改革的平均效应表现为对其生源质量没有显著影响;回归34的结果说明选科要求为必选一门且必选为物理的专业,生源质量因改革而有所提升;回归35的结果说明选科要求为必选多门且必选包括物理的专业,生源质量因改革而有所下降。回归36~38为须选化学的专业的回归结果。对于要求选考化学的专业,改革的平均效应表现为降低其生源质量;选科要求为必选一门且必选为化学的专业,生源质量并未因改革而有显著变化;选科要求为必选多门且必选包括化学的专业,生源质量会因改革而有所下降。从回归34、35、37、38的结果可知,不论必选物理还是化学,“必选多门”类专业的生源质量在投档方式变化后下降。由此说明,选考科目要求相对更加严格的专业,其生源质量更易在改革中受到冲击。5 结论与建议  本研究以2016—2021年15省(市)的高考录取数据为基础,利用各省(市)改革进度差异所形成的自然实验机会,通过双向固定效应模型分析更加系统地考察投档方式变化对本科专业生源质量所产生的影响。5.1 研究结论  第一,新高考投档方式不仅提升了高偏好专业的生源质量,也提升了本科专业整体生源质量的平均水平。事实上,在高招录取分省(市)定额的制度下,如果没有大规模的扩招或缩招,专业生源竞争是零和博弈,不可能所有专业的生源质量均有所提升。根据本研究建立的考生—专业匹配模型可知,考生专业偏好释放、保守填报行为减少不仅可以提升高偏好专业的生源质量,还可以使低偏好专业的生源质量保持相对稳定,因此可以使专业整体生源质量的平均水平上升。在这一过程中,低偏好专业的录取最高分下降,这意味着投档方式变化对高偏好专业的利好是以牺牲低偏好专业的生源为代价,因此仍然是零和博弈。  第二,改革后不同专业生源质量的变化方向并不相同,高偏好专业在生源竞争中更具优势。本研究分析发现,相对强势的专业在改革后生源质量有所提升,而相对弱势专业的生源质量没有显著变化;经管、工学、医学专业的生源质量因改革而提升,理学专业的生源质量有所降低,人文、法学类、其他社科、农学、实验班专业的生源质量没有显著变化;公共卫生与预防医学类、建筑类、航空航天类、临床医学类等高偏好专业的生源质量有所提升,且提升幅度超过所属学科的平均水平;而数学类、物理学类、化学类、交通运输类、纺织类等专业的生源质量不仅没有显著提升,甚至受改革影响而有所下降。  第三,选考科目要求相对更严格的专业,其生源质量更容易在改革中受到冲击。改革之初,教育行政主管部门为了鼓励高校发挥招生自主权,并未对专业的选科要求作详细、严格的限定。但在改革实践中,由于担心考生会优先选择选科要求较宽松的专业,从而导致选科要求严格的专业生源数量、质量下降[21-22],一些高校因此故意降低计划招生专业的选科要求,甚至不作任何限制[23-24],尤其是那些缺乏“名校”光环的高校,即使希望科学设置选科要求,也可能出于规避招生风险的考虑而被动采取跟随策略。本研究通过实证分析证实,严格选考科目要求的确会造成专业生源质量的下降,因此高校的顾虑也并非杞人忧天。5.2 专业发展建议  首先,应加强基础学科专业生源质量的监测与支持。本研究发现,数学类、物理学类、化学类等基础学科专业的生源质量受改革影响而有所下降。基于发达国家的实证研究可知,数理等基础学科专业在人力资本积累上较其他专业具有更高的正外部性,对促进经济增长与创新具有重要意义[25-26]。这类专业生源质量的持续下滑必将给国家的教育、人才与科技发展战略带来消极影响,因此,要在生源质量监测的基础上予以必要的政策支持。例如,政府可以通过强基计划、基础学科拔尖学生培养计划、“双一流”建设等政策对重点学科专业予以资源倾斜;同时在政策上引导高校分类发展,完善专业的评价、整改、退出机制,将国家、社会急需的专业办精办好。高校也需要加强专业布局调整与专业建设,主动与高中合作,向高中生普及更多的专业背景知识,辅助他们做好专业与职业规划,避免在志愿填报时盲目追求所谓的热门专业[27]。  其次,高校在设置专业的选考科目要求时,要平衡生源质量与学科发展之间的关系。目前,教育部印发的《普通高校本科招生专业选考科目要求指引》已经更新至第三版,意在引导高校设置合理的选科要求,在政策允许范围内平衡生源质量与学科发展之间的关系。对高校而言,无论选择哪些学科作为招生专业的选考科目要求,权衡取舍的前提与关键是切实论证招生专业的必要学科素养。本研究通过实证分析发现,新高考投档方式可以提升“不限选科或必选一门”的专业生源质量,但“必选多门”尤其是必选科目中包含物理或化学的专业生源质量会有所下降。因此,从招生录取策略角度分析,“必选一门”的方式是较好的选择,因为它在保证专业生源拥有必要学科素养的同时,还可以保证生源质量不会受到显著的消极影响。  最后,国家教育行政主管部门应进一步规范高校以热带冷策略工具的使用。高校为了保护冷门、弱势等低偏好专业的生源,在新高考投档规则的框架内常以大类招生的方式将冷热门专业“捆绑销售”。例如部分高校以实验班、精英班等大类专业作为招生噱头,将冷热门专业简单拼凑合并招生,行策略招生之举而无大类培养之实[28]。事实上,通过赋予考生更多的选择权,倒逼高校重视学科建设与专业结构优化本是新高考改革的初衷,但以热带冷策略工具的过度使用却极大浪费了国家的政策资源,提高了改革成本。因此,国家教育行政主管部门亟须出台相关指引文件,规范高校的大类招生行为,厘清高校自主权的边界,让相关规则的应用回归初心。 参考文献:(略)(免责声明:本文转载于《中国考试》,文章观点与本栏目无关,如涉侵权,联系立删!)

家庭社会经济地位对初中生学业成绩的影响

2023-12-20

原文刊载于《中国考试》2023年第11期第85—94页。作 者杨莉,清华大学教育研究院在读博士生。 摘 要:我国目前已基本实现义务教育有保障的目标,但仍然存在教育结果不公平的问题。基于中国教育追踪调查2013-2014学年的基线数据,分析家庭社会经济地位对初中生学业成绩的影响,以及父母监管、亲子交流、家长与学生朋辈群体互动、父母对子女的教育期望这4类家庭非货币性资源投入在两者之间的中介作用。研究发现:家庭社会经济地位能够显著正向预测初中生的学业成绩;4类家庭非货币性资源投入在两者间均发挥部分中介作用,能够降低家庭社会经济地位差距造成的初中生学业成绩差异。本研究可为初中阶段教育公平相关政策的制订提供参考依据,以期推动我国初中后阶段教育公平目标的实现。关键词:家庭社会经济地位;初中生学业成绩;家庭非货币性资源投入;考试公平1 问题提出  2010年,中共中央、国务院印发《国家中长期教育改革和发展规划纲要(2010—2020)》,明确提出“形成惠及全民的公平教育”的战略目标[1]。截至2019年底,全国99.8%的义务教育学校(含教学点)的办学条件已达到基本要求[2]。根据国务院新闻办公室2021年8月印发的《全面建成小康社会:中国人权事业发展的光辉篇章》白皮书,农村贫困家庭子女义务教育阶段辍学问题已实现动态清零[3]。  2020年,我国已基本实现义务教育有保障的目标[4],但教育结果不公平的现象仍然存在,且主要表现在家庭背景等先赋性因素对学生学业成绩及教育机会获得的显著影响[5-6]。相较于高中及高中后教育阶段,初中阶段学业成绩与家庭背景的关系更值得探讨。这主要有3方面原因:其一,在我国现行招生考试制度下,无论是中考还是高考,考试分数都是后一阶段教育机会和教育质量的重要影响因素;其二,学业成绩具有累积性特征,义务教育阶段的学业成绩能够显著预测中考与高考成绩,高等教育阶段的不平等通常是初中升高中阶段不平等的延续[7];其三,随着教育阶段的上升,家庭社会经济地位、家庭文化背景对教育获得的影响逐渐减弱,有研究提出家庭因素对中考阶段的影响大于高考阶段[8]。在这一社会背景下,研究家庭背景等先赋性因素对初中生学业成绩的影响及其作用机制,其结论不仅可以促进初中阶段的教育公平,甚至能够为优化教育全局环境提供参考。  家庭背景主要通过增加对子女的货币性与非货币性资源投入这两条路径影响学生学业成绩[9],其中,非货币性资源投入的可塑性更强,更应获得学者与政策制定者的关注。具体而言,高家庭货币性资源投入表现为,为孩子购置更好的学习产品、通过购买学区房等方式让孩子进入条件更好的学校等。家庭对子女的货币性资源投入力度受到家庭经济条件的约束,不同家庭经济背景学生所获得的该投入差异悬殊。高家庭非货币性资源投入表现为,为孩子付出更多时间、为子女提供情感支持、对子女具有较高教育期望、采取更合理的养育方式等。有研究发现,虽然家庭社会经济地位是预测父母对子女教育投资的重要因素,但养育子女的方式并不完全取决于这种地位,父母的价值观更能决定他们对子女教育的参与[10]。另一项研究结果表明,与货币性资源相比,非货币性资源对中国儿童的成就影响更大,而且与家庭财富或收入不显著相关[9]。因此,基于非货币性资源投入视角的相关研究发现对制订促进教育公平的政策可能更有参考意义。基于此,本研究主要关注家庭社会经济地位、家庭非货币性资源投入与学业成绩三者之间的关系,并试图回答以下两个问题:1)家庭社会经济地位对初中生学业成绩的影响如何;2)各类家庭非货币性资源投入能否在家庭社会经济地位与初中生学业成绩间发挥一定的中介作用。2 文献综述2.1 家庭背景对学业成绩的直接影响  关于家庭背景对学业成绩影响的研究,可追溯到美国社会学家Coleman等于1966年发布的《教育机会均等》(Equality of Educational Opportunity)报告。该研究发现,在排除很多其他家庭因素的情况下,仅是父母受教育程度、家庭拥有物、父母对子女的教育期望等家庭层面的因素就已经能够解释子女学业成绩10%~25%的变异[11]。这一结论引起了研究者对家庭层面因素的广泛关注。此后,一系列实证研究支持了Coleman的结论,并进一步探究了其他家庭背景因素对成绩的影响。浦小松分析我国14418名中学生样本发现,父母受教育程度对子女成绩的正向影响显著,父母从事职业类型对子女成绩的影响较小[12]。李佳丽和何瑞珠基于中国教育追踪调查(China Education Panel Survey, CEPS)2013-2015年追踪数据的研究发现,经济状况好、父母职业地位以及父母受教育水平高的家庭的子女,其语文、数学、外语3科平均成绩显著高于弱势家庭子女,例如,富裕家庭子女的平均成绩比困难家庭子女高出10分左右[13]。Dahl和Lochner分析了美国青少年纵向调查数据库的4500名儿童和母亲的配对数据,发现家庭收入每增加1000美元,子女数学成绩与阅读成绩合计将提高标准差的6%[14]。除上述显著影响学业成绩的家庭层面变量之外,家庭社会经济地位这一衡量家庭背景的综合指标也对学生成绩具有显著影响。已有研究发现,家庭社会经济地位越高的学生,其学业成绩越好[15-16]。2.2 家庭背景对学业成绩的间接影响  已有文献不仅分析了家庭背景对学业成绩的直接影响,还从家庭投入等视角探究了其间接作用机制。倪雨菡等分析广州市12所中学500多名初三学生的样本发现,家庭学习资源、课堂参与在家庭社会经济地位与初中生阅读成绩间起着双重中介作用[17]。基于CEPS 2014年数据,薛海平探究了家庭资本影响教育获得的双通道机制,发现家庭资本能够同时通过学校教育机会优势与教育培训机会优势提升初中生在校成绩,进而影响初中生的高中及高等教育机会获得[18]。Long和Pang对来自我国5个城市约5000名九年级学生样本的研究结果表明,社会经济地位的3个组成部分(家庭拥有物、家庭教育资源和父母受教育程度)通过父母对子女的教育期望这一中介变量,对学生的数学成绩和问题解决能力(problem-solving achievement)产生显著影响[19]。李忠路和邱泽奇基于中国家庭跟踪调查2010年基线调查数据的研究发现,教育机会差异(包括体制内的重点学校与市场上的校外补习服务)和家长教育参与是家庭背景影响儿童学业成就的两条路径[20]。陈依婷和杨向东通过对某省会城市1000多名八年级学生数据的分析发现,亲子沟通与学业自我效能感均在家庭社会经济地位与数学成绩之间起部分中介作用[21]。Bae和Wickrama以441名12-14岁的韩国青少年为分析对象,发现父母监管和青少年的校外时间使用模式是家庭背景影响学生学业成绩的中介变量[22]。  综上所述,家庭层面的货币性资源投入(如家庭学习资源投入、为子女报补习班)及非货币性资源投入(如父母监管、亲子沟通)都会在家庭背景与学生学业成绩间发挥中介作用,这些发现为本研究的模型设定提供了重要依据。同时,在以下方面还有待进一步探讨:第一,国内部分研究的数据采集于某一个或某几个城市,从而导致样本的全国代表性相对较差;第二,在衡量学生学业成绩时,国内部分研究采用了家长报告的学生成绩等级或改编自国际学生评估项目(Program for International Student Assessment, PISA)问卷得到的成绩数据,前者的主观性太强,可能存在较大测量误差,而后者得到的成绩与学校考试成绩并不能完全等同,学校考试成绩或排名才是决定学生能否获得下一教育阶段入学机会的关键;第三,目前还没有文献将多个家庭非货币性资源投入变量纳入同一分析框架,但相较于家庭货币性资源投入,对家庭非货币性资源投入的干预或改善更为容易。鉴于此,本研究将基于具有全国代表性的CEPS数据,以学校提供的期中考试成绩为因变量,从家庭非货币性资源投入的视角,分析家庭社会经济地位对初中生学业成绩的影响,以及父母监管、亲子交流、家长与学生朋辈群体互动、父母对子女的教育期望等因素在两者之间的中介作用。3 研究设计3.1 数据来源  本研究数据主要来自CEPS 2013-2014学年的基线数据,该调查由中国人民大学中国调查与数据中心设计并组织实施。CEPS基线调查按多阶段的概率与规模成比例的抽样方法,在全国范围内抽取了112所学校、438个初中班级。入样班级的全体学生及家长、3门主科教师、班主任以及所在学校领导均被作为调查对象,最终获得近20000名初一与初三学生样本。问卷内容涵盖学生个人的基本信息、学业表现、教育经历、家庭以及学校等层面的信息,能够满足本研究主题的需要。根据本研究设计,将具有缺失变量的样本进行了删除,最终得到的有效样本为16742名初中生。3.2 变量说明3.2.1 因变量  研究因变量是2013年秋季学期学生的语文、数学以及英语3门主科的平均成绩。CEPS数据库记录了由受访学校直接提供的3门主科成绩的原始分,以及按学校与年级对3门主科原始分分别进行标准化处理后的得分。由于本研究采用的分析模型控制了班级固定效应,这一模型估计策略使得由受访学校提供的原始分同样具有可比性[23]。因此,最终采用3门主科的原始分,并对其取均值得到本研究的因变量。3.2.2 自变量  研究自变量为家庭社会经济地位。由于父母职业、学历以及家庭经济状况等因素具有高度相关性,将其通过因子分析等方法进行降维处理在理论上是可行的;且目前国际上相对成熟的基础教育质量评估项目,如PISA也采用家庭社会经济地位这一指标衡量学生家庭背景。因此,为简化模型,借鉴PISA的做法将家庭社会经济地位作为家庭背景的代理变量。具体而言,参照任春荣的分类[24],对父母最高受教育程度、父母最高职业、学生家庭经济状况、家庭藏书变量进行因子分析,得到家庭社会经济地位变量,结果显示KMO值为0.71,Bartlett’s球形检验的p值小于0.001,表明上述4个变量适合做因子分析。3.2.3 中介变量  研究主要讨论家庭非货币性资源投入在家庭社会经济地位与学业成绩之间的中介效应,因此,选取父母监管、亲子交流、家长与学生朋辈群体互动以及父母对子女的教育期望等4项作为中介变量。  参照Mu和Hu的研究[25],父母监管变量根据学生问卷中的以下8个题目构建:“你的父母在以下事情上管你严不严:作业、考试,在学校表现,每天上学,每天几点回家,和谁交朋友,穿着打扮,上网时间,看电视的时间。”所有题目的选项均为“不管”“管,但不严”“管得很严”,分别计为1分、2分、3分,并取8个题目得分的均值作为父母监管变量得分;得分越高,表明父母的监管力度越大。  根据李佳丽和胡咏梅的研究[26],亲子交流变量的构建综合了学生问卷中的5个题目:你父母是否经常与你讨论以下问题,分别是“学校发生的事情”“你与同学的关系”“你与老师的关系”“你的心情”“你的心事或烦恼”。所有题目的选项均为“从不”“偶尔”“经常”,分别计为1分、2分、3分,并取5个题目得分的均值作为亲子交流变量得分;得分越高,表明亲子交流越频繁。  参考周东洋和吴愈晓的做法[27],家长与学生朋辈群体互动这一变量来自家长问卷中的两道题目,分别是“您认识与孩子常在一起的朋友吗?”“您认识与孩子常在一起的朋友的家长吗?”。两个题目的选项均为“不认识”“认识一部分”“全部认识”,分别计为0分、1分、2分,并取两个题目的得分之和作为家长与学生朋辈群体互动变量得分;得分越高,表明家长与学生朋辈群体互动越多。  父母对子女的教育期望这一变量来自家长问卷中的题目“您希望孩子读到什么程度?”。借鉴张阳阳和谢桂华的变量定义方式[28],将答案选项中的“受教育程度”转换为“受教育年限”,具体转换方式为:初中毕业=9年,中专/技校/职业高中/普通高中=12年,大学专科=15年,大学本科=16年,硕士研究生=19年,博士研究生=23年。经过上述转换后,父母对子女的教育期望的取值范围为9~23,是连续型变量。3.2.4 控制变量  在个人层面,研究控制了学生性别(男生=1,女生=0)、年龄(连续型变量)、是否独生子女(是=1,否=0)、是否住校(是=1,否=0)以及户口类型(农业户口=1,非农户口=0)。此外,还控制了班级固定效应,目的是尽可能降低学校与班级层面的不可观测变量对学业成绩的影响。控制班级固定效应的具体做法为:先将学生所在班级这一多类别变量转化为多个虚拟变量,然后将其中一个虚拟变量作为参照组不纳入模型,将其他班级虚拟变量全部纳入回归模型。3.3 分析策略  借鉴温忠麟和叶宝娟在论文中提到的逐步法[29],通过构建方程(1)-(3),检验家庭非货币性资源投入的中介效应。此外,由于研究的中介变量与因变量均为连续型变量,因此采用普通最小二乘法估计方程(1)-(3)的回归系数。  Score=β0+cSES+β1I+θ+e1        (1)  M=α0+aSES+α1I+θ+e2             (2)  Score=γ0+c'SES+bM+γ1I+θ+e3(3)  方程(1)主要分析家庭社会经济地位与学业成绩的关系。其中,Score是因变量,表示学生学业成绩;SES是核心解释变量,表示学生的家庭社会经济地位,系数c表示家庭社会经济地位对学业成绩的总效应;I表示个体层面的控制变量;θ是班级固定效应;e1是随机误差项。  方程(2)用于分析家庭社会经济地位与中介变量的关系。其中,M表示中介变量,分别是父母监管、亲子交流、家长与学生朋辈群体互动以及父母对子女的教育期望;系数a是在控制了其他变量的影响之后,家庭社会经济地位对中介变量M的效应,研究将对4个中介变量分别进行回归分析,其他变量的含义与方程(1)相同。  在方程(3)中,系数b是在控制家庭社会经济地位及其他变量的影响之后,中介变量M对学业成绩的效应;系数c'则是在控制中介变量M与其他变量的效应之后,家庭社会经济地位对学业成绩的直接效应。中介效应等于系数a与b的乘积,总效应c、直接效应c'与中介效应ab的关系为:c=c'+ab。4 研究结果4.1 描述统计结果  研究首先以家庭社会经济地位的均值为界将全样本分成两组,其中低于均值的样本属于低家庭社会经济地位组,高于均值的样本则属于高家庭社会经济地位组,然后采用独立样本t检验分析不同家庭社会经济地位学生在学业表现以及家庭非货币性资源投入方面的差异。结果如表1所示,可以看到,所有学生的平均成绩是81.422分,家庭经济社会地位高于均值的学生(以下简称“高家庭社会经济地位学生”),其学业成绩显著优于家庭经济社会地位低于均值的学生(以下简称“低家庭社会经济地位学生”),前者比后者高13.666分。与学业成绩的检验结果一样,高家庭社会经济地位学生在4类家庭非货币性资源投入方面的得分也都高于低家庭社会经济地位学生,并且这种差异均具有统计显著性。例如,高家庭社会经济地位学生的父母监管得分为2.375,比低家庭社会经济地位学生(2.313)高0.062,达到显著性差异水平。      在学生个人特征方面,所有样本的平均年龄约为14岁,男女比例相等,有32%的学生在学校寄宿,44%的学生属于独生子女,农业户口学生占比为55%。4.2 家庭社会经济地位对初中生学业成绩的回归结果  研究采用逐步法分析家庭社会经济地位对初中生学业成绩的影响,并检验家庭非货币性资源投入在两者间的中介作用。  方程(1)和方程(3)的回归分析结果如表2所示。其中,模型(1)为基准模型,在控制了班级固定效应以及个人层面因素的情况下,家庭社会经济地位对初中生学业成绩具有显著的正向影响。家庭社会经济地位每提高1个单位,初中生学业成绩显著提高2.653分,即方程(1)中的系数c显著。模型(2)至模型(5)分别在模型(1)的基础上,加入了父母监管、亲子交流、家长与学生朋辈群体互动、父母对子女的教育期望。可以发现,这4个中介变量均对学生学业成绩具有显著正向影响,表明方程(3)中4个中介变量的系数b都显著。此外,这些中介变量均能够降低回归模型中家庭社会经济地位的回归系数,并且父母对子女的教育期望这一变量使家庭社会经济地位的系数下降幅度最大,由2.653降至1.869。由此能够推测,在4个中介变量中,父母对子女的教育期望的中介效应最大。4.3 中介效应检验结果  方程(2)的回归结果如表3所示,可以看出,在控制个人层面因素及班级固定效应之后,家庭社会经济地位能够显著提高父母监管力度、亲子交流频率、家长与学生朋辈群体互动程度以及父母对子女的教育期望,即方程(2)中的系数a均显著。根据逐步法的检验原理,因为系数a与b均显著,表明本文的中介效应均显著。此外,当系数a与b均显著时,逐步法的检验效力要高于Bootstrap法,因而不再采用Bootstrap法进行中介效应检验。同时,由于方程(3)中分别加入4个中介变量得到的系数c'也都显著,说明这4个中介变量均起着部分中介作用。      表4呈现了4个中介变量的总效应、各个中介变量的直接效应、中介效应以及中介效应占总效应比值。由表4可知,家庭社会经济地位对初中生学业成绩的总效应为2.653;在家庭非货币性资源投入这4个中介变量中,父母对子女的教育期望这一变量的中介效应最强,占总效应的29.53%,验证了前文的推测,其次是亲子交流,占总效应的9.64%,而家长与学生朋辈群体互动和父母监管的中介效应相对较弱,分别占总效应的2.39%和0.87%。5 研究结论与讨论  本研究基于CEPS 2013-2014学年的基线数据,以家庭社会经济地位作为指代家庭背景的变量,分析其对初中生学业成绩的影响,以及4类家庭非货币性资源投入因素在两者之间的中介作用,得到如下结论:  第一,不同家庭社会经济地位初中生的学业成绩以及家庭非货币性资源投入存在显著差异。独立样本t检验结果表明,高家庭社会经济地位学生的学业成绩显著优于低家庭社会经济地位学生;此外,与低家庭社会经济地位学生相比,高家庭社会经济地位学生的父母对子女的监管更加严格,与子女的交流更加频繁,与子女朋辈群体的互动更多,并且对子女抱有更高的教育期望。这与已有相关研究结论基本一致,即低家庭社会经济地位初中生在学业成绩与家庭非货币性资源投入方面具有双重劣势地位。  第二,家庭社会经济地位、家庭非货币性资源投入均对初中生学业成绩具有显著的正向影响。家庭社会经济地位越高,学生学业成绩越好,表明取样时我国教育不公平问题较为突出。此外,从4类家庭非货币性资源投入来看,父母监管对学生学业成绩的影响显著为正,可能的解释是,父母对子女“作业、考试”“在学校表现”等方面的严格要求,能够使子女了解家长的标准,从而端正学习态度,而良好的学习态度有利于学生学业成绩的提升[30]。此外,亲子交流也能够显著提升子女成绩,结合已有研究发现,亲子交流可能通过影响子女的学业自我效能感[31]、自我控制能力和学校适应能力[32],从而间接影响子女成绩。与父母监管、亲子交流对子女成绩的影响类似,家长与学生朋辈群体互动同样能够显著正向预测子女成绩;不同之处在于,父母监管、亲子交流这两类家庭非货币性资源投入是父母与子女双方之间的互动,而家长与学生朋辈群体互动则是父母与孩子的朋友,以及与孩子朋友的家长之间的互动。以往研究发现,父母与孩子朋友及其家长的互动越多,学生参与补习的可能性越大、家庭补习花费也越高[27];且大部分研究表明,适当的补习有利于提高学生成绩[33-34]。因此,家长与学生朋辈群体互动可能通过家庭对子女的货币性资源投入这一途径影响子女成绩。与前3类家庭非货币性资源投入的作用一样,父母对子女的教育期望越高,则学生学业成绩越好,其背后的原因可能是,随着父母对子女教育期望的提高,子女自身的教育期望、子女的学习时间,以及家庭货币性资源投入也会相应提高或增加[35-36],这些因素都能够提升子女的成绩。总体来看,4类家庭非货币性资源投入可能主要通过影响学生个人层面的因素(如学习态度、学业自我效能感)与家庭货币性资源投入,进而影响学生成绩。  第三,家庭非货币性资源投入在家庭社会经济地位与初中生学业成绩间发挥着部分中介作用。一方面,家庭社会经济地位能够直接提高初中生学业成绩;另一方面,家庭社会经济地位较高家庭还会通过增加家庭非货币性资源投入,包括父母监管力度、亲子交流频率、家长与学生朋辈群体互动,以及父母对子女的教育期望,从而间接提升初中生学业成绩。关于这些家庭非货币性资源投入影响成绩的具体路径,前文结合以往研究发现和本研究对中介变量的操作化定义进行了较为详细的分析,此处不再赘述。  第四,父母对子女的教育期望这一变量的中介效应最大,其次是亲子交流,而家长与学生朋辈群体互动、父母监管的中介效应相对较小。从中介效应占总效应的比值来看,父母对子女的教育期望能够中介将近30%的家庭社会经济地位对学业成绩的影响;亲子交流次之,为10%左右;排名第3的是家长与学生朋辈群体互动,为2.39%,父母监管的中介效应最小,仅为0.87%。  综上所述,初中生学业成绩受到家庭社会经济地位等先赋性因素的显著影响,家庭非货币性资源投入能够在一定程度上降低家庭社会经济地位对学业成绩的正向影响。这些研究发现对促进教育结果公平的政策具有一定的参考价值:一方面,应该重点帮扶家庭社会经济地位较差学生,以降低家庭背景因素带来的学业表现差异;另一方面,推动家庭教育指导服务中心建设,引导弱势家庭父母适当提高对子女的教育期望、加强与子女及其同辈群体的互动与沟通以及对子女的监管。  本研究存在以下不足:其一,研究使用的是截面数据,所以只能分析变量间的相关关系,无法确定某些影响路径的因果关系;其二,研究对家庭非货币性资源投入影响学业成绩的机制的探讨只是初步的、探索性的,有待采用实证数据对其进行检验;其三,家庭非货币性资源投入的中介效应可能受到教师、学校层面因素的调节作用[37-38]。因此,在后续研究中,可以采用追踪数据,分析家庭非货币性资源投入等因素在家庭社会经济地位与初中生学业成绩间的链式中介作用,以及有调节(如教师、学校层面因素)的中介作用。 参考文献:(略)(声明:本文选自《中国考试》,版权归属原作者,文章观点与本栏目无关,如涉侵权,联系立删!)