2022-10-08
精彩回顾 | 《中国高考评价体系》解读系列文章③中国考试 2022-09-22 16:53 发表于北京基于高考评价体系的数学科考试内容改革实施路径摘要 高考评价体系是新时代高考内容改革的理论支撑和实践指南。以高考评价体系为指导,在明确高考数学科功能定位的基础上,确定考查理性思维、数学应用、数学探索、数学文化4类学科素养,考查逻辑思维能力、运算求解能力、空间想象能力、数学建模能力、创新能力5种关键能力,提出具有学科特点的基础性、综合性、应用性、创新性的考查要求,通过设置课程学习情境、探索创新情境、生活实践情境3类试题情境落实考查内容和考查要求。高考评价体系对指导高考数学内容改革具有重要意义。正文党的十九大提出“全面贯彻党的教育方针,落实立德树人根本任务”。习近平总书记在全国教育大会上进一步强调,要努力构建德智体美劳全面培养的教育体系,形成更高水平的人才培养体系,要把立德树人融入教育各环节,贯穿教育各领域。高考上承高等教育,下连基础教育,是教育的重要环节,起到纽带与桥梁的作用。因此,在落实立德树人根本任务的过程中,必须最大程度地发挥其作用,一方面为国家、为高校选拔合格人才,另一方面引导中学教学,助力优秀人才的培养。 高考评价体系是新时代高考内容改革和命题工作的理论支撑和实践指南。学科考试内容改革必须以高考评价体系为指导,同时要结合学科的实际,体现学科特色。在学科考试内容改革过程中,根据高校人才选拔要求和高中课程标准,科学设计考试内容,研究归纳具有学科特点的考试目标和考查要求,以科学、严谨的态度,系统深入地推进学科考试内容改革是高考的重点工作。 1 高考数学科内容改革的基础 2014年9月,国务院颁布《关于深化考试招生制度改革的实施意见》(以下简称《实施意见》),明确提出深化高考内容改革的方向:依据高校人才选拔要求和国家课程标准,科学设计命题内容,增强基础性、综合性,着重考查学生独立思考和运用所学知识分析问题、解决问题的能力。因此,新高考数学命题框架的建构基础是高考评价体系、高校人才选拔要求和国家课程标准。 1.1 高考评价体系 高考评价体系集中反映高校人才选拔的需求,推动和引导高考内容改革。高考评价体系的总体框架是“一核四层四翼”,其中:“一核”是高考的核心功能,即“立德树人、服务选才、引导教学”,回答“为什么考”的问题;“四层”为考查内容,即“核心价值、学科素养、关键能力、必备知识”,回答“考什么”的问题;“四翼”为考查要求,即“基础性、综合性、应用性、创新性”,回答“怎么考”的问题。“一核”是统领,“四层”与“四翼”是实现“一核”的具体路径,三者共同构成实现高考评价功能的理论体系。 1.2 高校人才选拔要求 随着教育水平提高和教育资源的不断丰富,高校的招生需求也在逐渐发生变化。2016年,全国各类高等教育在校总规模达到3699万人,高等教育毛入学率达到42.7%,预计到2020年高等教育毛入学率将达到50%,高等教育将进入普及化阶段。在这样的大环境下,高考的功能逐渐由原来的选拔少部分学生转变为对大部分学生进行层次区分。 《普通高等学校本科专业类教学质量国家标准》提出数学类专业人才的培养目标是:具有良好的道德、科学与文化素养,掌握数学学科的基本理论、方法与技能,能够运用数学知识和数学技术解决实际问题,能够适应数学与科技发展需求进行知识更新,能够在数学及相关领域从事科学研究,在科技、教育、信息产业等领域从事研究、教学、应用开发和管理等工作。高校人才培养目标和选拔要求是高考数学内容改革的重要依据。 1.3 课程标准 《普通高中数学课程标准(2017年版)》(以下简称《数学课程标准》)规定数学科的课程目标是:通过高中数学课程的学习,学生能获得进一步学习以及未来发展所必需的数学基础知识、基本技能、基本思想、基本活动经验;提高从数学角度发现和提出问题、分析和解决问题的能力。 《数学课程标准》提出数学学科核心素养,并明确数学教学要以发展学生的数学学科核心素养为基本导向。《数学课程标准》同时提出学业质量的要求,并明确评价要聚焦学生数学学科核心素养的形成和发展,促进学生在不同学习阶段数学学科核心素养水平的达成。学业质量的提出为高中阶段性评价、学业水平考试和高考命题提供了重要依据,有利于促进教、学、考的衔接,从而形成育人合力。《数学课程标准》是确定考试内容和考试要求的重要参考。 2 高考数学科内容改革的路径 2.1 高考数学科的功能定位 高考是连接基础教育与高等教育的关键环节,高考科目的设置、高考内容的选取,既对高校选拔高素质、多样化人才起到决定性作用,也对基础教育教学起着重要的导向和反拨作用。高考数学科的功能定位为:发挥数学学科特点,以测试数学综合能力、发展数学核心素养为目标,通过创新试卷结构与试题形式,更好地实现高考立德树人、服务选才、引导教学的核心功能。 2.2 数学科考查内容 2.2.1 核心价值 核心价值是指即将进入高等学校的学习者应当具备的良好政治素质、道德品质和科学思想方法的综合,是在各学科中起着价值引领作用的思想观念体系,是学生面对现实的问题情境时应当表现出来的正确的情感态度和价值观的综合。高考要解决“为谁培养人、培养什么人”这个根本性的问题,因此,高考评价体系以“立德树人”为统领,将“核心价值”放在首位,无论是高校人才的选拔需求还是基础教育的培养目标,都要求学生具有社会主义核心价值观、辩证唯物主义的世界观与为人民服务的人生观。 数学是培养理性思维的重要学科,有助于学生树立科学精神与科学态度,促进智力发展,促进思维能力、实践能力和创新意识的提升,有助于学生形成正确的人生观、世界观、价值观,对提高公民素质具有重要意义。要在高考中发挥数学科的独特价值引领作用,应该聚焦于能够表现出考生核心价值观、世界观与人生观的问题情境,体现高考的育人功能。2.2.2 学科素养 高考评价体系中的学科素养是指即将进入高等学校的学习者在面对生活实践或学习探索问题情境时,能够在正确的思想价值观念指导下,合理运用科学的思维方式与方法,有效地整合学科相关知识,运用学科相关能力,高质量地认识问题、分析问题、解决问题的综合品质,凝练为学习掌握、实践探索、思维方法3项内容。《数学课程标准》提出数学抽象、逻辑推理、数学建模、直观想象、数学运算、数据分析6类数学学科核心素养。在高考评价体系和《数学课程标准》的基础上,将高考数学考查的学科素养提炼为理性思维、数学应用、数学探索和数学文化。高考数学考查的学科素养、高考评价体系提出的学科素养、《数学课程标准》提出的数学科核心素养三者的关系如图1所示。相对于高考评价体系,高考数学考查的学科素养是对评价体系的学科化和具体化,具有数学的特点和数学考试评价的特点;相对于《数学课程标准》提出的核心素养,高考数学考查的学科素养更加概括和凝练。2.2.3 关键能力 关键能力是指即将进入高等学校的学习者在面对与学科相关的生活实践或学习探索问题情境时,有效地认识问题、分析问题、解决问题所必须具备的能力。关键能力是支撑高水平人才终身发展和适应时代要求的能力,是发展学科素养、培育核心价值所必须具备的能力基础,由知识获取能力群、实践操作能力群、思维认知能力群构成。 根据高考评价体系的整体框架,结合《数学课程标准》提出的学科核心素养,高考数学科提出5项关键能力:逻辑思维能力、运算求解能力、空间想象能力、数学建模能力和创新能力。其中:前4项关键能力具有鲜明的数学学科特点,是学生学习数学必须具备的能力,也是数学教学着力培养的、数学考试着重考查的能力;创新能力集中反映高考数学的学科特点,反映高校人才选拔的要求,反映国家选才的意志。高考数学科提出的5项关键能力是对以往高考数学学科能力结构的继承和发展,更是结合《数学课程标准》并根据高考测量的实际确定的,既具有理论基础又具备操作性。 学科素养是考查理念和总体要求,关键能力是学科素养的细化和具体体现。在命题中,关键能力是具体的考查目标,是实现学科素养考查目标的手段和媒介。2.2.4 必备知识 必备知识是指即将进入高等学校的学习者在面对与学科相关的生活实践或学习探索问题情境时,有效地认识问题、分析问题、解决问题所必须具备的知识。 数学科甄选必备知识的原则是有利于高考与课程标准的对接,有利于高考与中学教学的对接,有利于考生整体把握数学知识体系。高考数学科的知识体系与课程标准知识体系总体是一致的,基本按照知识的发展脉络编排,按不同数学分支分成相对完整的知识系统,每个系统包括若干单元;但是,高考更加注重知识的系统性、整体性和结构性,更加注重完整的知识脉络。《数学课程标准》将数学课程内容分为预备知识、函数、几何与代数、概率与统计、数学建模活动与数学探究活动5个主题,高考数学将其整合,按逻辑体系将分散在必修课程和选择性必修课程中相互衔接的内容组成有机的结构体系。例如,在函数部分,必修课程讲授函数的概念、图像、性质,幂函数、指数函数、对数函数等,选择性必修课程讲授一元函数导数,在设计高考数学考查内容时,将这些内容有机整合,组成完整的函数系列知识。 2.3 数学科考查要求 高考评价体系提出的“四翼”考查要求,是从国家人才强国战略出发,结合高校人才需求提出的,着重体现了国家未来发展所需应用型和创新型人才的培养要求,是高考各科考试的共同要求。数学科考试根据学科特点,细化共同要求,制定了学科化的考查要求,具有鲜明的学科性和时代性。 高考数学的基础性强调数学的通用性和工具性,关注学生未来工作、学习必须具备的知识基础和学科主干内容,通过全面系统地考查核心概念、基本原理、基本方法,使学生形成牢固的知识根基,掌握解决问题的工具。高考数学的综合性强调融会贯通,强调各分支内容和学科之间的联系,既包括学科知识的内部联系,也包括与其他学科的紧密结合,促进学生从整体上建构知识框架,形成合理的认知结构。高考数学的应用性强调学以致用,将抽象的数学概念与实际生活相结合,运用数学知识、思想和方法对实际问题进行分析与研究,进而解决问题,通过联系生产生活实际的试题情境设计,考查学生有效解决实际问题的方法和能力。高考数学的创新性强调对知识的灵活运用,通过命制开放性试题、结构不良试题,发挥选拔功能。 为落实“四翼”考查要求,高考数学科的考试设计应:1)注意学科间的渗透和交叉,适当增加具有自然科学和社会人文学科情境的试题,促进学科间的融合以及对核心素养的有效考查;2)关注探究能力、数学学习能力的考查,通过创新题型,对学生的创新能力进行考查;3)通过调整试卷结构,打破固有模式,探索试题排列新方式,努力破除复习备考中题海战术和套路训练的影响。 2.4 数学科考查载体 试题情境是实现考查内容和考查要求的载体。情境化试题是指提供一定的情境型材料,要求学生在充分理解材料的基础上,寻求解决问题的途径。情境化试题更能深刻、精准地反映学生分析问题、解决问题的能力。根据数学学科的特点,高考数学的试题情境可分为课程学习情境、探索创新情境、生活实践情境3类。 数学课程学习情境包括数学概念建构、数学原理习得、数学运算学习、数学推理学习等问题情境,关注已有知识的基础和准备程度;数学探索创新情境包括推演数学命题、数学探究、数据分析、数学实验等问题情境,关注与未来学习的关联和数学学科内部的更深入的探索:这2类情境是考查学生数学基础和数学抽象的重要载体,指向考查学生理性思维素养和数学探究素养,为高校选才提供关于学生应对大学数学学习准备程度的依据。生活实践情境是需要考生将问题情境与学科知识、方法建立联系,应用学科工具解决问题;生活实践情境关注与其他学科和社会实践的关联,是考查学生数学应用素养、理性思维素养和数学文化素养的重要载体。 3种问题情境在高考数学中将发挥不同的作用:以课程学习情境为检验基础的量尺,以探索创新情境为区分甄选的手段,以生活实践情境为拓展应用的渠道。在保持课程学习情境试题占一定比例的前提下,增加探索创新情境和生活实践情境试题的比例,以更好实现学科素养和关键能力的考查目标。 3 结束语 高考评价体系在制定过程中,广泛听取数学专家、数学课程标准研制与修订专家、考试命题专家、一线教师与教研人员的意见,并通过问卷调查了解相关各方面专业人员的意见和建议;同时命制基于评价体系的高考试测卷,在广东、山东、浙江等省份进行试测,检验其效度和适用性。实证研究表明,高考数学科贯彻了高考评价体系的核心理念,体现了数学考试的规律和特点,对规范和指导高考数学的改革与实践具有重要的意义,未来还需在使用过程中进一步修改和完善。 原文刊载于《中国考试》2019年第12期第27—32页。
2022-10-08
精彩回顾 | 《中国高考评价体系》解读系列文章②中国考试 2022-09-22 16:53 发表于北京基于高考评价体系的语文科考试内容改革实施路径摘要 高考评价体系是推进高考考试内容改革、指导高考命题工作的理论基础与实践指南。基于高考综合改革的语文科考试内容改革遵循高考评价体系“一核四层四翼”的框架,在明确语文科考试功能定位的基础上,科学构建语文科的考查内容、考查要求和考查载体,努力发挥语文科考试在育人过程中的作用和价值。 正文 2014年9月,国务院发布《关于深化考试招生制度改革的实施意见》,对高考内容改革顶层设计提出要求。2018年,习近平总书记在全国教育大会上指出,要努力构建德智体美劳全面培养的教育体系,形成更高水平的人才培养体系;要深化教育体制改革,健全立德树人落实机制,扭转不科学的教育评价导向,从根本上解决教育评价指挥棒问题。 为全面贯彻新时代党的教育方针,落实国家教育改革相关政策文件部署,从2016年起,教育部考试中心立足全面发展育人目标,制定用于指导高考内容改革和命题工作的高考评价体系,系统解决高考“为什么考、考什么、怎么考”,“培养什么人、怎样培养人、为谁培养人”等教育根本问题,这既从教育评价的角度、又从中华民族伟大复兴中国梦的高度给出了答案,也对包括语文在内的各科命题工作清晰明确地提出设计目标和研制路径,提供了基本遵循。 高考语文科考试内容改革的研究主要是根据普通高等学校对学生思想道德素质和科学文化素质的综合要求,依据《普通高中课程方案(2017年版)》(以下简称《课程方案》)、《普通高中语文课程标准(2017年版)》(以下简称《语文课程标准》)和高考评价体系,从制度层面、理论层面和实践层面系统贯彻全国教育大会健全立德树人落实机制,在服务高校人才选拔的同时,引导语文基础教育的改革方向,促进学生全面发展,推动人才培养的体制化建设。 1 高考语文科的功能定位 高考是面向合格高中毕业生和具有同等学力学生的选拔性考试。语文作为高中的基础学科,一直以来都是高考的统考科目。高考语文科考试内容改革,力求体现中国特色、符合时代要求,重点把握以下3项原则。 第一,坚定立场与方向。语文科考试内容改革和命题工作,始终坚持以习近平新时代中国特色社会主义思想为指导,全面贯彻党的教育方针,落实立德树人根本任务;充分发挥语文的强大育人功能和不可替代的优势,有机融入社会主义核心价值观教育,继承和弘扬中华优秀传统文化、革命文化、社会主义先进文化,加强法治意识、国家安全、民族团结、生态文明等方面的教育,培养良好政治素质、道德品质和健全人格的社会主义建设者和接班人,增强中国特色社会主义道路自信、理论自信、制度自信和文化自信;关注学生个性化、多样化发展需求在高考语文中的体现,关注与高中语文课程改革理念与实践的衔接,大力促进学生语文核心素养的形成与发展。 第二,坚持科学与创新。面对新时代对提高全体国民素质和人才培养质量的新要求,面对我国高中教育基本普及,人民群众对更高质量、更加公平、更具个性教育的需求愈加迫切的新形势,语文科考试内容改革从科教兴国战略和人才强国战略出发,依据高校人才选拔要求和《语文课程标准》,努力体现各类高校选拔人才在语文素养方面的共性需求;关注先进的教育思想和理念,关注教育测评理论和技术的新进展,科学把握语文教学与测评以及人才选拔的规律,努力提升高考语文和高考选才的效度,及时更新、不断创新高考语文的内容和话语体系。 第三,坚守传统与特色。我国历史悠久,语文教育和考试文化源远流长、博大精深,在长期的教育和考试发展历程中,形成了以德为先、注重公平、尊重知识等独具特色的人才培养和选拔观念。现代语文独立设科100多年来,语文的教学与测评也已形成了鲜明的传统与特色。新中国成立以后,特别是恢复高考40余年来,语文课程改革的热潮不断,高考语文命题工作也始终是语文教育的关键一环、重中之重。为了实现科学、公平、合理、稳定的测评目标,高考语文形成了较为稳定的命题队伍和命题机制,积累了较为丰厚的命题经验,形成了以语文科考试大纲为代表的成果内容。所有这些,都需要进行系统梳理、总结提升,以丰富和发展具有中国特色的教育评价理论与语文测评实践,确保高考语文改革的连续性,在继承中前行,在改革中完善。 2 高考语文科考查内容 高考评价体系明确“核心价值、学科素养、关键能力和必备知识”为考查内容,在此基础上,高考语文科以选才育人的核心价值为引领,以语文学科核心素养为导向,以阅读与表达作为关键能力,以语言、文学、文化等必备知识为学科基础,重在考查考生综合运用所学语文知识和能力,灵活、有效地分析问题和解决问题。 2.1 核心价值 核心价值是指即将进入高等学校的学习者应当具备的良好政治素质、道德品质和科学思想方法的综合,是在各学科中起着价值引领作用的思想观念体系,是学生面对现实的问题情境时应当表现出来的正确情感态度和价值观的综合。高考语文科要发挥坚定学生理想信念的积极作用,培养学生的爱国热情,在历史与现实、时代与发展中,感受中华优秀传统文化、革命文化和社会主义先进文化;要发挥育人功能,让学生在考查情境中得到品格之美的浸润和熏陶,帮助学生提升思想道德品行,树立正确的道德观念,全面提升个人的人格境界和精神文明水平;要彰显语文科独特的美育特质,如通过古代诗歌的鉴赏感受文学的意象之美、形象之美、色彩之美,甚至语言文字精练之美,帮助学生形成正确的审美观,提高审美情趣,涵育审美修养,养成感受美、鉴赏美、创造美的能力。 2.2 学科素养 语文学科素养是语文科育人价值的集中体现,是学生面对生活实践和学习探索问题情境时,能在正确思想观念指导下,灵活运用语文科知识、能力与方法认识问题、分析问题、解决问题的综合质;是适应新时代新要求,整合课程标准中语文学科核心素养和高校人才选拔要求,可以在高考特定情境中表现并进行评价的知识见识、情感态度与价值观统一贯通的整体素质、必备品格和关键能力。 从外显功能看,阅读和表达是语文学习的核心领域,是全球化、信息化时代终身学习、德智体美劳全面发展所必需的基本技能,因此阅读素养和表达素养是高考语文学科素养的基本构成和决定要素。阅读素养主要表现为在阅读中有效进行认知监控。基于阅读目的或阅读要求,依据文本类型、文本长度及文本的复杂或熟悉程度,能够准确、灵活地调动阅读策略与技能。在接受性、理解性阅读的基础上,既可多角度、多层面地阅读,又能创造性地、批判性地阅读,最终实现在教育中成为积极主动的阅读者。表达素养主要表现为在表达中有效进行认知监控。能够基于表达目的准确、连贯、得体地陈述事实和见闻,表达感受和认识,顺利完成交际任务。基于表达目的或表达要求,充分考虑语境因素,使自己的表达目标清晰、对象明确、话题集中,充实而简明、鲜明又生动。熟悉口语和书面语表达的一般规律和不同特点,灵活调动自己的生活经验和知识积累,有章法也有个性地表达,有效增进人际间的沟通和理解。 在培养创新型、复合型、应用型人才成为当务之急的今天,语文学科素养还需从高中语文学习内容的维度来认识,并从“语言建构与运用”“思维发展与提升”“审美鉴赏与创造”“文化传承与理解”4个方面予以强调,进而在高考语文中全面、综合而均衡地予以最大程度的落实。 2.3 关键能力 语文关键能力是语文科外显功能的集中体现,是落实命题立意的平台和中枢;是可以通过“做题”来检测或推断学生应对复杂情境,解决非规则、不确定性真实问题的“做事”能力。语文关键能力的主体内容可从阅读能力和表达能力2个方面进行总体设计,并予以分类、分层地呈现。2.3.1 阅读能力 阅读能力由信息性阅读、文学性阅读和古代诗文阅读3方面的能力构成。 1)信息性阅读能力。 信息性阅读是以求知求真的态度与方式阅读文本,从而不断拓宽知识面、增强认知能力、提升思维品质,其对象主要有论述性文本和实用性文本。对信息性阅读能力的要求有:在熟悉论述性文本和实用性文本的主要文类及其基本特征、体式惯例的基础上,能整体感知文本,把握文本的主要概念、观点、方法等关键信息,分析评价观点和材料的关系、主要信息和次要信息的关系;能评价文本的主要观点和基本倾向;能评估作者的写作意图、读者意识和信息来源,评价文本的社会价值和现实意义,有理有据地评判文中观点,发展新的观点,或呈现更客观的事实;能在不同文本的信息之间建立联系,分析比较多个文本在内容、材料、观点、表达方式和价值倾向等方面的异同,对有关问题形成更全面的认识,能够提出值得进一步探究的问题等。 2)文学性阅读能力。 文学性阅读是以审美的态度和方式阅读文本,涵养性情,滋润心灵,从而不断提升审美情趣和审美品位,丰富关于文学和世界的想象与认知,其对象主要是小说、散文、诗歌、戏剧等文学作品。对文学性阅读能力的要求有:能在积极主动的阅读中,感受、想象、体验作品呈现的社会生活和情感世界;在领悟作品表达的感情、思想和观念的基础上,充分调动生活经验和知识积累,进行审美鉴赏和审美评价;对常见文学类作品的基本特征、一般体例和主要表现手法有所掌握,在了解文学史常识和文学创作一般规律的基础上,对文本艺术创新的主题意向、思想蕴涵能有所领悟并展开联想,对作品的表达效果和思想艺术价值作出合理分析与评价;对文本建构和文本理解所涉及的复杂因素,前者如作者倾向与意图、作品语言与形式,后者如读者立场、阅读取向、欣赏角度、评价标准等,具有一定的认识,并能够从不同角度和层面发掘文本反映的人生价值和时代精神。 3)古代诗文阅读能力。 古代诗文阅读是富有中国特色的独特内容设置,显示了积淀与传承中华优秀传统文化的重要意义,发挥着涵养人文素质、提升文化自信的积极作用。对古代诗文阅读能力的要求有:熟悉掌握常用文言实词、虚词及古汉语词类活用的一般规则和常见的特殊句式,能准确理解文意,正确标点古代诗文,并能将古代诗文准确地翻译成现代汉语的规范表达。2.3.2 表达能力 表达能力包括语言策略与技能、写作能力2个方面。 1)语言策略与技能。 语言策略与技能是指基于具体的语言情境,根据不同的对象和目的,进行准确、连贯、得体表达的能力。要求为:熟悉国家通用语言文字中常用规范字的字音、字义和字形;掌握基本的语法规范和标点符号用法、语篇衔接的常用手段,以及常用的语用规则、修辞手段;能根据具体的交际对象、交际目的和交际情景,正确地遣词造句,准确地表情达意,有效完成交际任务。 2)写作能力。 写作能力是指在特定情境中,运用语言文字构建语篇进行表达和交流活动的能力。要求为:熟悉各种实用文体和文学体裁的特征及写作常识,掌握写作的基本规律,能根据写作的具体情境和要求,正确选用文体、语体,灵活使用语言文字和各种表达手段,构造完整语篇;掌握记叙、议论、说明、描写、抒情等基本表达能力,能按语篇功能和写作目的,综合而灵活地运用多种表达方式,符合文体和语体的要求。 2.4 必备知识 必备知识是高中课程标准规定的知识内容,也是进入高校进行专业学习所必需的基础性、通用性知识。高考语文要求的必备知识,主要包括3个部分:一是语言文字知识,如现代汉语和古代汉语的字词句法相关知识等。二是文学审美知识,如小说、散文、诗歌、戏剧等文学作品的文体基本特征和主要表现手法;此外,还包括《语文课程标准》涉及的文学作品和背诵篇目等相关知识内容。三是中外文化常识,如中外优秀文化中艺术、历史、科学等领域的基本常识,中华优秀传统文化、革命文化和社会主义先进文化的基本常识等。 3 高考语文科考查要求 为体现高考评价体系提出的“基础性、综合性、应用性和创新性”考查要求,高考语文科发挥语文作为基础学科的作用,考查学生对语文基础知识、基本技能的掌握程度,突出语文的综合性、实践性、通用性,重点考查阅读素养、表达素养,以及进入高等学校继续学习的潜能。 3.1 基础性 要求学生具备符合高校人才选拔要求、社会生活实践需要、终身发展需要的语文学科的基础知识、基本技能。通过对语文各领域基本概念、原理、思想方法的考查,引导学生将所学的语文知识和方法内化为自身的素养和能力。 3.2 综合性 突出考查学生掌握知识体系的完整性和不同知识间的交叉与渗透,引导学生全面完整认识问题的复杂性与动态性,综合运用语文学科的知识、方法,灵活调动阅读与表达策略,以有效解决复杂情境中的各种语文任务。 3.3 应用性 通过设置新颖的问题情境,将学科内容与国家经济社会发展、社会生活实际等紧密联系起来,引导学生增强语文联系实际的能力,善于观察、体验,主动灵活运用所学知识解决实际问题。 3.4 创新性 通过设计开放性和探究性的情境与设问,培养学生辩证思维和创新思维能力,引导学生独立思考、敢于创新,大胆提出自己的观点和结论,允许学生根据自己的理解,从不同角度加以探讨,对同一问题或现象得出不同的结论。 4 高考语文科考查载体 情境是实现考查内容和考查要求的载体,高考评价体系“一核四层四翼”的实现需要借助情境化的设计理念与实践,才能确保改革设计目标的落实落地。高考语文试题以真实、典型、具体的语文实践活动情境为载体,要求学生在特定情境中完成现代文阅读、古诗文阅读、语言文字运用和写作任务。高考语文试题情境主要有以下3种。 4.1 个人体验情境 个人体验情境是指学生个体独自开展的语文实践活动。基于学生的自主阅读、独立思考与自主写作实践,强调在各自不同的语文实践活动中,正确理解和熟练掌握祖国语言文字的具体应用情境。 4.2 学科认知情境 学科认知情境是指学生探究语文学科本体的具体过程。基于语文学科的综合性、整体性、系统性,突出学生参与语文实践活动过程的语文学科认知能力。 4.3 社会生活情境 社会生活情境是指学生熟悉的家庭生活、学校生活和社会生活。基于语文学科特有的工具性、基础性、实践性,突出运用祖国语言文字参与社会实践的语文核心素养。 综上,高考语文科内容改革立足高考评价体系,突出语文的学科特色,在适应高校人才选拔、回应国家人才强国战略的同时,也体现国家课程标准和语文基础教育教学的改革方向。随着考试内容改革的逐步深化,高考语文科考试内容改革也需要在探索和实践中不断充实、完善、提升,努力发挥和实现语文在育人过程中的作用和价值,力求对人才培养、文化传承、国家发展贡献应有之力。 原文刊载于《中国考试》2019年第12期第21—26页。
2022-10-08
精彩回顾 | 《中国高考评价体系》解读系列文章①中国考试 2022-09-22 16:53 发表于北京高考评价体系的基本内涵与主要特征 摘要高考评价体系的基本内涵是“一核四层四翼”,其中:“一核”为高考的核心功能,即“立德树人、服务选才、引导教学”;“四层”为考查内容,即“核心价值、学科素养、关键能力、必备知识”;“四翼”为考查要求,即“基础性、综合性、应用性、创新性”。高考评价体系是一个以价值为引领的、系统的、科学的、创新的理论体系和实践指南。基于高考评价体系,提出“价值引领、素养导向、能力为重、知识为基”的高考命题理念。 正文 为全面贯彻党的教育方针,落实《国务院关于深化考试招生制度改革的实施意见》(以下简称《实施意见》)的要求,进一步深化高考内容改革,教育部考试中心立足基本国情、遵循教育规律、坚持改革创新,经过3年系统而规范的研究,构建了基于学生德智体美劳全面发展要求的高考评价体系,作为高考内容改革和命题工作的理论基础和实践指南。高考评价体系将发挥高考在人才培养中的“指挥棒”作用,对发展素质教育、推进教育公平、实现教育现代化起到积极作用。 1 高考评价体系的基本内涵 高考评价体系的基本内涵是“一核四层四翼”,其中:“一核”为考查目的,即“立德树人、服务选才、引导教学”,是对素质教育中高考核心功能的概括,回答“为什么考”的问题;“四层”为考查内容,即“核心价值、学科素养、关键能力、必备知识”,是素质教育目标在高考内容中的提炼,回答“考什么”的问题;“四翼”为考查要求,即“基础性、综合性、应用性、创新性”,是素质教育的评价维度在高考中的体现,回答“怎么考”的问题。这3个部分的内容既突出重点,又有内在联系,形成一个统一的有机体(图1)。在此基础上,高考评价体系还包括考查载体,即实现考查内容和考查要求的试题情境。1.1 “一核”:立德树人、服务选才、引导教学 考试招生制度是我国的基本教育制度,是实现教育公平的基石。在2018年召开的全国教育大会上,习近平总书记提出“努力构建德智体美劳全面培养的教育体系,形成更高水平的人才培养体系”的要求。高考是重要的考试招生制度,要实现学生成长、国家选才、社会公平的有机统一,必须把立德树人作为根本任务,始终坚持正确的政治方向和价值导向,才能确保高考内容改革和命题方向不偏倚、不走弯路、不发生误导。 立德树人是高考的根本任务。高考作为最重要的国家教育考试,必须牢记为国育人的初心,坚守为国育才的立场,要以习近平新时代中国特色社会主义思想为指导,全面贯彻党的教育方针,强化理想信念、爱国主义情怀、品德修养、知识见识、奋斗精神、综合素质等内容在考试中的要求,引导学生培育和践行社会主义核心价值观,弘扬中华优秀传统文化、革命文化和社会主义先进文化,树立正确的国家观、历史观、民族观、文化观,切实增强中国特色社会主义道路自信、理论自信、制度自信、文化自信,积极彰显高考的育人功能和价值导向作用。 服务选才是高考的基本功能。高考为不同类型的高校选拔符合要求的学生,其选拔水平关系到我国高等教育质量乃至创新人才的培养质量。高考内容改革和命题工作,要围绕科学选才、提高质量、促进公平,进一步探索完善评价和选拔人才的方式方法,使选拔标准更全面,方式更科学。通过不断完善考试内容和考试形式,保证考试有较高的信度和效度,保证试题有适宜的难度和区分度,从而保证不同水平、各有所长的学生得到良好区分,促进人才合理配置和分流。 引导教学是基础教育对高考的现实需求,也是高利害考试必然的反拨功能。高考内容改革和命题要依据国家课程标准,充分考虑高中教育教学实际情况,遵循教育教学规律,发挥考试的正面导向作用;要处理好考试和教学的关系,通过优化试卷结构,创新试题设计,降低大量刷题、机械训练的收益,助力减轻学生学业负担。 1.2 “四层”:核心价值、学科素养、关键能力、必备知识 高考评价体系提出核心价值、学科素养、关键能力、必备知识4个维度的考查内容,突破了以往仅从知识和能力2个维度考查的理念。 核心价值是学生的政治素质、道德品质和思想方法的综合体现,是学生面对现实的问题情境时表现出来的情感态度和价值观。这一考查内容的提出,是为了更加鲜明地体现高考立德树人的核心功能和积极导向作用,体现德智体美劳全面发展育人目标。核心价值在“四层”考查内容中处于首要位置,其他3个维度均以核心价值为引领。将核心价值分解为3个一级指标、10个二级指标(见图2),其中一级指标包括政治立场和思想观念、世界观和方法论、道德品质。学科素养是学生在面对生活实践或学习探索问题时,能够在正确的思想价值观念指导下,合理运用科学的思维方式方法,有效地整合学科相关知识,运用学科相关能力,高质量地认识问题、分析问题和解决问题的综合品质。高考中的学科素养融汇国家课程标准中的核心素养要求和高校人才选拔要求中的素养内涵,通过理论逻辑分析与实证调研结果,构建了适合在考试中进行表达和测量的内容,包括3个一级指标和9个二级指标(见图3),其中一级指标包括学习掌握、实践探索和思维方法。关键能力是学生在面对与学科相关的生活实践或学习探索问题情境时,能够有效地认识问题、分析问题和解决问题所必须具备的能力。关键能力是支撑个体终身发展和适应时代要求的能力,是发展学科素养、培育核心价值所必须具备的能力基础。基于学科素养导向,结合学生认知发展实际,确定了符合考试评价规律的3个方面的关键能力群:一是以认识世界为核心的知识获取能力群,二是以解决实际问题为核心的实践操作能力群,三是涵盖了各种关键思维能力的思维认知能力群。 必备知识是学生在面对与学科相关的生活实践或学习探索问题时,有效地认识问题、分析问题和解决问题所必须具备的知识。它是由人文社会科学和自然科学各学科的基本事实、基本概念、基本技术与基本原理组成的知识体系,由陈述性知识和程序性知识构成。 作为有机整体,“四层”考查内容之间有着清晰的内在逻辑关系:核心价值是学科素养、关键能力、必备知识考查中体现出的正确方向、正确价值观、正确方法论、健康的情感态度;学科素养反映核心价值,是在复杂情境中对必备知识和关键能力的综合运用;关键能力是以必备知识的学习探究为载体,表现为对必备知识的运用,是形成学科素养的必要前提;必备知识的积累是形成关键能力和学科素养的基础,在对关键能力和学科素养进行考查时,必然涉及对必备知识的考查。 1.3 “四翼”:基础性、综合性、应用性、创新性 高考评价体系提出基础性、综合性、应用性、创新性的考查要求,一方面体现了高校对人才选拔的要求,另一方面也体现了素质教育培养目标的要求。 基础性主要包括学科内容的基本性与通用性、问题情境的典型性。高考命题的基础性,要求以生活实践与学习探索中最基本的问题情境作为任务创设与知识能力运用的载体,考查对学科基本概念、基本原理、基本技能和思想方法的掌握和应用程度。 综合性是高考命题的重要要求,不仅针对学科内容,还包括问题情境的复杂程度。从学科内容选择的角度看,综合性要求以多项相互关联活动的复杂问题情境作为载体,能够反映学科知识、能力内部的整合及其综合运用,考查对知识、能力、素养之间的整合能力以及综合运用水平。 应用性是高考命题的显性要求。学以致用是学习的重要目标。高考命题的应用性,要求试题以贴近生活、贴近社会、贴近时代的生活实践和学习探索情境为载体,联系国家社会发展、科学技术进步、生产生活实际、生态环境保护等现实问题,考查学生迁移课堂所学内容、理论联系实际的能力和水平。 创新性是高考选拔功能的体现。高考具有选拔创新人才的使命,为此,必须加强与创新密切相关的能力和素养的考查,比如独立思考、发散思维、逆向思维等方面的能力,鼓励学生摆脱思维定势的束缚,积极主动探索新方法、解决新问题。高考命题的创新性,要求创设合理问题情境,设置新颖的试题呈现方式和设问方式,考查学生在新颖的或陌生的情境中主动思考,完成开放性或探究性的任务,发现新问题、找到新规律、得出新结论的能力和水平。 2 高考评价体系的主要特征 基于高考评价体系,高考命题提出“价值引领、素养导向、能力为重、知识为基”的理念。高考评价体系是高考命题的理论基础与方法论,具有以下特征。 2.1 高考评价体系以价值为引领 高考评价体系坚持以价值为引领,主要体现在2个方面:第一,立德树人在高考核心功能中被列为首位。高考评价体系将立德树人确立为高考的根本任务,无论是为高校选拔学生,还是引导中学教育教学,都要以德为先,从而确保高考方向正确,发挥教育评价的正面导向作用。第二,核心价值在“四层”考查内容中被列为首位。高考评价体系确定4个维度的考查内容,学科素养、关键能力、必备知识均需要以正确的核心价值为引领,各学科在制定命题标准时,也需要根据学科特点,确立与学科相适应的核心价值考查内容。 2.2 高考评价体系是一个有机体 高考评价体系是由“一核”“四层”“四翼”构成的有机统一整体,主要体现在4个方面:第一,整体性。“一核”“四层”“四翼”是一个整体,三者彼此联系、协调一致,但非简单相加,而是强调三者共同发挥作用。“一核”是总体目标,“四层”围绕“一核”目标并遵循“四翼”要求进行设计,“四翼”对“四层”内容和呈现方式提出具体要求,确保“一核”目标的实现。第二,层次性。“一核”“四层”“四翼”虽然相互联系,但又彼此独立;“一核”是高考的核心功能,“四层”“四翼”是实现“一核”的具体路径。第三,稳定性。高考评价体系贯彻党的教育方针,响应国家选才需求,呼应人们对美好教育的向往,借鉴国内外先进测量理论和实践成果,有坚实理论支撑,并经过实证检验,这些因素决定了高考评价体系具有稳定性。第四,适应性。高考评价体系的整体架构具有稳定性,但具体内容会根据外界影响因素的变化进行相应调整,以更加积极的姿态、更加灵活的策略更好地实现高考功能。 2.3 高考评价体系的研制手段具有科学性 高考评价体系的构建遵循正确的方向、路径、方法和程序,以确保评价导向的科学性,主要体现在4个方面:第一,在研制方向上,高考评价体系全面贯彻党的教育方针,以立德树人为根本任务,以促进素质教育发展为基本遵循,以《实施意见》为政策依据,以高校人才选拔要求和国家课程标准为考查依据,处理好整体与局部的关系、上游与下游的关系、理论与实践的关系、稳定与创新的关系,将德智体美劳全面发展要求与学科内容深度融合,助力培养德智体美劳全面发展的社会主义建设者和接班人。第二,在研制路径上,高考评价体系充分利用高等教育、基础教育及评价测量领域的研究成果,既体现达标意识,衔接基础教育的育人目标,依据普通高中课程方案和各学科课程标准,对接其内容范围,符合学业质量水平要求;又具有前瞻意识,衔接高等教育的培养目标,依据高校选才需求,充分考虑各类高校不同专业对人才培养的要求。第三,在研制方法上,采用基础理论研究和实证调查研究相结合的方法,秉持理论联系实际、实践检验理论的原则,确保高考评价体系既有扎实的理论基础,又能经得起实践检验。第四,在研制程序上,高考评价体系的研制过程,不仅多轮征询各方面专家意见,反复修改完善,而且命制了试题,在全国多省市进行多轮试测,以确保内容的科学性和实践的可操作性。 2.4 高考评价体系的评价理念和模式具有创新性 高考评价体系的创新主要体现在3个方面:第一,在教育功能上,实现由单一的考试评价向立德树人重要载体和素质教育关键环节的转变。以往高考注重基于智育评价的人才选拔,对立德树人体现不够,与素质教育衔接不足;高考评价体系从党的新时代教育方针出发,立足于培养德智体美劳全面发展的社会主义建设者和接班人,在评价体系中落实立德树人的机制性设计,实现与素质教育理念、目标和要求的体系性衔接,从而落实“维护和增强高考在人才选拔培养中的核心地位”的要求。第二,在评价理念上,实现由传统的“知识能力立意”向“价值引领、素养导向、能力为重、知识为基”转变。自1977年恢复高考后,高考的评价理念经历了从知识立意到能力立意的转变;当下,基于新时代立德树人教育根本任务的明确、核心素养理念的提出、高中课程改革的推进以及教育测评理论的发展,高考评价体系提出“价值引领、素养导向、能力为重、知识为基”的评价新理念,并经实证检验,证明其操作的可行性。第三,在评价模式上,实现主要基于考查内容的一维评价向考查内容、考查要求、考查载体“三位一体”评价的转变。高考评价体系基于素质教育理论和考试评价规律,将素质教育目标与考查内容对接,将素质教育评价维度即考生素质的达成度与考查要求对接,并创设能够更加真实地反映考生素质的问题情境作为考查载体,形成集考查内容、考查要求、考查载体为一体的多维立体评价模式。 3 高考评价体系各要素之间的关系 3.1 “一核”各要素之间的关系 高考评价体系中的“立德树人、服务选才、引导教学”这一核心功能的各个要素之间不是孤立的、静止的,而是相互联系、相互作用的:立德树人是教育的根本任务,发挥统领作用,决定高考的前行方向和价值取向;服务选才和引导教学,既各有侧重又相互关联,是高考落实立德树人的基本手段。立德树人、服务选才、引导教学构成一个有机整体的功能机制,体现了高考在教育全局中的核心地位和关键作用。“一核”3个要素之间的关系如图4所示。3.2 “四层”各要素之间的关系 高考评价体系“四层”考查内容之间有着清晰的内在逻辑关系:核心价值位于最上层,是引领其他层次考查内容的总航标;学科素养反映核心价值,是在复杂情境中对必备知识和关键能力的综合运用,是关键连接层,承接核心价值的方向引导,统摄关键能力与必备知识;关键能力是以必备知识的学习探究为载体培养的,表现为对必备知识的运用,是支撑和体现学科素养要求的能力表征,是形成学科素养的必要前提;必备知识的积累是形成关键能力和学科素养的基础,在对关键能力和学科素养进行考查时,必然涉及对必备知识的考查。综合上述特征,“四层”考查内容之间的关系结构如图5所示。3.3 “四翼”与“四层”之间的关系 高考评价体系的“四翼”是连接“四层”与高考命题实践的纽带。高考评价体系通过“四翼”实现对“四层”的有效考查,也可通过“四翼”对高考试题质量进行有效评价;因此,“四翼”不仅是评价学生素质高低的基本维度,而且是评价试题质量优劣的基本指标。问题情境作为考查载体,将“四翼”考查要求与“四层”考查内容有机融合,最终实现对考生素质的评价。 高考评价体系既是理论体系,其构建始于对教育根本问题的思考和回答,是素质教育要求在高考中的体现;高考评价体系也是实践指南,为高考命题、考试评价提供依据。 原文刊载于《中国考试》2019年第12期第7—12页。
2022-09-26
2022年高考命题规律及2023年备考策略每年的高考真题和出题的规律带给了我们很多的启迪。进入高三后,2023届考生备考是该如何总结分析历年真题规律呢?2022高考命题规律根据教育部考试中心九个学科命题专家提出的“基于高考评价体系的学科考试内容改革实施路径”,对高考各门学科的情境分类、具体内容、命题指向,概括如下表:规律一:考创新全国甲卷情景独创是创新,可以是艺术创新,也可以是科技创新;全国乙卷“跨越,再跨越”强调科技创新,强调体育创新,创新才能实现持久跨越;新高考Ⅰ卷“本手、妙手、俗手”,本手是基础,妙手是创造,妙手需要创新;新高考Ⅱ卷“选择·创造·未来”,选择创新,创造未来。所以2023高考备考创新,仍然适用。规律二:文化情景创设,青年主角创设传统文化,革命文化,社会主义先进文化,为材料背景,创设情景。青年如何理解传统文化与革命文化的当代价值,青年如何发扬社会主义先进文化。备考青年视角,关联文化情景,是最近几年高考热点,也是2023年高考备考热点。所以2023年高考备考青年视野,仍然有较高价值。规律三:勇担重任责任担当,青年融入民族复兴,小我融入大我是高考命题重点。全国甲卷青年思考如何融入时代,直接使用,借鉴化用,情景创造,联系时代热点,思考问题,实现价值;全国乙卷,青年在时代跨越中跨越,在时代再跨越中担当;新高考Ⅰ卷“本手、妙手、俗手”,青年强调本手,实现妙手,在时代中创造价值;新高考Ⅱ卷“选择·创造·未来”,青年选择担当,奋斗创新,实现民族复兴。时代与青年关系是热点,青年实现价值是重点。所以2023年高考备考“青年与时代”,仍然有很强烈的针对性。抓住不变,科学备考;持之以恒,功夫下在平常。 2023高考备考策略一、重视文言文阅读,注意与教材关联。总结教材文言文文体形式,训练注意选文的多样性。2022年高考文言文选择了《战国策》两篇文言文,这启迪我们要选材多样。赋、表、游记、序、志、铭文体都需要重视,不仅需要练习史传类内容,还要重视政论文内容。避免单一选材,实现选材多样化,提高备考针对性。文言文实词虚词文化常识都要重视。2022年高考乙卷考了实词,相信大型联考文化常识类选择题可能会消失。所以平时我们需要文化常识与实词虚词并重,做到知识复习无死角。要知道2022年新高考两套试卷第11题都考了文化常识,并且文化常识也可以和教材关联。分散复习与集中复习相结合。集中复习教材,教材挖空训练课课落实。要检查,要提问,要练习,多方法强化掌握基础知识;集中训练高考题,结合高考真题掌握基础知识,做到挖空训练,做到一题多练。分散复习,落实到句子与段落。每天训练一句翻译,两天训练一段翻译,一周做两篇文言文,实现文言文滚动式复习。二、文学类文本阅读重视阅读,避免套路。2022年全国乙卷文学类文本阅读都不是套路题,侧重于结合语境,联系基础知识,解决阅读问题。这要求我们在刷高质量习题的同时,重视课文复习,结合教材掌握文学类文本阅读基础知识。不要期望一种套路或答题模板能解决所有问题,不要期望答题秘诀可以天下无敌。三、重视多样化阅读,重视读写结合。每周整理时评阅读,重大新闻事件阅读,传统文化阅读,文学类文本阅读。在阅读中积累成语,在阅读中积累名言,在阅读中鉴赏修辞。没有时评阅读,就难以积累高分素材,就难以提高思维能力;没有重大新闻事件阅读,就难以积累成语,就难以鉴赏语言,就难以应对语言文字应用高考习题的变化。 如何应对日渐灵活的高考命题拓展宽度,挖掘深度高考试题日趋日常生活中的内容融合到考题中。比如说,天问一号传回首幅火星图像!这个点,考察的学科就有高考语文作文,物理等学科的考题。考生应在平时多看新闻,在做试卷把常见的和生活相关的题目整理起来。 活学活用,举一反三以后的高考将会越来越注重对于学生解决实际问题能力的考查,无论是数理化或者是文史类的考试,均会设置开放性、灵活性较强的题目。如果还是按照以往的埋头苦读、死记硬背的模式来学习来备战2023年高考,且在思维上仍然是不擅长变通,那在以后的各种模拟考以及高考中将会极度不适应。建议考生改变思维方式,做到活学活用,学会举一反三,平时多注意思考,构建出自己的知识体系,把理论应用于实践。(稿件来源:语文周报公众号,版权属于原作者,分享利于扩大受众面,不涉及任何商业行为,如有异议联系本栏目,立即删除)
2022-09-26
陈安琪 关丹丹:几种增值评价方法的对比分析及实证研究原文刊载于《中国考试》2022年第9期第54—62页。作者陈安琪,教育部教育考试院研究实习员。关丹丹,教育部教育考试院副研究员。摘要:探索增值评价是深化新时代教育评价改革的任务之一。为研究常见增值评价方法在实际应用中的有效性,选取30所学校共34830名高三年级学生的2次数学考试数据作为样本,分别使用标准分法、效应量法、分层回归法及学生成长百分位法计算增值效应,以评价不同学校及不同特征群体的增值表现。结果显示:增值评价能够提供区别于结果评价之外的有效信息,拓宽了评价学校整体表现的视角;较其他增值评价方法,学生成长百分位法可以较好地解决优秀学生进步空间受限等局限性。增值评价在实践中尚存在诸多探索空间,但也要注意应慎用增值评价的结果,使用时应结合其他评价指标作为综合参考。关键词:教育评价改革;增值评价;学校评价;分层回归法;学生成长百分位法 正文0 引言2020年10月,中共中央、国务院印发《深化新时代教育评价改革总体方案》,明确坚决克服“五唯”顽瘴痼疾,扭转不科学的教育评价导向,更好发挥教育评价的指挥棒作用,其中提出的“改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性”[1]为指导教育评价改革提供了方法论。 与传统评价相比,增值评价是一种理念的创新,其不再仅仅“以结果论英雄”,而是将结果与之前基础作比较,通过二者的差距,判定评价对象的进步水平[2]。“增值”的基本价值在于提供教育主体(包括教师、学校及其所在区域等)对学生表现的贡献的最公平的信息。计算“增值”最简单的方法是比较学生的基线成绩与当前观察到的成绩,以确定他们在一定时间内成绩的增长情况。增值评价将学生的基础特征在统计上进行均等化,是评估教师、学校及其所在区域工作质量的有效措施,对提高教育质量、促进教育公平、优化教育教学管理、改进教学实际等具有重要参考价值。增值评价能够反映真实的教育成果,进而辅助实现资源合理分配并满足社会公众监督的效果。 增值评价模型最初应用于商业和经济领域,19世纪后期,随着教育研究工作者开始使用这些模型来衡量教师的绩效,有关教育增值评价的研究便如雨后春笋般蓬勃发展起来。如今,世界各地的学校系统越来越多地使用学校增值模型和学生标准化测试来监测和评估学校的表现。这些模型旨在衡量学校对学生学习的影响,即学校实现的增值,典型的例子包括澳大利亚、智利、英国和美国的问责制度。以美国为例,为了衡量教师的教学成效,美国各州和学区开发应用了不同类型的增值模型,如田纳西州增值评估系统(Tennessee Value-Added Assessment System,TVAAS)和达拉斯增值问责系统(Dallas Value-Added Accountability System,DVAAS)等,这些模型的共同假设是,学生在校的学业表现能够反映其接受的教学质量。在美国,许多州已经实施了基于增值的评估系统,2015年有41个州建议在人力资源决策中使用增值分数或有关学生成长的其他衡量标准[3]。增值模型能够帮助教育评价工作者从学生的绝对水平中识别出相对进步,进而分离出反映优质教学实践如有效利用的课堂时间、清晰和结构化的课程、教师的专业发展、以立德树人为导向的氛围、良好纪律的课堂环境等方面的教学成果。近年来,在评估教育主体和教学项目时使用增值方法作为考试成绩平均分替代方法的重要性上,国内外学者已达成了统一认识,但目前对于如何最好地估计增值分数还没有达成共识。目前,较常使用且易推广至实践的4种方法为标准分法、效应量法、分层回归法及学生成长百分位法,本研究比较这4种方法的计算原理、使用范围和优劣势,并辅之以真实数据的实证对比,以期为一线教育评价工作者提供参考。1 4种增值评价方法的比较 1.1 标准分法 将当前成绩与基线成绩相减再进行数值比较是计算增值的一种直观方法。由于2次成绩存在分数分布和相对位置的差异,需要将2次分数进行数据标准化处理。数据标准化是将数据集中的每一个数据减去均值后除以标准差,变换后的数据集均值均为0,方差均为1,即经过数据标准化之后,数据集特征有了相同的变化范围。增值分计算公式如下:1.2 效应量法 效应量大小可以描述均值之间的差异,其中Cohen’s d值常用于计算效应的标准化平均差。Cohen将2组样本观察值之间的标准化平均差称为ds[4]。因此,增值分的计算即为样本2次分数的平均值之差,再除以二者的联合标准差,计算公式如下:与标准分法类似,效应量法对学校均值的直接计算同样会损失学生个体差异信息。1.3 分层回归法 分层回归法考虑数据的嵌套结构,并能够在组织数据的多个层级上同时提供效果估计。具体而言,将学生后测成绩作为因变量,将学生前测成绩作为预测变量,学校实际增量与理论增量的残差值即为学校对学生成绩影响的效能[5]。分层回归法还可以将学生背景信息等因素纳入考虑,捕捉“组合”效应(如更好的家庭学习环境会有利于学生进步等),从而提供对学校增值效能更加准确的估计。具体模型如下:其中,i代表学生,j代表学校,t代表年份,γ为学校层的均值,μ为学校层的随机效应,ε为学生层的随机效应,yijt为j学校的i学生在第t年的成绩,β为学生在第t年成绩的斜率。 得到每个学生的增值分后,按学校进行平均值计算即可得到对应学校的整体增值分,同时可以计算学校增值分的区间。一般而言,若95%置信区间的下限大于0,则认为该学校实现正增值,显著高于平均水平,对学生成绩整体有积极影响;若95%置信区间的上限小于0,则认为该学校实现负增值,显著低于平均水平,对学生成绩整体有负向影响;若0位于95%置信区间内,则认为该学校为零增值。 分层回归法虽然避免了损失学生的个体进步信息,但因为其将单个学生的实测成绩与预测成绩对比衡量增值,仍会面临增值评价中的天花板效应,即优秀学生因增值空间有限而不可能获得较大进步幅度,进而得到较低增值评价结果的现象[6]。该方法对教育评价工作者的统计分析技能有一定的要求。1.4 学生成长百分位法 学生成长百分位法将学生与同水平学生进行对比判断增值,为解决优秀学生绝对增长空间不足的问题提供了新视角。学生成长百分位(student growth percentile,SGP)将同等水平学生作为比较群体以量化学生的进步,即将学生某项分数的变化与上一次具有相似分数的其他学生的此项分数的变化进行比较。百分位数表示低于某个特定分数的人数百分比,如一名学生5年级数学的SGP为90,说明他从四年级到五年级的数学成绩进步超过90%的同等水平学生(具有相似分数历史的学生)。学生成长百分位从1到99不等,数字越大代表成长越快。 SGP衡量的是表现的变化,而不是绝对表现,因此,学生上一周期的考试表现并不重要。所有学生,无论在过去的考试中获得的分数如何,都有平等的机会在下一次考试中达到99个百分位数中的任意一个。SGP不仅适用于评价学生个体的成长,还适用于班级、学校、地区等的成长评价,即按班级、学校或地区汇总学生的成长百分位数。由于百分位数是一个相对值,因此在比较百分位数时,平均值不是合适的度量,报告群体增长的最合适的衡量标准是学生成长百分位中位数(median student growth percentile,mSGP,如果将个体学生成长百分位数从高到低排列,则为中间分数),这是描述群体中学生典型成长的好方法。相对分层回归法,该方法在实际应用中更易理解,且可以较好地解决优秀学生绝对上升空间被设限的问题,但该方法也需要较大的样本量以保证每名学生有足够的同水平样本进行对比。2 实证研究与结果对比 2.1 数据来源 本研究数据选取某省30所学校共34830名高三年级学生为样本,这些学生均参加了2次数学考试,考试时间均在高三最后一学期,间隔时间为6个月,每次测试时,所有学校试卷相同且统一组织阅卷。在样本选择时,剔除了人数较少的学校,选取的30所学校均规模适中。2.2 统计方法 本研究分别使用标准分法、效应量 Hedge’s g法、分层回归法及学生成长百分位法计算学校增值效应并作对比。其中:分层回归法使用HLM7.0软件,以第一次数学考试成绩为前测成绩、第二次数学考试成绩为后测成绩构建模型;学生成长百分位法使用R中的SGP包计算单个学生的SGP,进而得到不同学校以及不同特征群体的学生成长百分位中位数(mSGP)。 2.3 研究结果 2.3.1 4种增值评价结果的对比 表1汇总30所样本学校的数学考试成绩使用不同评价方法从高到低排列的结果,数字代表排名。在结果评价排序中,T1成绩和T2成绩列代表2次考试成绩排序的结果。在增值评价排序中,标准分法、效应量Hedge’s g法、分层回归法和SGP法代表使用这4种方法计算出的增值排序的结果。增值评价排序为评价学校整体表现拓宽了维度,其与结果评价排序存在较大差异。单看结果排序,可以发现30所样本学校2次考试成绩的排序非常相近,整体表现基本无变化,排名位次之差最大值仅为3,有17所学校排名位次之差在1名以内,8所学校排名完全相同。当把增值纳入考虑后,可以发现学校排序发生了较大变化:学校20、21和22,结果评价排序靠后,但增值表现优异,增值排名均非常靠前;学校28,结果排序靠前,但增值表现较差,排在较为靠后的位置。 对比4类增值评价方法计算得出的增值排序,可以发现分层回归法与SGP法的排序相对一致,排名位次之差平均值为1.3,最大值为4,有超过60%的学校位次之差在1以内。位次之差最大的学校为结果排序中2次考试的第一名,这可能是由分层回归法对优秀群体增值评价的天花板效应造成的。图1直观展示了分层回归法与SGP法的结果差异。标准分法和效应量法与SGP法结果有较大差异,排名位次之差平均值分别为2.8和7.3,最大值则分别为8和21,分别仅有3%和13%的学校排名完全相同,远小于分层回归法的结果,这可能是由标准分法和效应量法损失了学生个体进步信息造成的。图2、图3分别展示分层回归法与SGP法下30所样本学校的增值情况,直观反映出各学校的增值排序。不难发现,无论从学校增值排序还是学校增值判定上,2类方法所得出的结果差异很小。其中,14所学校的置信区间下限大于0且mSGP值大于50,对学生进步有显著积极影响。2.3.2 结果评价与增值评价的结合分析 为更好地比较增值评价与结果评价应用于学校表现评价时的差异,绘制象限图(图 4)以观察2类方法的排序结果,即使用横坐标表示学校成长(mSGP)排序,纵坐标表示学校第二次考试成绩(T2成绩)排序,实现在同一个图中展示学校成长(增值评价)和成绩(结果评价)的综合情况。可以看出,有些学校存在成绩与成长倒挂的现象,成绩相对较差的学校可以取得较好的成长水平,而成绩相对较高的学校也可能在成长方面表现不佳;因此在评价学校时,仅用单一指标是不全面的。值得注意的是,有相当一部分学校成绩与成长的表现较为一致,说明二者在一定范围内存在相关关系,这可能是由于学校的成绩与成长水平均受到某些相同因素的影响,如师资力量、教学资源、学校环境等。2.3.3 男生与女生的增值情况比较 为比较男生和女生在高三年级最后一个学期数学科的成长表现,将样本学生按照性别分成2组,并将学生成长百分位按每20% 划分为一个等级(极低、低、中等、高和极高),观察男生和女生2个群体在5个成长等级上的分布情况,计算mSGP和2次测试的平均分,以进一步探究数学成绩和成长表现的性别差异。男生和女生的mSGP分布比较如图5所示。 总体来看,男生和女生第一次测试的平均分分别为77.91和72.45,第二次测试的平均分分别为89.06和83.03,男生和女生的 mSGP分别为54和47,男生的各项指标均高于女生;男生高成长和极高成长学生占比分别为20.30%和23.80%,同样均高于女生(分别为19.70%和17.20%)。结果表明,在样本数据中,男生的绝对水平和进步水平均相对较高,男生在高中数学科上可能具备一定的学科优势和后发优势。3 结论与讨论3.1 学生成长百分位法是一种简单高效的增值评价方法 本研究通过采集30所学校高三学生2次数学考试成绩数据,分别从结果评价和增值评价的角度比较不同学校之间和不同特征群体之间的表现差异。结果显示,增值评价能够提供区别于结果评价之外的有效信息,避免了单一评价方法的偏差。与静态的结果评价不同,增值评价可以向学生、教师、学校和教育行政管理机构提供更加多维动态的反馈信息,有利于改变人们对教育的关注点,推动树立内生的教育发展观和科学的教育质量评价观。 增值模型的种类繁多,不同的估计方法有各自不同的特点。在讨论并应用标准分法、效应量法(Hedge’s g法)、分层回归法以及学生成长百分位法计算增值效应时,学生成长百分位法显示出其独特优势,其增值思想简单易懂,充分利用了学生个体成长信息,较好地避免了优秀学生成长空间受限现象。在美国,学生成长百分位法也是使用最广泛的一种成长评估模型,因为它可以不依赖纵向量表进行成长评估,不包含线性假设和方差齐性假设,具有较大的灵活性。在实际应用中,学生成长百分位法可以帮助各级教育工作者更好地了解学生、学校的表现和变化。正如每个学生成长背后都有一个故事,寻找这些故事,探索高成长水平和低成长水平的原因,识别处于不同增长点的学生特征、学校特征,能够帮助各级教育工作者更好地引导学生发挥优势,改进教育教学。办好人民满意的教育,就是要办好每一所学校,教好每一位学生,避免低成长,追求高成长。作为一种新的学生个体及群体表现的衡量标准,学生成长百分位法是落实增值评价的重要参考指标,对于推动实现教育高质量发展有重要意义。3.2 增值评价的应用前景 引入增值评价,可以摆脱以往基于一次考试的绝对成绩评判学生个体或群体的绝对成就的局限,用动态的眼光评价个体或群体在学习过程中付出的努力和取得的进步,提升了评价的科学性、客观性和公平性。尽管增值评价可以帮助教育工作者拓宽评价视角,但“探索增值评价”这一改革要求也告诉我们,未来在实际应用中还存在诸多探索空间。 首先,发挥增值评价在引导学生德智体美劳全面发展上的作用。若增值评价只关注学生的考试分数和成绩的进步状况,而不管学生或者学校在整个学习过程中其他方面的进步情况,则其也会不可避免地走向唯分数评价的藩篱。德智体美劳五育并举,是新时代的教育观、人才观。五育与试题内容、情境等深度融合形成更为全面的考查体系,除了整体学业成绩的增值效应之外,还需要探索德智体美劳模块化的增值效应,即通过试题与五育的归属关系,评价学生不同层面的进步表现,进而为促进学生的全面发展提供更具有针对性的参考信息。 其次,挖掘增值评价在促进教师专业发展和区域均衡发展中的价值。教师是影响学生成绩的关键校本因素之一,研究考试成绩在多大程度上准确反映了教师对学生的学习贡献对于教师群体的教学激励和改进有重要意义。教师层面的增值研究需要收集不同学段相同教师教授相同学生的成绩数据,并在应用时注意数据质量和测量误差,以保证评估结果的准确、稳定、有效。学生成长百分位法可以计算一定区域内学生的典型成长,因此对评价地区教育质量有重要的参考价值。值得注意的是,增值评价模型的稳定性在近年来已成为国内外研究的热点问题,本研究同样观察到学校增值效应会因所使用的统计模型而有一定差异。除此之外,样本选择、数据质量等因素都会影响对教育主体的评价结果,因此不应将区域、学校及教师等的增值评价结果用作问责、奖惩等高风险决策的唯一衡量标准。增值评价的结果应慎用,并在使用时结合其他评价指标作为参考综合考量。 第三,探索增值评价中机器学习方法应用的可能性。要加强增值评价模型的研究,已有的增值评价模型在实践中仍存在一些亟待解决的问题,需要在不断研究和持续积累证据的基础上,逐步改进和完善增值评价方法的使用,提高增值评价手段的科学性。传统统计模型相对透明,易于相关研究人员和从业者理解,但受限于可能限制其预测准确性的假设条件,而如神经网络、随机森林、支持向量机等非线性集成方法则可以较好地解决这类问题。目前,机器学习方法在社会科学和教育等领域仍有较大的探索空间,随着数据质量的提高和数据数量的不断增加,大规模教育数据已经具备深度挖掘的基础,在增值评价领域使用机器学习方法估计增值效应有丰富的探索空间和潜在用途。 参考文献