教育考试研究
EXAM SCIENTIFIC RESEARCHS
高考历史“提取、评析观点类”题型的答题方法与解题策略

2024-01-09

高考历史“提取、评析观点类”题型的答题方法与解题策略高考历史“提取、评析观点类”题目要求考生从给定的材料或描述中明确提取出一个或多个观点。这些观点可能涉及历史事件、人物评价、历史现象的解释等,要求考生具备敏锐的洞察力和理解能力。在提取出观点后,题目要求考生对这些观点进行深入的分析和评价。这包括理解观点的背景、分析观点的合理性、探讨观点的局限性等。考生需要运用所学的历史知识,对观点进行验证和补充,这要求考生具备扎实的历史基础和知识迁移能力。此外,这类题型往往要求考生从多个角度思考问题,如政治、经济、文化等方面。高考历史“提取、评析观点类”题型旨在考查考生的历史素养、思维能力和表达能力。通过这类题型的考查,可以检验考生是否具备扎实的历史知识、敏锐的思维和规范的表达能力,以及是否能够运用这些能力对历史事件和现象进行深入的分析和理解。一、答题方法1.提取观点:首先,考生需要仔细阅读题目,明确题目所给的观点或陈述。然后,从材料中提取关键信息,包括时间、地点、人物、事件等。提取观点时,考生需要注意以下几点:(1)准确识别关键词:题目中的关键词是解题的关键,考生需要认真阅读题目,准确识别关键词并理解其含义。关键词可能包括时间、地点、人物、事件等,考生需要根据题目的要求和材料的内容,准确识别并理解这些关键词的含义。(2)深入理解材料:材料是解题的基础,考生需要认真阅读材料,深入理解其内容,找出与题目相关的信息。考生需要对材料进行深入的分析和理解,把握材料的主题和要点,从而更好地提取观点。(3)归纳整理观点:将提取的观点进行归纳整理,形成完整的观点或陈述。考生需要将多个观点或信息进行整合,形成连贯、完整的观点或陈述。在归纳整理时,考生需要注意观点的逻辑性和条理性,确保观点清晰、准确、完整。2.评析观点:在提取观点后,考生需要对观点进行深入的评析。评析观点时,考生需要注意以下几点:(1)全面了解背景:要深入了解观点所涉及的历史背景、社会环境、个人因素等,以便更全面地理解观点的内涵和意义。考生需要查阅相关历史资料、文献,了解当时的社会背景、政治经济状况、文化传统等,从而更准确地理解观点的背景和意义。(2)多角度分析:从多个角度对观点进行分析,包括政治、经济、文化等方面。考生需要从不同的角度思考问题,分析观点的合理性和局限性,避免片面性。同时,考生还需要注意观点之间的联系和影响,理解它们之间的相互作用和影响。(3)客观提出看法:根据分析结果,客观地提出自己的看法和建议。考生需要基于事实和证据,提出有说服力的看法和建议。在提出看法时,考生需要注意观点的客观性和中立性,避免主观臆断和偏见。(4)具体可行的建议:根据分析结果,提出具体可行的建议。建议要具体、明确,具有可操作性和可实施性。同时,建议还需要考虑到实际情况和可行性,避免过于理想化或不切实际。二、解题策略1.全面理解材料:在解答这类题目时,考生首先需要全面理解材料。这包括理解材料的内容、结构、语言风格等。考生需要仔细阅读材料,理解其描述的事件、人物、观点等,并注意其中的细节和关键词。这样可以帮助考生更好地提取和评析观点,避免因为对材料理解不全面而出现误解或遗漏。2.分析联系与差异:在分析材料时,考生需要注意分析各个观点或材料之间的联系和差异。通过比较不同观点或材料的异同点,可以更好地理解问题的本质和核心。考生需要思考各个观点之间的相互关系,理解它们之间的联系和影响,从而更全面地理解问题。3.逻辑推理:在提取和评析观点时,考生需要进行逻辑推理。通过对历史事件、人物、文献等进行分析和推理,可以得出更合理的结论和看法。考生需要运用逻辑推理的方法,对材料进行深入的分析和理解,从而得出更准确的结论和看法。4.多角度思考:在解答这类题目时,考生需要注重多角度思考。可以从政治、经济、文化等多个角度进行分析和思考,以得出更全面的结论和看法。考生需要从不同的角度思考问题,理解问题的多个方面,从而更全面地理解问题。同时,考生还需要注意观点之间的联系和影响,理解它们之间的相互作用和影响。三、高考真题及解析阅读材料,完成下列要求。材料:英国议会大厦是英国资产阶级革命的重要场所。1689年议会通过了《权利法案》,奠定了君主立宪制的法律基础。1832年议会改革使得工业资产阶级得以分享政治权利。19世纪中叶议会改革使得工人阶级也有了参与政治的权利。20世纪初,英国妇女获得了选举权;二战后,普选权得以实现。——摘编自钱乘旦《英国通史》等从材料中提取一个或多个信息,并结合所学知识加以评析(要求:信息完整、准确;评析要客观公正。)【解析】本题要求从材料中提取一个或多个信息,并结合所学知识加以评析。首先,可以从材料中提取出英国议会制度的发展历程,包括君主立宪制的建立、议会改革以及妇女和普选权的获得等。然后,可以从政治制度、经济基础、社会矛盾等方面对英国议会制度的发展历程进行评析。例如,英国议会制度的发展与英国资本主义经济的发展密切相关;随着社会矛盾的变化,议会制度也不断进行调整和完善;同时,妇女和普选权的获得也反映了民主制度的不断完善和发展。    【答案】1689年的《权利法案》奠定了英国君主立宪制的基础,限制了王权,确立了议会主权,为英国政治民主化奠定了基础。而1832年的议会改革则使得工业资产阶级得以分享政治权利,打破了贵族寡头统治的局面,推动了英国政治民主化的进程。此后的多次改革,如19世纪中叶的议会改革和20世纪初妇女获得选举权等,都进一步扩大了民主参与的范围,使得更多人能够参与政治决策。从这些事件,可以看出:英国政治民主化进程是一个漫长而复杂的过程,需要不断地进行改革和调整。在这个过程中,议会大厦作为英国政治的中心,承载了英国政治历史的重要事件和变革,见证了英国政治民主化进程的发展和进步。同时,这些事件也表明了民主制度的优越性和必要性,只有不断扩大民主参与的范围,才能更好地保障人民的权利和利益,促进社会的发展和进步。因此,可以说英国议会大厦和英国政治民主化进程是相互促进、密不可分的。议会大厦不仅是英国政治历史的象征,也是英国政治民主化进程的重要标志。同时,英国政治民主化进程的不断发展和进步,也为议会大厦注入了新的活力和意义。来源:跨学科教研中心(历史教研组)编辑:乙九说历史·历史教研组声明:教学分享,共同进步!(免责声明:本文遴选于《历史论文悦读分享》公众号,旨在交流与分享,文章观点与本栏目无关,如涉侵权,联系立删!) 

【试题研究】郭清鹏:高考历史地图题答题技巧

2024-01-09

高考历史地图题答题技巧考察要求(一)时空观念考纲要求①了解历史进程的时间顺序和分期方式,能够运用各种时间术语描述过去;②知道重要史事的地理状况,能识别和运用历史地图;③能将史事置于历史时空条件下进行考察和评述。(二)历史地图的分类战争形势图、布局图、分布图(工业、城市、人口)、疆域图(朝代、国家、民族)、交通路线图、经济分布图等。(三)历史地图的考察方向主要通过地图的图例说明和图片内容来呈现地理名称的变化、疆域范围的改变、行政区划的改变、河道的改变、战争路线及进程、区域性的经济特征、文化交流的路线等问题,考查学生对历史地图的处理能力及依托地图信息分析说明历史问题的阐释能力。PART.02学练基本法(一)学日常学习记忆:平时如何去识记一张地图,下面以元朝行省地图为例告诉大家如何抓住图中主要元素进行记背。①看“腹里”(中书省直辖):冀、晋、鲁、京津等②看“宣政院”:管理全国佛教事务与藏族地方事务③看中书省数量:共十行中书省④看边疆行省东北:辽阳北方:岒北西南:云南岒南:湖广、江浙东南(台湾):江浙(二) 练地图题目练习要求①审题(题干、设问、标题等),明确主题;②图文互补,读取时空信息;③结合图例等,多视角获取信息;④在解题过程中,要关注地图的主题、地图中的地名; 图例等。PART.03类型图分别突破(一)疆域图、行政区划图如何识别?三个基本判别的标准:       ①都城 ②少数民族 ③地方行政(二)经济形势示意图考点:中国古代经济格局的变动——经济重心逐步南移过程(魏晋奠基;中唐开始;南宋完成;元明清南北差距扩大)切入点:①粮食产区:主要粮食产区南方增多并;②工商业与城市:南方工商业日益发达,工商业城市发展;③交通:南方水陆交通网络日益密集,海上丝绸之路发展;④人口分布:南方人口增多并超过北方,人口密度增加;⑤文化:南方教育(如书院)、人才(如进士)等增多;⑥地方行政区划:南方行政区划日益细致,数量增多;⑦赋税:伴随经济重心南移,南方尤其江浙一带成为赋税重地;思考点:①经济重心南移与其他角度的关联、②经济发展与政局的关联(统一、分裂)、③地理环境(资源、交通等)影响经济发展、时代特征(三)战争示意图判断依据:①时间和战争地点  ②交战双方或军队名称  ③进军路线和方向  ④政权名称、都城中共根据地示意图判断依据:①政权名称、红都       ②根据地分布特点PART.04学后小练      1.(2021·湖南·10题)图2、图3是中国抗战时期两次战役形势图。这两幅图反映:A.局部抗战向全民族抗战的转变      B.抗战的主战场发生了明显变化C.抗日民族统一战线的逐步建立      D.抗战由战略防御转向战略反攻答案:B解析:第一步:分析题干材料信息文字材料:“中国抗战时期战役”       地图材料分析:第二步,依据材料分析结论判断选项表述A.局部抗战向全民族抗战的转变局部抗战指的是1931年9月至1937年7月之间,材料所示都不是这期间,A项错误。B.抗战的主战场发生了明显变化淞沪会战处于全面抗战初期,属于正面战场大型会战,百团大战处于全面抗战中期,属于敌后战场大型破袭性质战役,抗战初期以正面战场战斗为主,到中期转变为以敌后战场为主进行抗战,抗战的主战场发生了转变,B项正确。C.抗日民族统一战线的逐步建立抗日民族统一战线在1937年9月国共二次合作后就正式建立,C项错误。    D.抗战由战略防御转向战略反攻由战略防御转向反攻实在抗战后期,1944年之后,D项错误。方法点拨:1.首要注意题干材料文字部分的内容信息,找出题干材料文字中提示的时间、空间信息,有了题干文字部分提供的时空的信息,就能帮助我们更精确的锁定和验证地图时空、事件;2.第二步,对地图中标注的地名要特别注意,这是地图会最直观提供的空间信息,通过地名,我们能很快锁定地图绘制的空间地域是哪,然后再结合地图的图示说明类的信息,判断地图提供的事件是什么,比如上题第二幅图,我们看到八路军的进攻箭头都指向铁路,这就说明战役是破袭战性质,由此就可以反应到这是百团大战,所以我们抓地图分析时,一定不能忽视地图图示中所隐含的重要信息;3.第三步,结合地图中的时间、空间信息去综合判断选项,地图类的试题重要的考查就是对地图的综合分析能力,因此命题上选项多会围绕空间或时间设定,比如上题,A项就设置了局部抗战的时间陷阱。2.(2020年山东卷16题)分别提取图5、图6、图7的人口分布信息,并据此说明与其相对应的历史时期。(12分)解析信息的提取图5①州界——北方线条密集;南方线条稀松②长江以南地区人口密度小③颜色深(人口密度大)的地区集中在黄河中下游地区图6①颜色深(人口密度大)的地区南方较多;最深地方是今天江浙地区②省界——元朝设立行省图7①人口密度大的地区南北都有,北方稍多②黄河中下游人口密度大③长江下游人口密度大答案图5:南北人口密度差异明显,黄河中下游地区人口密度最高,南方地区人口密度相对较低。——这与东汉政治、经济中心在北方南方经济欠发达的状况相吻合。据此判定图5为东汉(永和五年)。(4分)图6:人口密度最高的地区在长江下游地区(江浙地区)——这与明初政治中心在南京,南方经济发达的状况相吻合。据此判定图6为明代(洪武二十六年)。(4分)图7:黄河中下游、长江下游地区人口密度都相对较高——这与唐朝政治中心在北方,江南经济不断开发的状况相吻合。据此判定图7为唐代(天宝元年)。(4分)(免责声明:本文根据《历史悦读分享》公众号整理,转发只为分享与交流,版权属于原作者,文中观点与本栏目无关。如涉侵权,联系立删!)

大数据时代的教育评价:特征、风险与破解之道

2023-12-26

原文刊载于《中国考试》2023年第10期第9—16页。作 者伍远岳,华中师范大学教育学院副教授。 摘 要:随着信息技术与教育的深度融合,大数据被广泛应用于教育评价,成为现代教育评价的重要支撑。大数据支持下的立体评价、即时评价、动态评价和发展评价,建构了一幅教育评价的全新图景。大数据赋能教育评价亦有一定的限度,图景背后的数据伦理威胁、主体规训困境和数据解释所存在的边界迷失等一系列潜在风险引发教育者的担忧。面对教育评价中可能出现的数据隐忧,评价者需要秉持科学的教育价值观,基于教育立场与人的发展立场做出正当性判断、价值性判断和有限性判断,以更好规避教育评价中各类潜在风险。 关键词:教育评价改革;大数据;教育评价;教育判断;数据风险   21世纪以来,大数据成为当今社会发展的一个重要的时代表征,改变着人们生产、生活和理解世界的方式。一般来说,大数据指常用数据库软件无法获取、存储和管理的数据集,具有大容量、高速度、多样性、价值性特点,需要有效的技术来分析与处理[1]。教育与信息技术的深度融合使大数据在教育管理、个性化学习、智慧教学等领域的应用不断深化。2020年,中共中央、国务院印发《深化新时代教育评价改革总体方案》,提出充分利用信息技术,提高教育评价的科学性、专业性、客观性[2]。当前,大数据已成为重塑评价改革实践的重要驱动力量,不仅为评价过程提供丰富的数据支持,也通过数据分析与管理提升教育评价的精准性。然而在大数据赋能教育评价的过程中,亦不能忽视数据伦理、主体性迷失等潜在风险。教育评价工作者应基于教育立场和人的立场,通过科学判断,处理好数据与人之间的关系,真正发挥大数据的教育评价功能。1 大数据时代教育评价的基本范式教育大数据已成为教育评价的核心资源,大数据支撑下的教育评价不仅意味着拥有海量数据,更体现为多源数据采集、数据深度挖掘、数据实时呈现以及高效数据管理在教育评价中的应用。1.1 多源数据,实现全过程、全方位的立体评价  多源是大数据的一个重要特征,表现出对教育评价全过程与全时空数据信息的持续采集与追踪,内含对评价对象全景式呈现的意蕴。传统教育评价受到技术条件限制难以获取全面评价信息,从而易使一些关键维度的评价内容缺乏强有力的信息依据,评价的有效性与专业性难以保证,多源数据则“帮助我们以前所未有的视角判断什么可行、什么不可行;展示那些以前不可能观察到的学习层面”[3]9,推动着教育评价从基于小样本数据的经验判断向基于整体性大数据的证据决策转变。  多源数据的重要价值在于促成教育评价活动实现时间维度上的连续性与空间维度上的全域性。在时间维度上,多源数据体现为相关主体能凭借数据采集平台与设备获取展现评价对象变化发展的过程性数据,如通过物联感知技术、可穿戴设备技术、传感器、视频录制技术、识别技术等数据获得各种状态、各个环节的海量历史数据与实时生成数据,一些行为数据可以实现伴随式采集,促成过去与现在多时空数据联结,展现评价对象的变化与发展过程[4]。在空间维度上,多源数据一方面表现为数据采集渠道更加多样,能够突破场所的限制,线上数据与线下数据也可以并存,形成多维评价空间;另一方面则是数据种类更加全面,能够展现评价对象在学业成绩、情感态度、身心健康等各个方面的表现,充分反映评价对象的真实状态。同时,多源数据也意味着评价数据结构的完善与数据层次的明晰,如美国所建立起包括国家级、州级、学区级以及校级的各级各类教育数据系统,“这些数据系统之间相互关联,数据互通,形成立体化数据网络,为美国教育评价用大数据的获取提供了基本的依托。”[5]多源数据能够打破时间与空间的阻隔,是推动教育评价由模糊走向精确的重要因素,为构建全过程、全方位的立体化评价网络奠定基础。1.2 深度挖掘,实现科学化、精确化的即时评价  教育数据是教育评价的事实与证据基础,但仅仅对教育数据进行简单采集、现状描述与浅层分析并不能充分实现其内在的价值与意义。长期以来,我国教育评价中存在数据来源与类型单一、数据的关联性缺失、数据使用缺乏深度等问题,未能真正发挥评价数据的应有功能,而大数据所具有的大容量、高速度、多样性等特征使得对数据进行深度挖掘成为可能。大数据在经过深度挖掘后所形成的结果能够呈现多种模态数据之间的关联情况,深入分析评价对象成长与发展的规律,实现对评价成效的追踪与问题预警。  大数据时代的数据挖掘以数据信息技术手段作为支撑,可以对海量数据进行对比分析、交叉检验以及聚类统计等,使得多样态数据经过整合与分析后形成更具针对性与实效性的评价数据,实现数据质量的提升,从而不断增强评价分析结果的精准度[6]。此外,对于大量、丰富的评价数据,深度挖掘能够从数据的相关关系中寻找其价值,而这一点是单一微量数据很难实现的。例如,研究者可以通过PISA测试中所形成的庞大数据库进行数据挖掘与二次分析研究,从教育学、心理学、社会学、经济学等多个学科视角进行分析,使评价数据的应用价值得到充分实现。运用多样化技术对海量评价数据进行挖掘,可以为教育决策提供更加专业科学的依据。对于教师的教学而言,对数据的深度挖掘则能利用相关关系的“发声”捕捉学生的最新动态,构建个性化学生数字画像[7],为学生的学习提供及时反馈,实现即时评价。1.3 算法推荐,实现可视化、差异化的动态评价  算法是大数据时代的重要概念,数据的积累促成了算法研究的深入,大数据与智能化传播的本质,就是基于计算机的算法程序对各类数据信息进行搜集、整理、评估、分类以及应用[8]。智能算法的基本要义即根据用户的历史数据,运用数学算法分析用户个人偏好并进行推荐。在教育领域中,仅凭单一的分析工具难以快速挖掘数据的多维功能,而智能算法的应用则有助于推动教学管理评价等走向精准化与个性化。  用算法生产教育知识首先需要做的就是搜集足够的数据,然后通过适当的算法发现相应的知识[8],算法推荐应用于教育评价中能够更加精确地推送评价对象所需的数据信息,压缩评价数据反馈所具有的偶然性。基于大数据技术,研究者能够充分利用算法模型,凭借可视化工具等载体从海量的数据库中精准获取并反馈评价信息;可视化技术有助于分析和探索大规模复杂评价数据,对公众理解和发现教育规律起到极大作用,是教育价值最直接的呈现形式[7]。智能算法借助相关工具将关涉个体成长发展的评价数据以可视化图表等更直观的形式进行输出,评价对象可以从中获取个性化的分析数据与精准化的反馈结果,从而了解自身的优势与不足。此外,对学生个体差异与个性化的忽视导致教育评价陷入同质性的困境,难以为改善评价对象的发展状况提供实质帮助。在大数据时代,算法推荐能呈现适用于特定群体和对象的评价内容,回应教育评价中所存在的客观差异。智能算法对评价数据复杂性与差异性的关注促成了评价活动的动态性是算法推荐的重要价值体现。1.4 数据管理,实现预测性、前瞻性的发展评价  高质量的教育评价离不开大数据技术的支撑,然而,目前教育评价数据的运行中仍存在一些问题,如不同机构之间的数据获取难度大、数据缺失、数据壁垒等现象。随着大数据管理技术不断提升,数据管理功能依托特定的技术或平台对所采集的海量数据进行分类、归纳、分析等处理,使复杂多样的评价数据处于有序的状态。  数据库是对海量数据进行整合分析的有效手段,教育评价活动在信息技术支撑下可以形成评价数据库,从而有效实现对海量评价数据的管理。目前的大规模教育评价项目均依托互联网实现大范围合作式评价开发、施测、过程与数据管理[9],形成包含学生学业质量与多主体背景的调查数据库,满足学生、家长、教师、教育管理部门以及教育研究者等相关主体对评价数据应用的需求。建立大规模的追踪数据库是实现预测性、前瞻性的发展评价的必要支撑,也是实施增值评价的前提条件,利用数据库能够对评价数据进行统一管理与持续追踪,系统地掌握评价对象在一定时间段内的发展与成就变化。同时,数据管理有利于对数据进行横向与纵向分析,对于了解学生学业成绩的发展情况,建构学生学习过程常量,科学、全面地评价学生的学习过程,也能够提供重要的数据支撑[4],真正实现发展性学生评价。维克托·迈尔-舍恩伯格(Viktor Mayer-Schnberger)等曾提出了大数据改善学习的3大核心要素:反馈、个性化和概率预测[3]104,对大数据进行管理不仅仅是关注过去或现在,更重要的是能够对个体行为偏好以及成就表现等数据进行预测,帮助评价对象及早了解自我发展态势。不论是学校评价、教师评价抑或是学生评价,其中内含促进人的发展的最终要义,在大数据管理体系的不断完善之下,对评价对象发展路向进行规划的可能性随之提升,推动着教育评价向更具前瞻性的发展评价转变。2 大数据时代教育评价的数据隐忧  人工智能时代的到来,促使我们进入到数字化世界之中。大数据何以可为,又有何不为?从评价数据采集到数据分析,再到评价结果的运用,都可能产生不可预测的风险,大数据时代教育评价亦面临一定的数据隐忧。2.1 数据采集触发数据伦理威胁  数字化时代,大数据是推动社会发展的关键力量,与数据有关的伦理问题也随之受到广泛关注。数据伦理是一种新型伦理关系,与信息伦理有着密切关联,可以认为是在数据运行中所形成的风险问题以及价值规范[10]。大数据本身无好坏之分,但与其他因素相互作用所产生的影响,可能远远超出技术和实践的直接目的。大数据时代教育评价所存在的数据伦理,首先表现为数据收集中对个体隐私的侵犯。教育评价中对评价对象进行全方位、全过程的数据采集,大量评价数据极有可能触碰到评价对象的个人敏感信息,加之相关主体对数据隐私保护不足,评价数据存在泄漏风险。其次,海量评价数据的价值更多源于二次利用,但在实际评价过程中存在数据滥用问题。在大数据时代一旦将事物数据化便可以改变其用途,一些数据在评价活动结束之后并未及时清理,可能会被未经授权的机构重新利用,数据主体的知情权未能得到保障,使得评价对象隐私被侵害的风险不断加剧。最令人不安的是不可预知的辅助数据集所构成的风险,这些数据集可以被用于重新识别个人数据。这意味着数据研究对象所面临的风险并不局限于项目研究本身的范围和寿命[11]。最后,尽管在人工智能背景下评价数据采集手段日趋多样,但由于多样性、动态化情境的制约,数据的完整性难以保证,尤其是当多个数据集同时使用时,这些错误和差距也会被放大[12]。在此情况下,可能形成对评价对象的认知偏差,所带来的身份固化在一定程度上加重教育评价的不平等。大数据采集所具有的倾向性也可能会损害评价对象的正当权益,由于我国地域广阔、民族众多,受不同文化的影响,我国的教育存在很大的区域差异、民族差别,评价数据采集中的偏向性可能会导致算法歧视风险[13],数据叠加算法容易造成对评价对象的偏见与歧视,从而产生新的教育不公平。2.2 数据使用陷入主体规训困境  自启蒙运动以来,人是理性自主的存在这一观点广为流行,人的主体性被推至极高的位置,“主体性问题是哲学的核心问题,也是教育的根本问题,人的主体性是教育追求的重要目标。”[14]大数据时代,海量数据支撑下个体的自主性与选择性似乎得以提升,但实际上“人的主体地位遭遇挑战,甚至可以说,是人类以一种乐观自愿的期盼把主体性让渡于自己创造的技术。”[15]个体所具有的认识主体地位意味着我们无法将评价对象视为可以规训与塑造的客体,但在大数据驱动下却极易陷入数据依从的困境。  首先,教育评价中的数据取向促使人们越来越相信只有通过大数据才能探寻评价对象成长发展的规律,个体对数据的依赖与日俱增,自我的批判性思考与判断力被迫让位于丰富的数据,在大数据的裹挟之下导致个体主体性的迷失,最终形成对数据绝对依从的尴尬局面。其次,大数据支撑下教育评价的主体规训还表现为将人存在的多样性和差异性抽象为统一的数据,正如将学生的认知活动、情绪体验以及教师的教学智慧等因素用无生命的数据进行简单化理解,个体沦为“单向度的人”将成为既定的事实[16],进而导致个体在教育评价大数据所建构的数字世界中日益感到价值迷失与意义失落。最后,大数据时代的数据权力成为支配他人的隐形力量。“算法权力从表象上看是一种技术权力,但其背后潜藏着控制算法设计和研发过程的资本的权力,而且在不远的将来,算法权力有可能会脱离人类的掌控并演化成人工智能对于人类的技术优势甚至是霸权。”[17]教育评价通过对海量数据进行深度分析从而为评价对象画像,基于技术手段掌握评价对象的个人偏好,在某种程度上可以引导个体的思维和行为选择,个体的自由意志被消减,在有限理性之下,对评价数据的依赖不断增强。“我们流连于层层叠加的数字景观,却唯独看不见景观中的他人。”[18]人的主体地位受到挑战,只能被动地等待数据所呈现的结果,并以此来进行价值判断与行为选择,迫使个体放弃对数据之外空间的探求。2.3 数据使用存在边界迷失  数字思维范式在现代社会中备受推崇,计算主义的核心思想是一切认知都可进行计算。从本质上说,大数据是人类探索理解和量化世界的新进展[19]。大数据时代教育评价同样受到计算理性的支配,力求在评价过程中让数据说话,寻求其可确定的部分,从而避免评价中不可预测的危害。但确定性与不确定性是客观世界的固有状态,任何对确定性寻求的努力都存在着不确定性。由于认识的不可穷尽性以及个体生命的无限可能性,教育评价活动同样内含复杂性与不确定性,这种不确定性使得评价数据本身以及数据结果的应用边界具有限度。  当数字技术主导教育评价时,评价者对数据的使用常常陷入边界迷失的漩涡。一方面,大数据时代的教育评价希望通过所获取的丰富数据建构出真实可信的世界,将不确定的因素用确定性的数据来进行表达,充分利用算法模型发现评价数据内隐价值,以此实现基于已知推测未知的美好愿景;通过大数据以及算法的运行使评价对象的成长发展可预测,努力揭示关于评价对象发展的确定性规律。另一方面,在技术主导下,大数据叠加算法强行对教育评价中的偶然性因素进行限定,运用评价中获取的多源数据对评价对象进行概率预测含有对个体改进路径进行限制的意味,这本身就是对数据边界的一种忽略。基于大数据的教育评价建立在铲除风险的基础之上,这虽然具有数据上的合理逻辑,但当教育评价对数据的使用迷失边界时,学生的发展空间、教师的教学空间也随之受到束缚。在此之下,教育者需要深入思考:在数据越来越多地影响教育评价的环境下,人们使用大数据的目的是什么?某种程度上,评价者使用大数据是为了满足对可量化秩序的渴望,而这种对数据的信任使评价者可能会被数据的虚假魅力所迷惑,并赋予数字更多的意义,此时评价数据背后的教育本质可能被遮蔽。教育评价对数据价值的盲目扩大回避或者是缺少了对什么是好教育的追问,实际上,任何教育规律的揭示,都无法回避对理想教育追求的目的性规约[15]。大数据时代下教育评价对数据的应用不应迷失其内在的边界,从而忽略对美好教育的向往与追寻。3 以三重判断破解大数据时代教育评价的数据隐忧  教育评价是基于事实与价值的实践性活动,价值判断是教育评价的本质特征,而合理的价值判断需要以科学的教育价值观为基础。在大数据时代,要充分实现数据的教育价值,评价者需立足人的发展立场,通过正当性判断、价值性判断与有限性判断三重教育判断来破解大数据时代教育评价遭遇的数据隐忧。3.1 通过正当性判断化解数据伦理困境  正当是一种基本的价值评判,正当性是一切社会行为的准则,也是教育行为的前提和规准。“正当性的探寻”意味着教育哲学研究必须对教育行为作一个规范性的判断:何为正当性的教育行为[20]。在计算主义的支配下,对教育行动在理性层面的正当性判断被忽视,有必要探寻大数据时代教育评价的正当性。教育评价中的正当性判断表现为相关主体对评价过程做出规范性的判断、赋予数据以人文关怀,寻求数据理性与个体情感的融合。  在大数据时代的教育评价中,正当性判断首先意味着教育评价数据的采集、分析以及反馈等环节中的合法性。大数据的有效性并不意味其具有正当性,评价数据收集、分析与管理过程要遵守数据规范,评价者要明确哪些评价数据可以采集以及何种评价数据可以进行公开共享,应使数据运行合乎教育目的,确保评价对象的隐私边界得到保护。其次,大数据背景下教育评价的正当性判断应始终坚持的评价原则是,要让参与的实践主体都能享有一定的评价权利,让每个评价对象都能获得一个公平公正的评价结果和发展权利[21]。教育评价的正当性并不能仅仅以满足多数人的要求为标准进行衡量,评价者需要明确教育评价所要实现的目标,提升理性思维能力,判断何种数据可以进入教育评价视野,充分关注到评价对象个体差异和其自身发展需要与内在潜能,减少对部分群体的偏见与歧视。最后,大数据时代教育评价的正当性判断需要坚守,把人文关怀作为技术活动首要考虑的因素[22]。教育评价中所获取的大数据只是提供一种事实参考,并不能代表评价对象发展的全部,当个体的成长受到过去数据的约束从而遭受不公正的待遇时,尤其需要评价主体以更具人文情怀的态度来审视评价大数据对个体发展带来的冲击,营造更具教育性的评价氛围,认识到评价对象并不是冷冰冰的数字,而是具有丰富情感的人,使评价对象在评价过程中能够获得积极的情绪体验。当评价对象被不断地数字化和算法化的时候,这种伦理困境应当引起人们的重视,而此时正当性判断也显得尤为重要,它显示着对更科学合理的教育评价的渴望。3.2 通过价值性判断促成评价对象主体性回归  人是事实性与价值性相统一的能动主体,人与客观世界之间既存在事实关系,也存在价值关系,价值性则反映了人与外界的价值关系。价值性判断是一种关于合理性的判断,是关于好与坏、善与恶、利与害、正当或不正当、合理或不合理等的判断,它解决的是客观事物对主体需要的关系“应怎样”的问题[23],大数据背景下的教育评价需要回应并处理好人与数据之间的价值关系,因为教育世界是人类意义生成的世界,教育活动是一种价值关涉的活动,教育活动本身具有内在的价值向度[24]。从教育的立场即人的发展立场出发,数据技术仅仅是认识主体的延伸,大数据时代的教育评价需要在主体价值观的引导下开展活动,需要满足个体的需要和意志,而不能任由技术来改变作为认识主体的基本属性[14]。教育评价中的价值性判断表现为评价者不是仅仅利用大数据转化为特定的行动,而是能够借助数据判断何种行动对评价对象是适切的,以及这种行动为评价对象所带来的价值[25]。在评价过程中始终追求评价对象的发展以及个体主体性的生成,这也要求评价者所采取的行动始终是面向未来的、开放的,而不是对过去或现在的重复。  在大数据时代的教育评价中,数据为评价主体采取行动提供了可能的途径,至于是否会转化为现实仍需要基于教育立场的价值性判断,要规避数据对个体可能带来的规训风险,摆脱对数字魔力的迷信[26],避免沦为数据化的教育评价。这种数据化的教育评价本质上是一种外在性的教育评价,并未涉及对人的内在性进行描述和判断[21],仅仅关注能以数据所表示的指标维度,而个体发展复杂性与多样性被遗忘。事实上,教育评价过程不仅仅是数据采集与分析的过程,更是进行价值判断的过程,大数据叠加算法无法取代能够表征人类主体性的专业判断能力,教育评价中数据取向所导致个体主体性迷失必须通过价值性判断予以弥补。评价者不仅要判断依据大数据所开展的事实判断和价值判断以及相应的评价行为方式对个体发展的影响,还要判断其教育潜力,这意味着评价者应具有一定的实践智慧,除了运用大数据衡量评价对象的发展之外,还要充分认识到个体发展的复杂性与无限可能性,为个体在数据之外建构可发展的空间。3.3 通过有限性判断关照评价数据背后的教育本质  在大数据时代的教育评价中,有限性是指数据功能与作用的限度与边界,有限性判断则是指对数据功能与作用的限度与边界的评判。任何事物所起的作用均具有一定限度,都只能在合理的范围内发挥作用,如出现边界模糊,则可能会导致功能的泛化或僭越。正如海德格尔(Martin Heidegger)对技术与实践关系的分析,技术之所以在某些时刻不再是实践的手段,反而成为干扰活动的破坏对象,恰恰是因为在这些技术的使用中,使用者被“消散”了[27]。大数据时代的教育评价如果缺少对评价数据功能的限度与边界的考量,忽略数据背后真正的内涵与意义,尤其在评价目的之间发生冲突时,教育评价数据有可能被滥用。由此,在大数据时代的教育评价中需要进行有限性判断,这种有限性判断并不在于简单拒绝大数据在评价活动中的应用,而是不断寻求数据与人之间的平衡,明确数据及其使用的合理限度,促使大数据时代教育评价回归教育育人本质。  在大数据时代,教育评价以看似客观公正的数据和确定的结果,为教育与个体发展指明方向,导致人对数据的迷信而忽视数据背后的教育本质。首先,有限性判断需要体现评价理念的教育性,即基于大数据的教育评价应立足人的全面发展,对于评价对象而言,个体无法被完全数据化,大数据时代教育评价也无法表征个体发展的无限可能性,教育性是有限性判断的前提;其次,有限性判断需要彰显评价过程的伦理性,即评价活动的开展应该遵循数据伦理,大数据所具有的工具价值不能取代教育内在的育人价值,要避免教育评价中的“灯柱综合征”,寻求人的发展而不是陷入数据的泥潭。最后,有限性判断需要凸显评价结果的成长性,评价最终指向的是个体的可持续发展而不是反映当前的发展。关注数据背后的教育本质,促成评价数据教育价值的回归是大数据时代教育评价的应有之义,“如果我们怀疑纯粹本质的存在,或者不去问纯粹本质,而把现实的一切置于优先考虑的地位,那本质的问题就会被遮蔽”[28]。在大数据时代的教育评价中,如果评价者只关注评价数据所体现的现实意义,而忽略数据的教育本质,那么,数据背后的教育本质与功能就会被遮蔽。  在大数据时代,大数据支撑下的教育评价所实现的立体评价、即时评价、动态评价以及发展评价构建起一幅教育评价的全新图景;然而,当教育评价中数据的教育本质被搁置,教育评价促进个体全面而有个性发展的功能就会因陷入数据泥沼而无法实现。意识到大数据背后的风险,警惕大数据运用于教育评价带来的隐忧,进行基于人的发展立场的教育判断,让大数据为教育评价服务而不是数据凌驾于人的主体之上,这是新时代教育评价改革中对技术、数据与人之间关系的理性回应。 参考文献:

基于新课标评价理念的英语考试形式优化策略

2023-11-20

基于新课标评价理念的英语考试形式优化策略原文刊载于《中国考试》2023年第11期第30—36页。作 者程晓堂,北京师范大学外国语言文学学院教授。谢诗语,北京师范大学外国语言文学学院在读博士生。 姚铄姿,北京师范大学外国语言文学学院在读博士生。摘 要:考试形式的选择直接影响到考试的信度和效度。尽管当前英语考试形式丰富多样,但仍存在选择题比例过高、语言知识考查形式的效度不高、书面表达题的开放性和真实性较低、较少使用基于问题情境的考试形式等问题。基于新课标全面考查学生核心素养的考试与评价理念,提出核心素养背景下英语考试形式的优化策略,包括基于语篇考查语言知识运用能力、根据真实语言使用情形设计考试形式、积极探索基于问题情境的考试形式、注重考试形式的多样性等。关键词:考试形式;英语考试;考试改革;新课标0 引言  考试改革是推动课程改革的重要举措。新课程改革高度重视评价与考试,提出了重要的评价与考试理念。高中英语新课标提出,考试要全面考查英语学科核心素养[1]94。义务教育英语新课标进一步明确了考试的目的、内容与形式之间的关系,指出考试应“选择与测评内容相适应的测评形式,使之能够考查学生综合运用英语理解和表达意义、解决问题的过程和结果,以及在此过程中所体现的语言能力、文化意识、思维品质和学习能力及其水平,确保测评能准确考查学生的价值观、必备品格和关键能力”[2]60。  考试的目的、内容和形式息息相关。考试形式的选择会影响考试目的的达成以及考试内容的范围和难度[3]。这是因为不同的考试形式对学生知识和技能的考查深度和广度不同。比如,选词填空题不能有效检测学生的阅读理解能力[4]。学生在答题时往往不会使用预期的阅读技能和策略,而是使用相关的词汇或句法知识来选择合适的词语填空。再比如,尽管测试内容相同、题干等效,多项选择题和开放式试题的难度仍存在差异[5]。  考试形式的选择既可能促进教学,也可能妨碍教学[6-7]。当考试形式与课程目标和内容不一致时,可能会对课堂教学产生消极的反拨作用;相反,当它们相一致时,则会产生积极的反拨作用。例如,如果课程目标是培养学生的口头交际能力,评估学生的学习成果时却采用纸笔考试,那么消极的反拨作用就会随之产生,教师在课堂上可能会更加关注学生书面语言知识的提高,而忽视学生口头交际能力的培养;反之,如果采用与课程目标和内容相适应的考试形式,如人人对话、人机对话等,则会对课堂教学实践产生积极的反拨作用,促使教师设计更多的交际活动和场景,更好地达成课程目标。  在语言课程中,考试形式常常与课程目标和内容不相匹配[6],对教与学产生了不利影响。长期以来,受考什么就教什么、怎么考就怎么教的影响,一些教师热衷于将考试形式作为教学内容和方法[8]196。这虽然能在一定程度上帮助学生有针对性地进行考试训练,提高考试成绩,但却容易造成高分低能的现象,不利于培养学生的价值观、必备品格和关键能力。此外,传统考试形式已不能完全满足新课标有关全面考查学生核心素养的要求[8]224。英语考试需要开发新的考试形式或改进原有的考试形式,为学生的核心素养发展提供全面、真实、准确的反馈,最大限度地发挥考试对教学的正面反拨作用,同时也为实现考试目的、明确考试内容、提高教学质量创造有利条件。1 目前英语考试形式中存在的主要问题  当前,英语考试采用的形式多种多样,但也存在一些突出问题,主要表现在以下4个方面。1.1 选择题比例过高  由于易于回答、易于评分等特点,选择题在英语考试中被广泛使用[9],题量和分值占比都偏高。例如,某省9市的中考英语试卷中,选择题分值平均占比为57.1%,选择题的数量普遍高于非选择题的数量,超过一半试卷中的选择题数量是非选择题数量的两倍[10]。此外,选择题还是英语考试中考查阅读和听力技能以及语法知识的最常见的考试形式[6]。  选择题在英语考试中的比例过高会产生许多负面影响。首先,选择题通常用于考查对语言知识的记忆和表层理解,较难考查对这些知识的深层理解和实际应用[11]27。其次,选择题过多可能影响考试公平。考生可能会通过猜测和解题技巧而非运用实际掌握的语言知识来回答问题[9][11]26。最后,选择题过多还可能对课堂教学产生消极的反拨作用。为了帮助学生提高考试成绩,教师可能会将大量的课堂教学时间用在讲解选择题的答题技巧和开展选择题的专项练习上[9],而忽视了对学生语言能力的综合训练和培养。1.2 语言知识考查形式的效度不高  目前的英语考试经常采用选择题、改错题、填空题和句型转换题来考查考生对语言知识的记忆和理解。然而,这些考试形式通常在单个句子中孤立地考查词汇和语法等语言知识[11]28[12],难以考查考生在具体语境或语篇中运用语言知识的能力。下面是某市2020年中考英语试卷中的一个填空题。尽管该题要求考生根据句意运用词汇知识来填空,但实际上考生只需熟记单词的拼写和中文含义就能顺利填写目标单词。1.3 书面表达题的开放性和真实性较低  很多书面表达试题的开放性较低,主要表现在试题对写作内容、格式和字数的限制。作答这道题时,考生只能按照固定的思路和框架进行写作,或将提示里的中文要点译成英文就能基本完成写作任务,并不太需要表达自己的观点或经历。因此,这道书面表达题的开放程度不高,主要考查对固定写作格式和内容的掌握情况,而非实际写作能力和独立思考能力。  很多书面表达题的真实性较低,主要体现在试题的写作目的和内容均是编造设计出来的,与考生的实际生活和经验相去甚远。例题2要求考生围绕上周末参与的社会实践活动写一篇短文,而实际上他们上周末并未参加此类活动,有的考生甚至从未经历过此类社会实践活动,致使这道书面表达试题真实性较低。考生无法将自己的实际经验和真实感受融入作答任务。1.4 较少使用基于问题情境的考试形式  传统的英语考试主要考查语言知识和技能,而非实际语言运用能力,对在真实的情境中使用英语解决问题的能力的考查尤为不足[13]。基于问题情境的考试形式通过设定具体的问题情境,测试学生如何使用英语知识和技能来分析和解决问题,更加注重学生的语言运用能力和问题解决能力,更能反映学生的真实英语水平。然而,基于问题情境的考试形式在英语考试中尚未得到大规模推广和应用。这主要是出于以下原因:第一,考试观念的影响。在传统的考试观念中,考试的目的是检测考生对语言知识的掌握程度[10],而非运用语言知识解决问题的能力。第二,命题技术的不足。开发和应用基于问题情境的考试形式,需要成熟的命题技术来支持问题情境和评分标准的设计,而目前这方面的理论研究和实践探索均不够充分。第三,教师和学生适应性的问题。基于问题情境的考试形式与传统的考试形式有很大不同。教师和学生需要时间来适应这种新的考试形式。2 核心素养背景下的英语考试与评价理念  高中新课标和义务教育新课标均提出落实立德树人根本任务的课程理念和发展学生核心素养的课程目标[1]1-2[2]1-2。这些理念和目标既是英语课程改革的重要方向,也是提高学生综合素质的关键所在,应在日常考试与评价、学业水平考试、高考以及其他相关考试与评价中得以充分体现[13]。只有这样,考试与评价才能既准确反映课程改革的成果,又对日常教育教学起到积极的反拨作用。英语考试的目的是准确评估学生的核心素养发展水平,为学生的英语学科核心素养以及这些素养达成的水平提供相关证据[14],以便更好地指导教育教学和促进学生的发展。英语考试不应该孤立地考查语言和文化知识,而应该把对这些知识的考查融入对语言能力的测评中[14]。这种考查方式不仅可以检验学生对英语语言和文化知识的理解和掌握程度,还可以评估他们运用这些知识进行真实语言交际的能力。此外,英语考试还应该渗透对文化意识、思维品质和学习能力的考查[1]99[2]59。换言之,英语考试不仅要测试学生的语言知识和技能,还要关注他们的跨文化交际能力,以及他们如何运用英语进行思考和解决问题的能力。英语考试的形式应尽量贴近真实的语言使用情况,采用典型的听、说、读、看、写等任务及其综合任务的形式,为考生提供运用语言和展示语言能力的机会[1]100。具有真实性的考试才能展现考生在真实情景中运用语言的能力。一言以蔽之,英语考试的形式应从机械固化的选择题、判断题、填空题转变为实践应用和问题解决形式的试题[15]。3 新课标背景下优化英语考试形式的策略  当前的英语考试形式与核心素养背景下英语考试与评价的理念还存在差距。要更好地实现考试目的,应对英语考试形式进行系统改革和优化。良好的英语考试形式应能有效、可靠地评估考生的语言能力,还要对教学产生正面的反拨作用,易于操作,省时省力[16]75。基于此,应从4个方面优化英语考试形式。3.1 基于语篇考查语言知识运用能力  基于语篇考查运用语言知识的能力,就是要以真实且相对完整的语篇作为考试素材,让考生在理解语篇的过程中展示和运用语言知识[16]174。例题3要求根据语篇内容和上下文语境填写恰当的词语,主要考查运用词汇和语法知识的能力。这种基于语篇考查语言知识运用能力的方式,避免了传统考试中孤立考查语法知识的问题,与在具体情境中考查语法能力的理念高度契合[12],有利于检测考生的实际语言运用能力。考生必须准确理解语境,把握语篇意义,才能填写出单词的正确形式,因而这种考试形式还有利于检测考生的阅读理解能力。  基于语篇的填空题的效度容易受到填空内容的影响[16]175。例如,如果语篇中缺失的内容是容易出现拼写错误的生词或难词,或者无法从已有语篇信息中推断出来,那么基于语篇的填空题就无法准确检测考生的语言知识运用能力和阅读理解能力,试题的效度就会显著降低。因此,为了减少填空内容对试题效度的负面影响,基于语篇的填空题可以为考生提供适当的提示信息,引导他们顺利完成填空。例题4要求考生将行尾所给单词的适当形式填入语篇,主要考查词形知识和在特定语境中运用词形知识的能力。这种考试形式为考生提供基本的填词信息,减少因词汇难度造成的单词拼写错误,保证了试题效度。在命制这种试题时,应注意所选语篇的主题和内容要贴近考生的学习和生活,以便能够检测他们在真实语境中运用语言知识的能力。3.2 根据真实语言使用情形设计考试形式  考试形式最好接近现实生活中语言使用的情形[10],以检测考生的实际语言运用能力。贴近真实语言使用的考试形式不再使用脱离语境的考试素材和任务,而是为考生创设贴近真实语言使用的情境,设计接近真实语言交际的任务,让他们在这些真实的情境和任务中展示自己的语言运用能力和解决问题的能力。这种考试形式不仅能同时考查考生的多种能力,还能提高他们的学习兴趣和动力,使他们更加愿意参与到学习和考试中来[17]。例题5使用非连续文本作为考试素材。非连续文本通常是日常生活中常见的告示、招贴、留言等。这类文本篇幅短小、信息量大,需要仔细阅读才能获取完整信息。因此,基于非连续文本的阅读理解试题有利于考查考生从阅读材料中获取和处理信息的能力。诚然,在实际生活中考生并不需要在阅读非连续文本后完成选择题。但是,受考试目的和性质的制约,英语考试形式只能尽可能地贴近真实的语言使用情境,而不能完全再现日常生活中的语言使用[17]。例题6通过模拟电话交谈来考查考生的听力理解能力和笔记能力,与现实生活中的语言使用情境高度相似。考生需要捕捉和记录电话交谈中的关键信息,如渡轮的出发时间、出发地点、票价等。这种考试形式要求考生在有限的时间内补全表格内容,对考生的听力水平和认知能力提出较高要求,必要时可适当降低难度,如每处空白要求考生只填写一个单词或数字、录音播放两遍、对考生所填内容中不重要的单词拼写错误不扣分或少扣分等。3.3 积极探索基于问题情境的考试形式  缺乏问题情境的英语试题,难以考查考生运用英语分析和解决实际问题的能力。基于问题情境的考试形式,“通常给出一个具体交际情境以及需要解决的问题,学生需要根据情境的要求,获取并处理信息,解决具体的问题”[13]。这种考试形式使得英语考试更加接近真实的语言使用情境,更能反映考生的实际英语运用能力、思维能力和问题解决能力。实际上,口语和写作试题均可以采用基于问题情境的形式来考查考生在问题情境中运用英语的能力,特别是使用交际策略、传递与交流信息、再现生活经历和表达思想的能力。例题7要求考生以同龄人的身份解答读者来信中的问题,主要考查书面表达能力、思维能力和解决问题的能力。该题具有真实的问题情景,提供了明确的写作任务。考生需要分析问题、提出观点、充实论据,才能完成写作任务。  听力和阅读理解试题也可以采用基于问题情境的考试形式,考查考生从语言材料中获取和处理信息的能力及分析和解决问题的能力。例如,阅读理解试题可以要求考生阅读有关全麦面粉和精麦面粉的报道,以及有关某面包店将只供应全麦面包的讨论,并结合已有知识和经验来回答人们应该食用何种面粉这一问题。这种考试形式不仅要求考生具备阅读理解能力,还要求他们具备一定的思维能力和解决问题的能力。在设计基于问题情境的考试形式时,应模拟考生在现实生活中可能遇到的问题,以确保问题情境真实可信[18]。问题情境的难度应适中,既不能过于简单,失去考试的价值,也不能过于复杂,超出考生的认知能力和生活经验。另外,在使用这种考试形式时,应明确评分标准,客观公正地评价考生能力。3.4 注重考试形式的多样性  优化英语考试形式需要注重考试形式的多样性,为考生提供展示语言能力的多种机会,为体现考生的语言能力提供多种证据。不同的考试形式各具优势,可以考查语言能力的不同方面[3,6]。例如,选择题可以考查考生的语言知识,填空题可以考查考生运用语言知识的能力,基于问题情境的考试形式可以考查考生运用语言知识解决问题的能力。因此,英语考试应改变相对固化的考试形式,避免偏爱选择题、过多使用缺乏语境的填空题和盲目使用句型转换题等问题[8]197-200,增加考试形式的多样性。  仍以阅读理解试题为例,除前文推荐的考试形式外,还可视具体情况选用匹配题、判断题和概要填空题等。例如,可以要求考生将字典中有关形状单词的定义与相应的图形形状进行匹配,考查考生查阅字典和理解字典中词汇定义的能力[11]110。又如,概要填空题要求考生阅读一篇短文,然后用恰当的词语在总结短文大意的段落空白处填空,以判断考生是否正确掌握了短文的主旨大意,以及是否找到概括短文内容的关键词语。再如,阅读判断题可以要求考生阅读一段描述几个物体之间关系的短文,文中有少部分词在现实生活中并不存在,是人为编造的假词,需要考生根据文中的真实词汇和语境推断其含义。阅读完成后,考生要依据文意对所给的陈述作“真/假”或“正/误”判断。这种考试形式也被称为阅读理解能力的诊断性评价(diagnostic assessment of reading comprehension),是近年来用于测试文本记忆、文本推断、背景知识获取和知识整合等能力的一种新方法[19]。4 结束语  考试形式的改革与优化是解决教学与考试矛盾的重要途径。优化考试形式可以更好落实新课标理念,全面考查学生的核心素养,提高考试内容的准确性,实现教学考一体化。随着信息技术的发展,出现了许多新的语言考试形式,如根据考生作答情况调整试题数量和难度的计算机自适应语言测试(computer-based adaptive language tests)、根据考生意愿确定考试时间和地点的网络语言测试(web-based language tests)等[20]。这些考试形式不仅提高了考试效率,还为拓展多样化的考试形式提供了可能。新课标背景下的英语考试形式优化需要在实践中不断探索和尝试。期待在未来的研究和实践中开发出更多具有创新性和实用性的考试形式,更好地服务于考试命题、教师教学和学生学习。 参考文献: 

智能时代的教育测量新视野

2023-11-14

王希常:智能时代的教育测量新视野原文刊载于《中国考试》2023年第11期第1—8页。作者王希常,山东省教育招生考试院研究员。摘 要:针对生成式大语言模型ChatGPT引发的新一轮人工智能技术发展,阐述智能及智能评测的有关概念及挑战,分析人工智能技术对人类学习和教育系统的影响,提出教育在智能时代可能发生的变革,以及在教育智能化过程中教育测量承载的历史使命。展望教育测量未来发展,教育测量应与智能认知研究相融合,广大研究者应致力于智能模型测评、心理测量与教育测量的融合研究,促进智能技术在教育和学习中的合理应用,使教育测量在教育变革及社会发展中发挥更加重要的作用。 关键词:智能;人工智能;教育测量;智能测评   生成式大语言模型ChatGPT出现后,因其所提供的高度智能性对话体验,引发人工智能技术创新发展的空前热潮,也引发人们对人工智能技术诸多问题的关注和思考。ChatGPT实现了流畅的人机对话,可以使用多模态方式根据提示内容生成多种形式的信息,如图表、图画、PPT文档等,还可以根据指令写报告、论文及文章,距离强人工智能更近了一步[1]。学术领域和工业界对这次人工智能的突破给予很高的评价和关注,有研究者认为ChatGPT是向通用人工智能技术发展的一次突破,在实现智能化方面迈出了重要一步[2-3]。  人工智能技术的突破性发展给各个领域和行业带来深刻变革。从人工智能新技术的影响来看,其直接作用主要是推动工业生产智能化,在较大范围内替代人类劳动职位,这在很大程度上改变了目前的生产方式和社会形态。同时,人工智能的替代作用还将直接影响人类的学习方式和教育系统。人工智能系统挑战人类的学习能力和职业岗位,因此,人类的思想状态和劳动方式都将被重新定位。根据Gartner最新发布报告,预计到2026年我国将有超过30%的白领工作被重新定义,使用生成式人工智能将成为一项广受欢迎的技能[4]。  在人类心智的研究方面,认知科学最核心的目标是建立一个可以类比人类思维过程的模型[5]。一些前沿科学家宣称,现在的技术已经可以构建具有意识的人工智能系统,甚至可能很快实现类似人类形体的自主智能体,这对人类社会将产生比ChatGPT更大的冲击[6]。实际上,目前比较合理的是信息标准计算模型,从深度神经网络的成功案例来看,使用这种模型的可能性还在不断增加。在一些应用领域,已经产生了大量基于ChatGPT技术的网络虚拟人和企业虚拟职工,甚至出现了企业机器人CEO,这对人类传统的信息交流、社区活动和工作方式都产生了深刻的影响。未来,如果高级自主智能体出现,其将争取与人类同等行为要求的社会存在位置,并形成全社会的形态变革。  智能工具是人类不断追求的强大生产力,制造高级智能系统和工具是人类一直以来追求的目标,也是对人类创造力的最高挑战。然而,由于人们尚不清楚人工智能对人类社会将产生何种程度的深远影响,因此对人工智能的突破性发展也普遍存在一种担忧。深度学习的奠基人Hinton曾指出,人工智能的继续发展将对人类产生很多威胁,人工智能终究会具有意识和自主能力,人类社会如何与机器群体共存将是一个危险的挑战[6]。很多科学家倡议暂缓人工智能研发,允许人类充分思考人工智能存在的各种问题,做好进入智能时代的准备。实际上,人工智能技术对人类社会存在形态的挑战已经出现,如近期出现的好莱坞编剧大罢工、知识产权侵犯争端、就业危机、伦理道德考验等问题。  面对人工智能发展的历史机遇和挑战,联合国及各个国家都在积极启动各种发展计划和应对策略。2021年11月,联合国教科文组织(UNESCO)发布《人工智能伦理问题建议书》,提出以符合伦理要求的方式运用人工智能的全球框架[7],以用于指导各国最大限度地发挥人工智能优势,降低风险。2023年2月,一些科学家和AI专家签署《暂停大型人工智能研究》的公开信,倡议应暂缓人工智能研发,允许人类充分思考人工智能存在可能带来的各种问题,为进入智能时代做好准备[8];同年7月,UNESCO发布的《全球教育质量监测报告》重点指出科技在教育中的应用问题,呼吁在教育领域要合理使用科技技术[9],并号召各国立即执行《人工智能伦理问题建议书》。2023年7月,我国国家网信办、国家发展改革委、教育部等多部门针对人工智能技术应用联合颁布《生成式人工智能服务管理暂行办法》,力图规范人工智能技术的使用,促进生成式人工智能健康发展和规范应用,保证公众和生产过程中的智能技术应用安全[10]。总之,研究、评估智能技术应用及高级智能系统的心理特性,对社会发展尤其是教育领域具有重要意义。鉴于此,本文探讨智能及智能评测的有关概念及面临挑战,分析人工智能技术对人类学习和教育系统的影响,并指出教育在智能时代发生的变革,以及在教育智能化过程中教育测量要承载的历史重任。 1 智能与智能评测   如何定义智能,是一个比较困难的问题。计算科学之父阿兰·图灵将对“智能”的认定归结为一种实验方法,建议通过测试方式检测一个机器系统是否具有智能,并反对给出一个描述性定义[11]。换言之,图灵认为在人类没有确切认识“智能”之前,可以将人类群体作为样例,并通过测试方式检测一个系统是否具有智能行为。因此,在早期的人类心智研究中,人工智能的智能性以人类的智能行为作为目标,但由于缺乏实验条件和理论支撑,长期处于试验观察水准。进入21世纪以来,脑科学已经成为一门正式且独立的学科,人类对人脑和心智的研究取得诸多进展,这些都推动了人工智能技术的快速发展。  1949年,加拿大心理学家Hebb提出人脑神经元激活方式假设[12-13],开启了模拟人类神经元网络构建智能系统的探索。此后很长一段时期,人工神经网络技术经历多次起伏波折,甚至因模型缺陷和理解偏颇几近停滞。进入21世纪,特别近20多年来,深度神经网络模型不断得到实践证实,也由此催生了大语言对话模型ChatGPT。就ChatGPT的对话表现而言,其在很多方面已经满足了图灵测试的基本要求。就技术而言,大语言模型的持续发展对高级自主智能体的研究,具有支撑和促进作用。目前,人们对人工智能的未来发展充满信心,学术研究达到空前热度,一些大型科技公司、研发应用等机构也在全力追逐,具有模拟人类行为能力的自主智能体将很快出现。未来10年,将是人工智能大发展的新工业革命阶段,也是人类社会产生剧变的重要阶段。  人工智能系统的发展,激发了对智能本质和智能系统功能评测的需要。由于智能来自于人类智能性的行为表现,因此,对智能的评测主要涉及两类智能系统:一是具有高级智能的人类自身,二是模拟人类智能性的机器系统。人具有先天的智能本质,但基于其智能本质发展的更高级能力则是通过教育的不断培育实现的。机器智能系统是人类设计和制造的,目前大多使用学习模型,并基于人类已有的知识进行训练学习,最终达到一定的智能水平。目前,针对机器智能的测评更多是从模型表现出发,即针对设计目标进行的工业指标基准测试。同时,一些教育、心理研究人员注意到智能系统对人类的影响,并开始开展机器心理特性的测试,这可谓新的开端[14]。然而,针对机器系统是否可以建立类似人类的教育系统并使用教育测量手段进行测试,目前还存在很多未知领域。  评测智能之所以重要,主要有两方面原因。其一,对智能与智能系统的评测,可以指导人类学习和教育系统如何与先进的智能工具相融合,以阻止盲目使用智能技术造成的人类自身发展生态的破坏。其二,目前的智能技术实现机制还存在诸多原理和功能上的缺陷,广泛地开展智能测评和研究分析可以促进智能模型具备人类需要的思维和行为能力。此外,还需要更为深入地研究智能系统潜在的心理活动,包括伦理道德、情绪思想、自我意识等。未来,机器系统将更为广泛地参与人类社会活动,因此还需要防止人工智能系统和智能体可能造成的负面影响、虚幻内容或伤害破坏行为。对机器系统的智能性评测,既是保护人类社会生态的一道重要屏障,也是智能系统研究开发的指导和监督。基于心理与教育测量理论建立的考试系统,是针对人的知识记忆和运用能力而设计的,机器系统有很多不同的特性,显然不能完全照搬测试人类的方式,因此,如何评测机器智能是一个极具挑战性的问题。开展智能系统评测,需要紧密结合智能技术、认知科学及人文社会学等领域。一些学者认为,研究人员不应仅仅依赖现有的基于表现的基准,而应基于认知心理学的方法深入了解人工智能模型,将智能模型视为心理学实验的参与者,以便研究这些系统的决策、推理、认知偏差及其他重要心理特征的机制[13-15]。 2 教育智能化面临的挑战   教育是人类社会中最重要的文化培育和心理发展过程,是人类成长和发展的大环境。人工智能是模仿和发展人类智能行为的技术,其目的在于创建与人类心智和行为能力相当的自主智能体,以代替部分人类劳动职能。作为高级技术工具,人工智能不断推动教与学的创新发展。在人类文化传承和社会发展历程中形成的教育系统,不仅是一般学科知识掌握和职业能力培养的过程,也存在很多非知识能力和身心发展的潜在因素。教育系统以知识传授和能力培养为主导,目标是促进人的成长并为社会培养有用人才。从功能性来看,人工智能技术在教育中的不断渗透和发展,将会替代教师的部分教学指导行为,也会改变传统的教学管理和学习方式;因此,智能技术革命必将引起教育领域的重大变革。面对人工智能技术引发的教育变革,最受关注的是对教育系统社会职能的全面审视,要注意在高级人工智能不断发展和普遍存在的情况下,教育的传统模式已经不可持续,教育需要进行重新定位和结构调整[16]。  一直以来,人们过于注重在教育系统中引入和使用智能技术,不遗余力地推动“教育+智能”,其主要目的是提升学习效率和教学效果。但在高级智能工具出现以后,人们开始重新思考教育智能化的合理性。教育是植根于社会互动的一种深刻的人类行为,在ChatGPT出现之后,更为先进的智能技术不断涌现,教育智能化面临更多挑战;因此,如何合理应用高级智能技术、探讨其对教育环境和学生学习的影响等问题值得深入思考。  第一,智能化影响能力培养。教育,不仅是传授学科知识,更重要的是培养学生学习和运用知识的基本能力,形成思考、解决问题的素养。随着人工智能的普遍应用,学生是否还需要培养那些将来可能不需要的能力,是否还需要大量记忆各种学科知识,正在成为人们普遍关注的问题。未来教育应培养面向现实场景和智能工具赋能的能力,而不是在使用智能技术的便利中就此“沉沦”[16]。因此,在未来社会发展中,教育应放弃一些传统技能的培养,放弃一些被动的学习模式。  第二,智能化改变、冲击传统的教学方式。当高级人工智能工具被引入教学过程以后,很多由教师主持的教学活动变为智能设备主导的控制系统,教师与学生之间的互动大为减少。由智能技术管理的知识灌输和行为引导,更接近机械控制系统,教育的人文性被淡化。如果单纯从知识传递效率和学科能力提升角度看,这种方式或许会促进教育取得更大进步,但学生的身心发展和精神世界将会产生质变。这种影响是潜在的和长期的,需要从技术资源、技能培养、规划发展及社会文化等方面进行深度考证分析[9]。  第三,智能化伴随学习成长。教育过程也是人的成长过程,关注人的成长是教育的根本任务。人类教育体系中不仅仅是知识传授,还包括促进人的健康成长和全面发展,使人在教育过程中成长为社会所需要的人。如果学生在教育过程中过度使用智能技术,并代替很多自身学习、掌握和运用知识的过程,这将如何影响人的成长,值得深入思考。  第四,智能化改变职业岗位并带来专业设置重构。由于高级人工智能技术的出现,很多职业领域将会出现大量人工智能技术,有些岗位会被替代甚至消失,因此,企业组织体系也将产生巨大改变。但是,人工智能也会催生新的职业能力需求,产生新的职业岗位[4]。这些转变和发展动态,会深刻改变未来的专业、职业教育走向和结构,进而改变教育的培养过程和形式。教育系统应思考未来社会的人才需求,制订长期发展规划以应对职业形态的改变。  第五,智能化涉及教育安全与公平。先进的人工智能技术不断涌入教育系统,其可信性和安全性正在成为广泛关注的问题。如果智能系统出现误导、欺骗或攻击性危险信息,而学生或相关接受者并不能明辨其错误和风险,则会产生严重的安全问题;同时,智能技术造成的不公平也会引发教育资源平衡问题。如果没有对安全风险的充分评估和预测,直接应用人工智能则需要承担责任及后果[9-11]。  实际上,无论是研究领域还是工业应用领域,对人工智能新技术的研究开发不仅没有停止,反而在不断加速,更为高级的智能技术将很快出现并应用于社会的各个领域。因此,针对人工智能发展对教育产生的冲击,既不能简单地采用隔离、阻止的应对方式,也不能放任智能性工具肆意改变教育环境和学习方式。面对人类社会即将到来的智能化新生态,教育亟须解决关系自身发展的很多重大课题。诸如制订符合教育理念和支撑人类长期发展的决策,深入研究和评估教育领域正在和即将使用的人工智能等都非常重要,而对各种智能技术进行系统性评测分析则需要充分发挥教育测量的作用。教育测量不仅应评测智能工具应用于教学和学习过程的效应,也应将研究范围拓展到智能模型原理、机器智能心理以及人机交互技术应用等方面,尤其要重视对未来教育方式和职业岗位能力需求变革的评估分析。 3 智能化背景下教育测量的新视野   测量是最基本的科学研究活动,是对事物属性和状态的数字化表征和建模过程[17-18]。教育测量研究人类学习、成长过程中的心理活动状态,属于高级心理特性测量,其测量方式和结果解释都具有特殊性;因此,教育测量也可以被视为一项社会测量工程。由于对人类心智机制的研究一直缺乏较为确切的物理模型,因此心理与教育测量研究主要基于刺激反应式的项目测验方法,并通过数理统计方法进行分析[17]。随着计算科学和人工神经网络的出现,对心智的研究逐渐趋向使用计算模型进行解释[5,18]。以大语言模型为代表的新一代人工智能技术的出现,进一步验证了使用计算模型模拟和解释人类智能的科学性,也提供了分析和透视人类学习和教育活动的新理论、新方法和新工具。  在智能时代背景下,教育测量应重新思考其研究目标和服务宗旨,推动对智能本身的认知,解析教育与智能技术的融合、促进与冲突,以应对人工智能与人类文明发展之间的世纪性挑战。这需要扩展原有的研究范围和方法,从研究知识传授和学习,到探讨智能和心智的评测,探究智能系统在人类社会中的作用和位置。比起传统性研究,教育测量研究需要解决更多关于智能和人的心智的固有问题,关心人的成长和社会环境问题,深度思考所面临的时代性问题,看到新的研究领域和目标。  第一,关注教育和成长过程中的评测和指导。陶行知先生认为,生活即教育,社会是一所大学校[19]。在信息技术普及和智能技术涌现的今天,这个观点尤为符合实际。自20世纪以来,教育的形式和方法不断拓展,从电视教育到网络教育,从全日制教育、职业教育到终身教育,教育不断发展和深入生活。教育测量也随之发生改变,不仅要专注于大型考试、课堂测试等传统方式,还应关注更为广泛的学习成长过程。针对当前正在发生的智能技术革命,应关注智能技术在教育生活中的影响和作用,开展更广泛的教育和学习的评测。  第二,结合智能技术推动系统性应用研究。在教育系统开展智能技术应用,需要大量的工程化探索,在教育过程中使用智能工具的评估,已经受到各方面的重视。针对智能技术在教育中的应用问题,教育测量的目标要求更具有综合性、技术性和过程性,不仅要评价知识能力成效,也要全面评估智能技术和智能系统对教育过程和学生成长的影响,分析评估智能工具和智能系统的原理、作用和价值,判断智能技术应用对学生成长的预期成效和负面效应。在这种需求驱动下,需要一个能跟踪和应用最新智能理论和技术的测量体系,这是一个工程化的发展前景。  第三,回归到面向心理和智能研究的实践和探索。一直以来,教育测量的服务目标多为教育成效评测,较少回归到心理学研究背景[18]。智能时代的到来,提出了更多具有挑战性的问题,将会促使这种研究的回归。基于大数据分析和人工智能模型,将会提升测量理论方法,提供针对心智、智能以及意识等问题的阐释,为人工智能技术的发展提供导引,为构建符合人类社会行为要求的智能体提供依据和判断。面向未来发展,将人类心智和智能技术作为实验研究对象,应更为切合教育测量在智能时代的目标和责任。  第四,支撑智能时代的教育发展变革。教育系统如何在人工智能技术的发展中改变和适应,需要大量的评测分析和实证研究,这也是必要的科学决策过程。为做好新型复杂人工智能的应用,教育系统需要强化监管和规范的制订[17]。在制订规范和管理决策中,教育测量应发挥核心作用,基于多视角的观察和调查对智能技术的教育效能和应用特性进行分析论证和评价。如果没有相关规范和策略的跟进,教育智能化将面临不确定性风险,且这些风险不仅发生在学校和课堂中,也存在于学生的学习和生活过程。  第五,探索智能技术应用的伦理道德问题。目前,智能技术正在改变人类行为,虚拟人(如机器人客服)已经充斥网络社区。未来,正在设计开发的高级智能体很可能以独立行为体的身份进入人类社会,并作为正式员工参与劳动工作,人类社会的结构也将产生前所未有的变革。由人类制造的智能体可以在很多方面替代人类,但它们是否需要类似人类的教育过程,如何培养它们的道德情操和伦理观念,都是亟待探索的重大课题[20-21]。因此,针对智能体的行为约束能力评测和综合心理能力评测,正在发展为一种新的测量研究方向[15,21]。  第六,结合认知科学的理论方法开展智能问题研究。有关心智机制和意识的科学性解释一直困扰着心理学界和哲学界,研究者期待有一种抽象解释模型可以表征心理活动,而认知科学正在努力完成这一使命。认知科学融汇了哲学、心理学、语言学、人类学、计算机科学和神经科学等学科研究,推动了对人类智能神秘性机制的解析,围绕智能、心智、意识等问题开展科学性探索。随着神经科学和人工智能技术的不断发展,认知科学在解决人类心智方面提出了极具科学性的解释模型,正在促进对智能和智能技术的理论研究和技术实践[1,20,22]。在评测人类心智、人工智能模型方面,教育测量应积极结合认知科学的理论模型和技术方法,推动自身的变革。  随着智能技术的不断突破和升级,教育工作者需要重点关注诸多关键问题,如智能技术如何与人类进行交互,它们对人类的心理和智力的影响是什么,它们对教育过程中潜在的、长期性作用是什么,等等。在教育研究中,应积极研究和应用大数据和智能模型技术,类比和分析人的智力行为,探索智能与心智问题,这也需要教育和人工智能领域共同努力。对人类教育过程心理行为的评估分析,对智能技术教育影响的分析,以及对智能模型的心理特性解析,都是教育测量研究的目标,这将会促使教育测量产生新的突破和发展。  经过多年的探索研究,教育测量已经成为较为成熟的学科,其理论模型和评测技术得到广泛应用。一个成熟的学科,在前进中需要反思和突破,在受到新科学发现推动或应用问题困惑时应产生自身重塑和冲出重围的活力。教育测量学在不断成熟的过程中,有些偏重于自身的理论完善和方法解释,局限于已有的范式,并逐渐远离了其实质研究对象——人类心智,这与托马斯·库恩对一些成熟学科状态的解析类似[23]。随着新智能技术时代的到来,人们应看到对教育测量技术新使命的召唤,看到更为广阔的发展空间。 4 结束语   ChatGPT的出现,标志着人工智能技术革命时代的到来,也预示着人类自身的知识创新和应用能力会遇到挑战。未来,由机器学习技术突破而产生的价值将改变世界经济、文化形态,展现一个新的文明时代和地球生命进化阶段[22,24]。智能技术对人类社会产生深刻影响,甚至导致结构性变革。目前,学界对未来智能技术发展存在较为激烈的争论,存在乐观、谨慎(中立)和悲观3种观点,关于智能技术发展的探讨已经上升为对人类前景的思考[25-26]。分析和预估智能技术未来的发展变革及其对教育和人类成长的影响,不仅要研究智能模型的实现机制和效能表现,也要关注文化生态与伦理道德问题,这就需要融合智能模型测评与教育测量的综合性测量技术。测量可以帮助我们在认知世界的过程中探索分析和决策,教育测量与智能技术研究的融合,将为未来教育发展提供支撑,为构建一个智能技术的美妙世界作出积极贡献[27-29]。 参考文献:(略)(声明:本文选自《中国考试》,如涉侵权,联系立删)