原文刊载于《中国考试》2023年第10期第9—16页。
作 者
伍远岳,华中师范大学教育学院副教授。
摘 要:随着信息技术与教育的深度融合,大数据被广泛应用于教育评价,成为现代教育评价的重要支撑。大数据支持下的立体评价、即时评价、动态评价和发展评价,建构了一幅教育评价的全新图景。大数据赋能教育评价亦有一定的限度,图景背后的数据伦理威胁、主体规训困境和数据解释所存在的边界迷失等一系列潜在风险引发教育者的担忧。面对教育评价中可能出现的数据隐忧,评价者需要秉持科学的教育价值观,基于教育立场与人的发展立场做出正当性判断、价值性判断和有限性判断,以更好规避教育评价中各类潜在风险。
关键词:教育评价改革;大数据;教育评价;教育判断;数据风险
21世纪以来,大数据成为当今社会发展的一个重要的时代表征,改变着人们生产、生活和理解世界的方式。一般来说,大数据指常用数据库软件无法获取、存储和管理的数据集,具有大容量、高速度、多样性、价值性特点,需要有效的技术来分析与处理[1]。教育与信息技术的深度融合使大数据在教育管理、个性化学习、智慧教学等领域的应用不断深化。2020年,中共中央、国务院印发《深化新时代教育评价改革总体方案》,提出充分利用信息技术,提高教育评价的科学性、专业性、客观性[2]。当前,大数据已成为重塑评价改革实践的重要驱动力量,不仅为评价过程提供丰富的数据支持,也通过数据分析与管理提升教育评价的精准性。然而在大数据赋能教育评价的过程中,亦不能忽视数据伦理、主体性迷失等潜在风险。教育评价工作者应基于教育立场和人的立场,通过科学判断,处理好数据与人之间的关系,真正发挥大数据的教育评价功能。
1 大数据时代教育评价的基本范式
教育大数据已成为教育评价的核心资源,大数据支撑下的教育评价不仅意味着拥有海量数据,更体现为多源数据采集、数据深度挖掘、数据实时呈现以及高效数据管理在教育评价中的应用。
1.1 多源数据,实现全过程、全方位的立体评价
多源是大数据的一个重要特征,表现出对教育评价全过程与全时空数据信息的持续采集与追踪,内含对评价对象全景式呈现的意蕴。传统教育评价受到技术条件限制难以获取全面评价信息,从而易使一些关键维度的评价内容缺乏强有力的信息依据,评价的有效性与专业性难以保证,多源数据则“帮助我们以前所未有的视角判断什么可行、什么不可行;展示那些以前不可能观察到的学习层面”[3]9,推动着教育评价从基于小样本数据的经验判断向基于整体性大数据的证据决策转变。
多源数据的重要价值在于促成教育评价活动实现时间维度上的连续性与空间维度上的全域性。在时间维度上,多源数据体现为相关主体能凭借数据采集平台与设备获取展现评价对象变化发展的过程性数据,如通过物联感知技术、可穿戴设备技术、传感器、视频录制技术、识别技术等数据获得各种状态、各个环节的海量历史数据与实时生成数据,一些行为数据可以实现伴随式采集,促成过去与现在多时空数据联结,展现评价对象的变化与发展过程[4]。在空间维度上,多源数据一方面表现为数据采集渠道更加多样,能够突破场所的限制,线上数据与线下数据也可以并存,形成多维评价空间;另一方面则是数据种类更加全面,能够展现评价对象在学业成绩、情感态度、身心健康等各个方面的表现,充分反映评价对象的真实状态。同时,多源数据也意味着评价数据结构的完善与数据层次的明晰,如美国所建立起包括国家级、州级、学区级以及校级的各级各类教育数据系统,“这些数据系统之间相互关联,数据互通,形成立体化数据网络,为美国教育评价用大数据的获取提供了基本的依托。”[5]多源数据能够打破时间与空间的阻隔,是推动教育评价由模糊走向精确的重要因素,为构建全过程、全方位的立体化评价网络奠定基础。
1.2 深度挖掘,实现科学化、精确化的即时评价
教育数据是教育评价的事实与证据基础,但仅仅对教育数据进行简单采集、现状描述与浅层分析并不能充分实现其内在的价值与意义。长期以来,我国教育评价中存在数据来源与类型单一、数据的关联性缺失、数据使用缺乏深度等问题,未能真正发挥评价数据的应有功能,而大数据所具有的大容量、高速度、多样性等特征使得对数据进行深度挖掘成为可能。大数据在经过深度挖掘后所形成的结果能够呈现多种模态数据之间的关联情况,深入分析评价对象成长与发展的规律,实现对评价成效的追踪与问题预警。
大数据时代的数据挖掘以数据信息技术手段作为支撑,可以对海量数据进行对比分析、交叉检验以及聚类统计等,使得多样态数据经过整合与分析后形成更具针对性与实效性的评价数据,实现数据质量的提升,从而不断增强评价分析结果的精准度[6]。此外,对于大量、丰富的评价数据,深度挖掘能够从数据的相关关系中寻找其价值,而这一点是单一微量数据很难实现的。例如,研究者可以通过PISA测试中所形成的庞大数据库进行数据挖掘与二次分析研究,从教育学、心理学、社会学、经济学等多个学科视角进行分析,使评价数据的应用价值得到充分实现。运用多样化技术对海量评价数据进行挖掘,可以为教育决策提供更加专业科学的依据。对于教师的教学而言,对数据的深度挖掘则能利用相关关系的“发声”捕捉学生的最新动态,构建个性化学生数字画像[7],为学生的学习提供及时反馈,实现即时评价。
1.3 算法推荐,实现可视化、差异化的动态评价
算法是大数据时代的重要概念,数据的积累促成了算法研究的深入,大数据与智能化传播的本质,就是基于计算机的算法程序对各类数据信息进行搜集、整理、评估、分类以及应用[8]。智能算法的基本要义即根据用户的历史数据,运用数学算法分析用户个人偏好并进行推荐。在教育领域中,仅凭单一的分析工具难以快速挖掘数据的多维功能,而智能算法的应用则有助于推动教学管理评价等走向精准化与个性化。
用算法生产教育知识首先需要做的就是搜集足够的数据,然后通过适当的算法发现相应的知识[8],算法推荐应用于教育评价中能够更加精确地推送评价对象所需的数据信息,压缩评价数据反馈所具有的偶然性。基于大数据技术,研究者能够充分利用算法模型,凭借可视化工具等载体从海量的数据库中精准获取并反馈评价信息;可视化技术有助于分析和探索大规模复杂评价数据,对公众理解和发现教育规律起到极大作用,是教育价值最直接的呈现形式[7]。智能算法借助相关工具将关涉个体成长发展的评价数据以可视化图表等更直观的形式进行输出,评价对象可以从中获取个性化的分析数据与精准化的反馈结果,从而了解自身的优势与不足。此外,对学生个体差异与个性化的忽视导致教育评价陷入同质性的困境,难以为改善评价对象的发展状况提供实质帮助。在大数据时代,算法推荐能呈现适用于特定群体和对象的评价内容,回应教育评价中所存在的客观差异。智能算法对评价数据复杂性与差异性的关注促成了评价活动的动态性是算法推荐的重要价值体现。
1.4 数据管理,实现预测性、前瞻性的发展评价
高质量的教育评价离不开大数据技术的支撑,然而,目前教育评价数据的运行中仍存在一些问题,如不同机构之间的数据获取难度大、数据缺失、数据壁垒等现象。随着大数据管理技术不断提升,数据管理功能依托特定的技术或平台对所采集的海量数据进行分类、归纳、分析等处理,使复杂多样的评价数据处于有序的状态。
数据库是对海量数据进行整合分析的有效手段,教育评价活动在信息技术支撑下可以形成评价数据库,从而有效实现对海量评价数据的管理。目前的大规模教育评价项目均依托互联网实现大范围合作式评价开发、施测、过程与数据管理[9],形成包含学生学业质量与多主体背景的调查数据库,满足学生、家长、教师、教育管理部门以及教育研究者等相关主体对评价数据应用的需求。建立大规模的追踪数据库是实现预测性、前瞻性的发展评价的必要支撑,也是实施增值评价的前提条件,利用数据库能够对评价数据进行统一管理与持续追踪,系统地掌握评价对象在一定时间段内的发展与成就变化。同时,数据管理有利于对数据进行横向与纵向分析,对于了解学生学业成绩的发展情况,建构学生学习过程常量,科学、全面地评价学生的学习过程,也能够提供重要的数据支撑[4],真正实现发展性学生评价。维克托·迈尔-舍恩伯格(Viktor Mayer-Schnberger)等曾提出了大数据改善学习的3大核心要素:反馈、个性化和概率预测[3]104,对大数据进行管理不仅仅是关注过去或现在,更重要的是能够对个体行为偏好以及成就表现等数据进行预测,帮助评价对象及早了解自我发展态势。不论是学校评价、教师评价抑或是学生评价,其中内含促进人的发展的最终要义,在大数据管理体系的不断完善之下,对评价对象发展路向进行规划的可能性随之提升,推动着教育评价向更具前瞻性的发展评价转变。
2 大数据时代教育评价的数据隐忧
人工智能时代的到来,促使我们进入到数字化世界之中。大数据何以可为,又有何不为?从评价数据采集到数据分析,再到评价结果的运用,都可能产生不可预测的风险,大数据时代教育评价亦面临一定的数据隐忧。
2.1 数据采集触发数据伦理威胁
数字化时代,大数据是推动社会发展的关键力量,与数据有关的伦理问题也随之受到广泛关注。数据伦理是一种新型伦理关系,与信息伦理有着密切关联,可以认为是在数据运行中所形成的风险问题以及价值规范[10]。大数据本身无好坏之分,但与其他因素相互作用所产生的影响,可能远远超出技术和实践的直接目的。大数据时代教育评价所存在的数据伦理,首先表现为数据收集中对个体隐私的侵犯。教育评价中对评价对象进行全方位、全过程的数据采集,大量评价数据极有可能触碰到评价对象的个人敏感信息,加之相关主体对数据隐私保护不足,评价数据存在泄漏风险。其次,海量评价数据的价值更多源于二次利用,但在实际评价过程中存在数据滥用问题。在大数据时代一旦将事物数据化便可以改变其用途,一些数据在评价活动结束之后并未及时清理,可能会被未经授权的机构重新利用,数据主体的知情权未能得到保障,使得评价对象隐私被侵害的风险不断加剧。最令人不安的是不可预知的辅助数据集所构成的风险,这些数据集可以被用于重新识别个人数据。这意味着数据研究对象所面临的风险并不局限于项目研究本身的范围和寿命[11]。最后,尽管在人工智能背景下评价数据采集手段日趋多样,但由于多样性、动态化情境的制约,数据的完整性难以保证,尤其是当多个数据集同时使用时,这些错误和差距也会被放大[12]。在此情况下,可能形成对评价对象的认知偏差,所带来的身份固化在一定程度上加重教育评价的不平等。大数据采集所具有的倾向性也可能会损害评价对象的正当权益,由于我国地域广阔、民族众多,受不同文化的影响,我国的教育存在很大的区域差异、民族差别,评价数据采集中的偏向性可能会导致算法歧视风险[13],数据叠加算法容易造成对评价对象的偏见与歧视,从而产生新的教育不公平。
2.2 数据使用陷入主体规训困境
自启蒙运动以来,人是理性自主的存在这一观点广为流行,人的主体性被推至极高的位置,“主体性问题是哲学的核心问题,也是教育的根本问题,人的主体性是教育追求的重要目标。”[14]大数据时代,海量数据支撑下个体的自主性与选择性似乎得以提升,但实际上“人的主体地位遭遇挑战,甚至可以说,是人类以一种乐观自愿的期盼把主体性让渡于自己创造的技术。”[15]个体所具有的认识主体地位意味着我们无法将评价对象视为可以规训与塑造的客体,但在大数据驱动下却极易陷入数据依从的困境。
首先,教育评价中的数据取向促使人们越来越相信只有通过大数据才能探寻评价对象成长发展的规律,个体对数据的依赖与日俱增,自我的批判性思考与判断力被迫让位于丰富的数据,在大数据的裹挟之下导致个体主体性的迷失,最终形成对数据绝对依从的尴尬局面。其次,大数据支撑下教育评价的主体规训还表现为将人存在的多样性和差异性抽象为统一的数据,正如将学生的认知活动、情绪体验以及教师的教学智慧等因素用无生命的数据进行简单化理解,个体沦为“单向度的人”将成为既定的事实[16],进而导致个体在教育评价大数据所建构的数字世界中日益感到价值迷失与意义失落。最后,大数据时代的数据权力成为支配他人的隐形力量。“算法权力从表象上看是一种技术权力,但其背后潜藏着控制算法设计和研发过程的资本的权力,而且在不远的将来,算法权力有可能会脱离人类的掌控并演化成人工智能对于人类的技术优势甚至是霸权。”[17]教育评价通过对海量数据进行深度分析从而为评价对象画像,基于技术手段掌握评价对象的个人偏好,在某种程度上可以引导个体的思维和行为选择,个体的自由意志被消减,在有限理性之下,对评价数据的依赖不断增强。“我们流连于层层叠加的数字景观,却唯独看不见景观中的他人。”[18]人的主体地位受到挑战,只能被动地等待数据所呈现的结果,并以此来进行价值判断与行为选择,迫使个体放弃对数据之外空间的探求。
2.3 数据使用存在边界迷失
数字思维范式在现代社会中备受推崇,计算主义的核心思想是一切认知都可进行计算。从本质上说,大数据是人类探索理解和量化世界的新进展[19]。大数据时代教育评价同样受到计算理性的支配,力求在评价过程中让数据说话,寻求其可确定的部分,从而避免评价中不可预测的危害。但确定性与不确定性是客观世界的固有状态,任何对确定性寻求的努力都存在着不确定性。由于认识的不可穷尽性以及个体生命的无限可能性,教育评价活动同样内含复杂性与不确定性,这种不确定性使得评价数据本身以及数据结果的应用边界具有限度。
当数字技术主导教育评价时,评价者对数据的使用常常陷入边界迷失的漩涡。一方面,大数据时代的教育评价希望通过所获取的丰富数据建构出真实可信的世界,将不确定的因素用确定性的数据来进行表达,充分利用算法模型发现评价数据内隐价值,以此实现基于已知推测未知的美好愿景;通过大数据以及算法的运行使评价对象的成长发展可预测,努力揭示关于评价对象发展的确定性规律。另一方面,在技术主导下,大数据叠加算法强行对教育评价中的偶然性因素进行限定,运用评价中获取的多源数据对评价对象进行概率预测含有对个体改进路径进行限制的意味,这本身就是对数据边界的一种忽略。基于大数据的教育评价建立在铲除风险的基础之上,这虽然具有数据上的合理逻辑,但当教育评价对数据的使用迷失边界时,学生的发展空间、教师的教学空间也随之受到束缚。在此之下,教育者需要深入思考:在数据越来越多地影响教育评价的环境下,人们使用大数据的目的是什么?某种程度上,评价者使用大数据是为了满足对可量化秩序的渴望,而这种对数据的信任使评价者可能会被数据的虚假魅力所迷惑,并赋予数字更多的意义,此时评价数据背后的教育本质可能被遮蔽。教育评价对数据价值的盲目扩大回避或者是缺少了对什么是好教育的追问,实际上,任何教育规律的揭示,都无法回避对理想教育追求的目的性规约[15]。大数据时代下教育评价对数据的应用不应迷失其内在的边界,从而忽略对美好教育的向往与追寻。
3 以三重判断破解大数据时代教育评价的数据隐忧
教育评价是基于事实与价值的实践性活动,价值判断是教育评价的本质特征,而合理的价值判断需要以科学的教育价值观为基础。在大数据时代,要充分实现数据的教育价值,评价者需立足人的发展立场,通过正当性判断、价值性判断与有限性判断三重教育判断来破解大数据时代教育评价遭遇的数据隐忧。
3.1 通过正当性判断化解数据伦理困境
正当是一种基本的价值评判,正当性是一切社会行为的准则,也是教育行为的前提和规准。“正当性的探寻”意味着教育哲学研究必须对教育行为作一个规范性的判断:何为正当性的教育行为[20]。在计算主义的支配下,对教育行动在理性层面的正当性判断被忽视,有必要探寻大数据时代教育评价的正当性。教育评价中的正当性判断表现为相关主体对评价过程做出规范性的判断、赋予数据以人文关怀,寻求数据理性与个体情感的融合。
在大数据时代的教育评价中,正当性判断首先意味着教育评价数据的采集、分析以及反馈等环节中的合法性。大数据的有效性并不意味其具有正当性,评价数据收集、分析与管理过程要遵守数据规范,评价者要明确哪些评价数据可以采集以及何种评价数据可以进行公开共享,应使数据运行合乎教育目的,确保评价对象的隐私边界得到保护。其次,大数据背景下教育评价的正当性判断应始终坚持的评价原则是,要让参与的实践主体都能享有一定的评价权利,让每个评价对象都能获得一个公平公正的评价结果和发展权利[21]。教育评价的正当性并不能仅仅以满足多数人的要求为标准进行衡量,评价者需要明确教育评价所要实现的目标,提升理性思维能力,判断何种数据可以进入教育评价视野,充分关注到评价对象个体差异和其自身发展需要与内在潜能,减少对部分群体的偏见与歧视。最后,大数据时代教育评价的正当性判断需要坚守,把人文关怀作为技术活动首要考虑的因素[22]。教育评价中所获取的大数据只是提供一种事实参考,并不能代表评价对象发展的全部,当个体的成长受到过去数据的约束从而遭受不公正的待遇时,尤其需要评价主体以更具人文情怀的态度来审视评价大数据对个体发展带来的冲击,营造更具教育性的评价氛围,认识到评价对象并不是冷冰冰的数字,而是具有丰富情感的人,使评价对象在评价过程中能够获得积极的情绪体验。当评价对象被不断地数字化和算法化的时候,这种伦理困境应当引起人们的重视,而此时正当性判断也显得尤为重要,它显示着对更科学合理的教育评价的渴望。
3.2 通过价值性判断促成评价对象主体性回归
人是事实性与价值性相统一的能动主体,人与客观世界之间既存在事实关系,也存在价值关系,价值性则反映了人与外界的价值关系。价值性判断是一种关于合理性的判断,是关于好与坏、善与恶、利与害、正当或不正当、合理或不合理等的判断,它解决的是客观事物对主体需要的关系“应怎样”的问题[23],大数据背景下的教育评价需要回应并处理好人与数据之间的价值关系,因为教育世界是人类意义生成的世界,教育活动是一种价值关涉的活动,教育活动本身具有内在的价值向度[24]。从教育的立场即人的发展立场出发,数据技术仅仅是认识主体的延伸,大数据时代的教育评价需要在主体价值观的引导下开展活动,需要满足个体的需要和意志,而不能任由技术来改变作为认识主体的基本属性[14]。教育评价中的价值性判断表现为评价者不是仅仅利用大数据转化为特定的行动,而是能够借助数据判断何种行动对评价对象是适切的,以及这种行动为评价对象所带来的价值[25]。在评价过程中始终追求评价对象的发展以及个体主体性的生成,这也要求评价者所采取的行动始终是面向未来的、开放的,而不是对过去或现在的重复。
在大数据时代的教育评价中,数据为评价主体采取行动提供了可能的途径,至于是否会转化为现实仍需要基于教育立场的价值性判断,要规避数据对个体可能带来的规训风险,摆脱对数字魔力的迷信[26],避免沦为数据化的教育评价。这种数据化的教育评价本质上是一种外在性的教育评价,并未涉及对人的内在性进行描述和判断[21],仅仅关注能以数据所表示的指标维度,而个体发展复杂性与多样性被遗忘。事实上,教育评价过程不仅仅是数据采集与分析的过程,更是进行价值判断的过程,大数据叠加算法无法取代能够表征人类主体性的专业判断能力,教育评价中数据取向所导致个体主体性迷失必须通过价值性判断予以弥补。评价者不仅要判断依据大数据所开展的事实判断和价值判断以及相应的评价行为方式对个体发展的影响,还要判断其教育潜力,这意味着评价者应具有一定的实践智慧,除了运用大数据衡量评价对象的发展之外,还要充分认识到个体发展的复杂性与无限可能性,为个体在数据之外建构可发展的空间。
3.3 通过有限性判断关照评价数据背后的教育本质
在大数据时代的教育评价中,有限性是指数据功能与作用的限度与边界,有限性判断则是指对数据功能与作用的限度与边界的评判。任何事物所起的作用均具有一定限度,都只能在合理的范围内发挥作用,如出现边界模糊,则可能会导致功能的泛化或僭越。正如海德格尔(Martin Heidegger)对技术与实践关系的分析,技术之所以在某些时刻不再是实践的手段,反而成为干扰活动的破坏对象,恰恰是因为在这些技术的使用中,使用者被“消散”了[27]。大数据时代的教育评价如果缺少对评价数据功能的限度与边界的考量,忽略数据背后真正的内涵与意义,尤其在评价目的之间发生冲突时,教育评价数据有可能被滥用。由此,在大数据时代的教育评价中需要进行有限性判断,这种有限性判断并不在于简单拒绝大数据在评价活动中的应用,而是不断寻求数据与人之间的平衡,明确数据及其使用的合理限度,促使大数据时代教育评价回归教育育人本质。
在大数据时代,教育评价以看似客观公正的数据和确定的结果,为教育与个体发展指明方向,导致人对数据的迷信而忽视数据背后的教育本质。首先,有限性判断需要体现评价理念的教育性,即基于大数据的教育评价应立足人的全面发展,对于评价对象而言,个体无法被完全数据化,大数据时代教育评价也无法表征个体发展的无限可能性,教育性是有限性判断的前提;其次,有限性判断需要彰显评价过程的伦理性,即评价活动的开展应该遵循数据伦理,大数据所具有的工具价值不能取代教育内在的育人价值,要避免教育评价中的“灯柱综合征”,寻求人的发展而不是陷入数据的泥潭。最后,有限性判断需要凸显评价结果的成长性,评价最终指向的是个体的可持续发展而不是反映当前的发展。关注数据背后的教育本质,促成评价数据教育价值的回归是大数据时代教育评价的应有之义,“如果我们怀疑纯粹本质的存在,或者不去问纯粹本质,而把现实的一切置于优先考虑的地位,那本质的问题就会被遮蔽”[28]。在大数据时代的教育评价中,如果评价者只关注评价数据所体现的现实意义,而忽略数据的教育本质,那么,数据背后的教育本质与功能就会被遮蔽。
在大数据时代,大数据支撑下的教育评价所实现的立体评价、即时评价、动态评价以及发展评价构建起一幅教育评价的全新图景;然而,当教育评价中数据的教育本质被搁置,教育评价促进个体全面而有个性发展的功能就会因陷入数据泥沼而无法实现。意识到大数据背后的风险,警惕大数据运用于教育评价带来的隐忧,进行基于人的发展立场的教育判断,让大数据为教育评价服务而不是数据凌驾于人的主体之上,这是新时代教育评价改革中对技术、数据与人之间关系的理性回应。
参考文献: