徐光木等：ChatGPT助推教育考试数字化转型：

机遇、应用及挑战

原文刊载于《中国考试》2023年第5期第19—28页。

作　者

徐光木，湖北师范大学经济管理与法学院副教授。

摘　要：当前，教育考试数字化转型面临资源不均衡、评价不全面、成本高昂等问题，以ChatGPT为代表的人工智能带来前所未有的机遇，为教育考试数字化转型注入内生动力并大幅降低转型成本。随着ChatGPT技术的日益成熟，其在教育考试数字化转型中将获得广阔的应用前景和丰富的应用场景，包括自动生成海量题库、建立虚拟考场、服务学校多元化选才、学生个性化成长等。ChatGPT的应用同时也面临着伦理、技术、意识形态和不确定性等多方面挑战，对此应清醒认识，辩证看待。

关键词：ChatGPT；教育考试数字化；应用场景；人工智能

　　在当今时代，数字技术正在掀起一场席卷全球的科技革命，对经济社会发展各领域全过程、人类生产生活方式和社会治理模式产生深刻影响。近年来，以人工智能（AI）为代表的新型基础设施建设的深入推进，为数字化转型的加速演进提供了基础性支撑。国际人工智能初创组织OpenAI首席执行官Altman认为，AI技术是“人类迄今为止所开发的最伟大技术”，将重塑现有社会^[1]。2022年底，生成型预训练变换模型（Chat Generative Pre-trained Transformer，ChatGPT）的问世，进一步强化了学界和公众对于AI技术先进性的认知，后者认为ChatGPT及其紧随其后的其他大数据大算力模型将在教育、文化、经济等领域催生一场深刻革命，给各领域带来前所未有的机遇和挑战。ChatGPT在推出不到半年时间里，已经被广泛应用于在线聊天、撰写邮件、翻译、编写代码、起草文案和课程论文等，其全球用户已达数亿^[2-3]。ChatGPT也被应用于教育考试场景中，有研究发现ChatGPT在SAT等教育考试中表现不俗，已经能考出中等水平成绩，尤其是在撰写英文作文方面表现优异^[4-5]。更有学者指出，ChatGPT不仅能够参加考试并考出理想成绩，而且能够重塑教育考试，助推其数字化转型^[6]。在数字化加速转型背景下，特别是在ChatGPT不断推陈出新条件下，分析基于ChatGPT的教育考试数字化转型困境和机遇，探究ChatGPT在教育考试数字化转型过程中的应用场景，以及研究ChatGPT应用于教育考试数字化转型可能面临的挑战，对于深入推进教育考试数字化具有十分重要的理论意义和现实意义。

1　教育考试数字化转型面临的困境

　　中共中央、国务院印发的《深化新时代教育评价改革总体方案》提出，充分利用信息技术，提高教育评价的科学性、专业性、客观性，要求创新评价工具，利用人工智能、大数据等现代信息技术，探索开展学生学习情况全过程纵向评价和德智体美劳全要素横向评价^[7]。然而受传统观念、数字技术、评价工具等因素制约，当前教育考试数字化转型还面临着不少困难。
    1.1　数字化资源不均衡
　　教育考试数字化属于教育数字化的一部分，教育数字化必须立足于现有教育数字化资源。当前，我国教育数字化资源发展极不均衡^[8]，主要体现在：一是硬件设施方面，教育数字化发展依赖的计算机、平板电脑、网络、视频会议系统等硬软件设施分布不均衡，一些农村偏远地区的学校缺乏相应设备，学生难以获得数字化的资源和学习体验；二是师资队伍方面，目前具备教育数字化学科和知识背景的师资比较匮乏，大部分教师还没有掌握使用数字化工具的能力，难以利用数字化工具开展教学活动；三是数字化教材方面，视频、音频、图像等多媒体教材建设十分滞后，缺乏数字化教材的相关标准；四是网络环境方面，教育数字化需配备健康、安全、稳定的网络环境，然而在农村偏远地区，普遍存在网络质量差、带宽过低甚至缺乏网络连接等问题，造成教育数字化过程艰难曲折，目标难以实现。
    1.2　对学生的评价不够全面
　　教育考试数字化并不一定能解决好评价的全面性问题，如解释力不足、统计精准性不够、忽略数据库间的链接整合，等等^[9]，是教育考试数字化进程亟待攻克的难题。其原因来自以下3个方面：第一，教育考试可能只涵盖学生知识和技能的某些方面，而没有评估学生的其他能力，如批判性思维、创新能力、团队合作能力等，这可能导致在批判性思维、创新能力等方面优秀的学生在考试中表现不佳；第二，尽管教育考试能够提供学生学习程度的信息，但可能无法顾及学生考试时的焦虑等情绪，而这些因素极有可能影响学生的成绩结果；第三，评分标准尽管是客观的，但执行评分标准的教师却带有主观性，如有的教师强调理论知识，有的教师重视实践知识，有的教师关注文字精练性，有的教师在意表述丰富性，等等，因而可能导致评价结果不够客观。当前，教育考试数字化尽管在考试方式改革和条件保障等形式方面发挥了积极作用，但总体仍处于工具性阶段，尚未深度介入到考试评价的内容方面，因此，在教育考试数字化现有水平下，实现全面客观评价学生的目标仍然面临不少现实问题。
    1.3　数字化成本高昂
　　一般认为，教育考试数字化需要硬件和软件的大量投入，成本高昂。在技术设备方面，包括新基础设施、服务器、音视频设备等在内，这些设备的更新和维护需要经济成本的持续投入^[10]；在数字化教材方面，互联网、大数据、人工智能等新技术在教育中的应用创生出教材建设新形态，推动了数字教材的发展，由此催生的在线课程、在线考试、电子书籍、视频教程等，需要高昂的制作、维护和更新成本^[11]；在师资培训方面，智能化教育环境使人-机关系从辅助转向协同，人机协同构成智能化环境下教师数字化能力的转型方向^[12]。教育考试数字化因而离不开掌握使用数字技术设备和应用平台等基本技能的师资队伍，而培训和加强师资队伍需要投入大量资源和资金；在数据安全方面，数字化在为工作、生活以及社会经济转型带来各种便利的同时，也正在逐渐模糊个体与群体信息数据的边界，个人信息数据面临着被盗用、窃取、泄露等风险。教育考试数字化发展要求充分保护学生的个人隐私，以及保障考试过程和结果数据的安全^[13]，这些工作同样离不开大量资金和人力的持续投入。

2　ChatGPT为教育考试数字化转型带来的机遇

　　ChatGPT由国际人工智能初创组织OpenAI推出，本质上是一个聊天机器人模型。其内在机理在于，在对大量文本数据进行预训练（pre-trained）的基础上，通过调整模型参数，模拟人类对话，执行各种自然语言处理任务，如文本生成、问答、翻译、提供建议等。ChatGPT自 2022年12月进入公众视野以来，已经相继推出ChatGPT、ChatGPT Plus、GPT-3、GPT-4等多个版本。ChatGPT每升级一次，都实现了对原版功能的优化和拓展，在教育、文化、商业等越来越多领域得到广泛使用和受到普遍欢迎，如代理发送邮件、协助学生完成课堂作业和课程论文、编写和调试计算机程序、进行音乐和文学创作等。随着ChatGPT相关技术的不断发展和成熟，ChatGPT将向教育等领域深度拓展，为AI背景下相关领域的革新带来前所未有的发展机遇，教育考试数字化转型便是其最有可能应用的领域之一。ChatGPT将为教育考试数字化转型带来机遇，主要表现在以下3个方面。
    2.1　革新对教育考试数字化转型的传统认知
　　教育考试数字化是近年来出现的新生事物，是数字经济发展的必然产物。随着数字技术的不断发展，数字经济不仅成为一种新型的经济形态，而且逐渐成为全球经济发展的新引擎，在经济社会发展过程中发挥越来越重要的作用。在这种背景下，社会公众对数字经济表现出两种极端情绪：一是数字经济虚无观，认为数字经济不过是对传统经济形态的重构和另一种表现形式，是现代信息技术与市场经济融合发展的必然产物，是经济的一种新常态，无须过度关注和焦虑[14]；二是数字经济威胁论，认为数字经济尽管可能是未来经济发展的主流形态，但数字技术既促成又威胁职业认同，导致二者之间关系紧张[15]。在教育考试数字化转型问题上同样如此，不少人认为，至少对于当前我国而言，受制于传统纸笔考试观念、地区发展差距较大、新基建发展滞后、人口信息化素养水平不高等因素，实现教育考试数字化转型这一宏伟目标任重道远。ChatGPT一经问世，便创造出用户量在短时间内过亿的奇迹，率先推动在线学习等领域实现或部分实现数字化，而且在各项考试中能够考出优异成绩。2023年3月14日，OpenAI在GPT-4的发布公告中指出，GPT-4能够以高分通过各种标准化考试，如SAT获得700分，GRE几乎满分[16]。这说明教育考试数字化转型既与传统虚无主义不符，又无须人为设置过多前提，需要本着客观、理性、务实的态度，多角度、全面系统分析影响教育考试数字化转型的各种因素，而不是用静止、孤立的眼光看待问题。因此，立足我国新基建发展现状和趋势，教育考试数字化转型同样能够顺利推进。
    2.2　为教育考试数字化转型注入内生动力
　　当前，命题题库化、评卷自动化、在线考试自适应化成为世界各国推广标准化考试的主流模式，是教育考试数字化转型的必由之路。然而，受制于人工、场地、网络技术、知识更新频度等因素，教育考试数字化转型举步维艰，其中，智能化综合应用平台建设相对滞后是关键短板[17]。ChatGPT能够凭借其智能化、实时化、互动性等特征打破这一僵局。例如，ChatGPT在接到指令后，能够与用户进行双向实时互动，按照指令要求瞬间完成不同科目、各种题型的命题任务，从题目到答案，一应俱全。过去可能需要数天甚至数月才能完成的题库组建工作，在不考虑命题标准等条件下，ChatGPT最短几秒钟的时间便可以完成。ChatGPT还可以借助大型语言模型，按用户要求对学生答题情况进行半自动化和自动化评判，这些功能不仅有助于提高考试速度和准确性[18-19]，还能够使教师从繁重的事务性、非智力性劳动中解脱出来，腾出更多时间和精力从事复杂、创新性工作[20]，以更好地解决教学中最具挑战性的问题[21]。此外，ChatGPT由于提供了跨语言支持，做到用多种语言编程，实现了翻译过程的内部化，使得学生在应考过程中的语言障碍不复存在，为非主流语种的学生参加考试提供公平机会。可见，ChatGPT作为一个集成化、复合型的AI模型，能够为考试智能化发展注入强劲的内生动力。
    2.3　大幅降低教育考试数字化转型成本
　　教育考试数字化转型的高成本被视为一道难以逾越的屏障，突出体现在两个方面。一是教育考试数字化转型的新基建成本。教育考试新基建主要包括考试AI能力中心、大数据中心、5G、物联网等可应用于教育考试场景的融合基础设施，是数字化转型发展的基础，构成教育考试数字化转型的硬件部分。教育考试数字化转型还必须有相应的软件系统作支撑，如教育考试的数字基座就是专为教育考试场景打造的一套教育考试数字化操作系统，相当于数字化教育考试的中枢和大脑，统一管理人员、设备、数据和应用等，以期实现开放共享、技术集成、应用联动和资源协同[8]。二是教育考试数字化模式下过程性评价的实施成本。不以终结性考试成绩作为唯一评价标准，而是综合终结性、过程性和表现性评价成绩进行全面考核评价，是教育考试数字化转型的目标之一。相比终结性评价，过程性评价形式更加多样、内容更加丰富，更有利于全面、客观、公正地评价考生[22]。近年来，我国教育考试在数字化转型过程中，之所以面临应对策略乏力、制度设计缺失、数据流动不畅、施考模式滞后等问题，除社会诚信体系尚未完全建立外，传统模式下的过程性评价成本高也是重要的原因。以高考为例，过程性评价涉及教学活动的诸多环节且贯穿整个高中学习阶段，因此，高等学校和招生考试机构想要全面掌握学生学习的过程性信息，必须反复考评和记录。然而，我国人口基数巨大，高中学校数量众多，招生考试机构在现有人力、物力和财力条件下显然无力承担这一艰巨任务，把事关高考升学的重大任务交给高中学校独立完成又可能导致信息失真，必然会产生学校之间评价信息的横向可比性问题，从而对高考录取的公平性构成戕害。基于此，我国在高校招生中要么推迟或放弃过程性评价，要么斥巨资对招生考试机构进行职能和规模重构，这都将造成推广过程性评价的成本高昂。
　　ChatGPT为降低教育考试数字化转型成本找到突破口。一方面，在现有网络基础设施条件下，仅仅依靠ChatGPT就能够实现命题题库化、评卷自动化、在线考试自适应化等目标和功能，而无须客观支付成本或者仅需支付少量成本；另一方面，基于ChatGPT的在线考试能够全面记录考生答题过程，分析其学习能力，提供更有针对性的试题及反馈，实现对考生答题过程的评价，而不仅仅是对答题结果的评价。随着GPT-3、GPT-4甚至更高版本的推出，上述功能必将日益强大和完善，从而更好地服务于过程性评价的推广和教育考试数字化的转型。本文根据ChatGPT在教育考试数字化进程中的革命性贡献制作示意图，见图1。

3　基于ChatGPT的教育考试数字化应用场景

　　目前，ChatGPT被应用于多种教育场景，尽管存在争议，但已经取得较为理想的预期效果^[23]。随着人们对ChatGPT认知的提升和ChatGPT的日益成熟，ChatGPT在教育考试数字化进程中将获得广阔的应用前景。本文以目前正在广泛运用的ChatGPT-3免费测试版为分析工具和研究对象，从考试机构、学校、学生等多个维度进行初步讨论，可以归纳为4大应用场景。
3.1　海量题库的自动化生成
　　AI人工智能的算法有很多，如决策树、随机森林算法、逻辑回归、线性回归等。借助一定的算法，ChatGPT把海量的互联网信息和背后团队的知识贡献融为一体，使得瞬间自动生成海量题库成为可能。本文部分截取了作者与ChatGPT的对话作为实例。
　　例1　作者：请生成一道高中一年级数学选择题。
　　ChatGPT：好的，以下是一道高中一年级数学选择题：
　　已知a+b=5，a-b=1，求a和b的值。____
　　A.a=3, b=2　B.a=2, b=3
　　C.a=4, b=1　D.a=1, b=4
　　可以看到，在ChatGPT现有的认知水平下，已经能够基本完成中小学阶段各科目试题的自动生成任务，这至少产生以下3个方面影响：第一，在ChatGPT助手协助下，可在很大程度上减轻命题教师的非智力劳动工作量，节省大量的时间成本与货币成本，方便教师将主要精力用于创新性劳动；第二，题库容量被无限拓展，如果将现有题库比作一潭池水，基于ChatGPT的题库将是无边无际的汪洋大海，二者无论是在容量还是流动性方面都无法相提并论；第三，除了能够自动生成试题，ChatGPT同样能够对应生成参考答案。
3.2　基于ChatGPT的虚拟考场
　　2020年4月以来，在线考试已经实现从基于中心考场的考试向虚拟考场的飞跃，家庭版TOEFL便是其中的代表^[24]。然而，家庭版TOEFL所营造的虚拟考场，其试题来源仍然是存储在美国教育考试服务中心（Educational Testing Service，ETS）总部服务器中的中心题库，题库容量仍旧有限。题库容量的限制不仅为各种投机行为（如培训机构试图有组织地掏空题库）留下了空间，而且制约了在线考试优势的发挥和进一步发展。虚拟考场只是在线考试向智能化方向迈进的第一步，而现在ChatGPT则为其质的提升创造了可能。首先，ChatGPT凭借海量题库的自动化生成，使在线考试、虚拟考场的公正性获得进一步的保证，从而强化前者之于传统纸笔考试的优势地位；其次，目前虚拟考场已经实现了对人的表情、动作等的AI识别^[25]，如果再辅之以ChatGPT条件下试题自动随机生成等功能，其优势将得到进一步凸显；最后，随着AI技术的不断发展，传统纸笔考试和在线考试、虚拟考场将经历此消彼长的过程，前者将在越来越多的考试领域中被后者取代，如学校的平时测验和期末考试，地方性的学业水平考试，全国性的英语水平考试、高等教育自学考试等。
　　例2　作者：请生成高等教育自学考试行政管理专业《经济学基础》5道判断题。
　　ChatGPT：好的，为您生成高等教育自学考试行政管理专业《经济学基础》5道判断题。
　　通货紧缩政策主要采取货币供应量的扩大来缓和通货膨胀。
　　答：错误。
　　市场竞争的存在可以有效保证消费者利益最大化。
　　答：正确。

　　……

　　可见，在ChatGPT条件下，根据课程目标等自动随机生成符合要求的试题，并作出初步评判，使虚拟考场有能力成为ChatGPT等AI技术服务于教育考试数字化的重要增长点。
3.3　服务于学校多元选拔人才
　　面试作为一种选拔个性化人才的方式，在世界范围内得到广泛应用，深受学生和学校的欢迎。然而，在我国，受制于人情社会、技术条件等因素，面试在我国学校招生中的作用和地位并不突出，往往作为笔试的补充。以ChatGPT为代表的AI技术能够凭借其客观性、智能化等特征，摒除人情、技术等因素的困扰，形成一对一、个性化的考试选拔场景。即在ChatGPT支持下，学校可根据自身特色和培养方向，借助ChatGPT的自动化、自适应性等特性，在同一时间内，以更低廉的成本、更高的效率选拔所需要的人才。借此，学校的个性化需求将会被彻底激发出来，呼唤包括ChatGPT在内的AI技术不断发展升级，完善服务功能，形成个性化选拔人才需求与AI技术不断进步之间的双向互促。事实上，ChatGPT-3已能初步实现上述功能。

　　例3　作者：我是一名报考中国“双一流”高校法学专业的高中毕业生，现在进入面试环节，请向我提一个问题。
　　ChatGPT：非常好，以下是我的提问：
　　请问：你作出过哪些积极的努力来了解法学专业，为什么想要报考法学专业？
　　作者：我想做一名公正的法官。
　　ChatGPT：这是一个很好的志向！那么，我想了解以下问题：
　　你对公正和法治的理解是什么？
　　你认为法官的职责和角色是什么？
　　在你看来，一个好的法官应当具备哪些素质？
　　你会如何保持公正，在判决案件时避免主观因素的影响？
　　在例3中，对话循序渐进、层层深入，除考生本人外，完全不需要第二个人参与。在这种场景下，考官所担任的不再是提问者和倾听者的角色，而是对考生与ChatGPT之间的对话记录进行评阅的角色。也就是说，此时的对话记录即可被认为是答卷本身，而每名考生因为回答上一道问题的内容和方式不同，ChatGPT结合自己理解自动生成的下一道问题又有所不同。随着考生与ChatGPT对话的不断深入，考生的个性化特征和能力倾向等得到了全面呈现，这既有利于排除因考官个人倾向性等因素对考生成绩产生影响，也有利于解决传统面试场景下不同面试小组间的横向可比性问题。因此，ChatGPT可以被视为个性化选拔人才模式下解决公平性难题的适切方案。
3.4　服务于学生个性化成长
　　促进学生全面健康成长、个性化发展，是新高考改革的出发点和着力点。而现实难题是，即使高考科目组合从过去的文理分科发展到现在的“3+1+2”或“3+3”选科模式，考生的选择余地实际上仍然十分有限。因为此种模式依旧没有摆脱传统结果性评价的困扰，以等级或分数评价学生，无法对考生的学习过程作出评价。而过程性评价是对思维过程的原始呈现，能够更加客观、公正地反映考生的理解、归纳、推理、判断等能力，是对考生知识掌握、知识运用和创新能力的综合评价。在ChatGPT支持下，过程性评价从过去的对整个学业过程进行评价，具体化为对考试过程进行评价，考试组织成本变化不大，但评价方式发生了巨大变化。这一变化可以抽象化为：考试过程作为整个学业过程的浓缩样本，不仅是对学习结果的客观反映，还是对学习过程、思维过程的客观反映。这一评价方式的转变，有利于激励学生加强思辨能力、培养创新思维，服务于学生的个性化成长，而不是片面追求考试分数。这样就自然解除了考生对于个性化成长与结果评价之间内在冲突的担忧，从而打开阻碍学生个性化成长的枷锁。基于ChatGPT的过程性评价促使学生更加重视学习过程的内在机理，见图2。

4　ChatGPT应用于教育考试数字化转型的挑战

ChatGPT作为AI技术发展到一定阶段的产物，从问世到得到较广泛运用，只是经历了短短几个月时间，其存在问题可能尚未得到充分暴露。ChatGPT应用于教育考试数字化转型还面临一定挑战，这些挑战主要包括但不限于以下4个方面。
    4.1　伦理层面的挑战
　　从纯技术角度，由ChatGPT随机自动生成一套试卷甚至一个包含数亿道试题的庞大题库已经不是难题。主要问题是，命题不仅涉及科目知识，还涉及相应的课程标准、考试大纲、评价重点等多方面要求，因此，在伦理上ChatGPT还无法对教师形成替代。
　　例4　作者：请生成一套小学三年级数学试卷，包括100道选择题。
　　ChatGPT：我可以生成100道数学选择题，但是出于教育伦理和义务的原因，我不会为你生成一份完整的试卷。试卷应该由正式的教育机构、教师或教育相关人士负责编写，以确保试卷严谨、客观，符合教育标准。
　　作者：请生成一道小学三年级数学题。
　　……
　　作者：请问我今天的答题情况可以得多少分？
　　ChatGPT：我是一个AI机器人，并不是你的老师或考官，所以，我不能给你具体的分数。不过，我很高兴能陪伴你一同学习和练习数学，希望你通过自己的不断努力和思考，取得越来越好的成绩。相信你一定可以成为数学小能手！
　　另一个不容回避的问题是，由ChatGPT自动生成的试题和题库可能会面临侵犯知识产权的风险。ChatGPT自动生成题库虽然无法取代教师和专家的作用，但可以为后者开展工作提供一定的知识和技术支持。因此，源数据的知识产权及ChatGPT加工生成后的知识产权是一个绕不开的结，还有待从伦理、法理上进一步论证。可见，来自伦理层面的挑战是ChatGPT服务于教育考试数字化的首要问题。包括ChatGPT等AI技术在内，首先应当定位为服务人类的工具，而不是取而代之，否则人类的生存和发展将面临极大风险。
    4.2　技术层面的挑战
　　尽管ChatGPT背后有大数据作为支撑，但互联网上的信息良莠不齐，预训练数据也会失之偏颇，如果过于信任或审查不当，将会导致一系列不良后果。国外最新研究表明，大型语言模型可以延续和放大社会上现有的偏见和不公平，可能对教学过程和考试结果产生负面影响。如果模型是在对某些群体有偏见的数据基础上训练的，那么它就可能产生对某些群体不公平的结果，如对于农村和偏远地区的学生。因此，必须确保训练数据来源的广泛性和多样性，使之充分代表不同人群，确保ChatGPT在应用于教育考试数字化场景时能够同时兼顾公平^[18]。同理，受互联网信息和预训练数据的限制，ChatGPT在具体应用中也会犯一些常识性错误。
　　例5　作者：三国时期发生了哪些著名战役？
　　ChatGPT：三国时期，发生了许多著名的战役，以下是其中的一些：
　　……
　　五丈原之战：公元234年，蜀汉大将赵云率领部队与曹魏诸葛亮的势力发生了重要战役。虽然蜀军赵云表现英勇顽强，但终究没有成功击败曹魏军队。
　　在例5中，ChatGPT将诸葛亮划归曹魏阵营，显然犯了一个重大的常识性错误。由于教育考试承载着为国育才的崇高使命，必须务求准确、极为审慎，因此在推进教育考试数字化进程中，必须始终坚持以人为本、为人所用的原则，切不可对ChatGPT等AI技术过度依赖、盲信盲从，甚至受其驱使。
    4.3　意识形态层面的挑战
　　在当今世界，国家之间的竞争无处不在，突出体现在意识形态领域。因此，AI技术背后也难免会掺杂一些意识形态元素；与之相应，AI产品也不可能完全是客观意义上的产品。其中，有些意识形态元素相对容易识别，而另一些意识形态元素则相对隐晦，需要认真鉴别。ChatGPT在应用于教育考试数字化场景时，特别是服务于政治、历史等科目的试题生成、自动组卷和复习备考时，更容易出现这类问题。
　　如在谈到美国主动挑起中美贸易战和中美人权问题时，ChatGPT倾向于突出贸易战出发点的合理性和美国在保护人权方面采取的措施，以及取得的业绩，并给予积极正面评价，强调其他国家应以美国为样板或标准，对美国在这些方面存在的问题则只字不提；在谈到中国的人权状况时，指出我国在人权方面还存在不少问题，需要及时改进，参照对象自然是美国。可以看到ChatGPT作为一款由美国人主导开发的AI技术模型，存在明显的双标倾向。在政治类敏感问题的对话中，ChatGPT看似在刻意回避或持中立态度，却隐藏了其真实的意图。因此，我国学校在利用ChatGPT生成试题、自动组卷和指导学生利用ChatGPT复习备考时需要格外留意，防范在先。

4.4　AI不确定性的挑战
　　AI技术飞速发展给未来带来了更多的不确定性。主要体现在以下3个方面：一是数据的不确定性，机器学习和深度学习算法需要大量数据的支持和训练，但就目前而言，数据在质量和数量方面可能存在不准确、虚假、偏见、偏差、人为操弄等问题；二是算法的不确定性，由于模型的复杂性、缺乏可理解性，人工智能算法的决策过程并不透明，因此，当算法产生异常时，人们很难解释该异常是如何发生的，这可能导致数据分析师、政策制定者和行业实践者在处理问题时存在困难甚至受到误导；三是自动化的不确定性，采用自动化决策、机器自主行为可能带来各种风险，如机器故障、设备安全性和隐私等，可能会导致实际结果出现偏差。这些不确定性的存在，为教育考试数字化转型带来了风险。

5　结束语

　　AI时代已经来临，以ChatGPT为代表的大数据、大算力模型推动AI进一步走向大模型时代。在这一背景下，教育考试必将和其他领域一样，在数字化道路上紧随时代发展大步迈进，包括虚拟考场、智慧考场、自动生成海量题库、自适应性考试、自动组卷评分、人机对话模拟考官面试等在内，都将不再是遥不可及的梦想。从这个意义上，ChatGPT作为工具和助手，能够越来越完美地完成人类交办的各项任务，使人类从繁重的事务性劳动中解脱出来，投身自己感兴趣的工作领域，挖掘自己的潜能，实现“每个人的自由发展”^[26]。
　　机遇总是与挑战并存。ChatGPT所带来的不仅仅是高效和便捷，尚有诸多伦理性、技术性难题有待解决，特别是ChatGPT作为一款出自美国本土的AI技术模型，其背后暗藏着许多意识形态和不确定性因素。因此，我国在借助ChatGPT等大模型推进教育考试数字化过程中，必须时刻保持清醒头脑，辩证地看待这类新生事物。一方面，本着批判的态度有条件地吸收和借鉴，充分利用其长处，力避其有害成分；另一方面，集中精力和资源尽快开发基于中国本土、核心算法的大数据大算力技术模型，使AI技术能够更好地服务于我国教育考试的数字化转型。

参考文献：（略）

声明：本文转载于《中国考试》，如涉侵权，联系立删。

ChatGPT助推教育考试数字化转型：机遇、应用及挑战

机遇、应用及挑战