在“测评公开课”第二期直播中,华东师范大学杨向东教授为大家深入浅出、条分理析地讲解了“素养导向的评价体系”。讲座过程中,评论区中老师们提问踊跃,有的关注理念探讨,有的涉及实践困惑。但因时间所限,有些问题没能在直播时得到解答。为帮助老师们更好地理解“素养导向的测评”,直播结束后,杨老师对其他问题进行了详细的文字解答,供大家参考~
素养导向评价体系的构成
Q1构建一个完整的素养评价体系,应该包含哪些内容?是情境性任务+素养评价标准吗?
答:一个完整的素养评价体系,如果是和基础教育阶段的课程和教学相整合的,至少应该包括:(1)共享的素养目标体系;(2)基于共享素养目标的、纵向的预期学业表现描述或进阶;(3)多样化的评价任务(包括但不限于表现性评价任务);(4)基于学业标准或进阶的评分标准;(5)系统合理的施测、证据收集、提取、推断和解释的测评模型和技术。
Q2请问思维品质或思维能力的素养在测评中如何体现?
答:关键是如何理解课标中所说的“思维品质”这个素养的内涵。
如果思维品质是指学生在听读或写说中对信息的提取、组织、提炼或解释、推断,那传统的阅读或写作评价任务就可以体现。
如果思维品质是指批判性思维或创新性思维,则需要根据批判性思维或创新思维的确切内涵,比如质疑能力、逻辑或论证的严谨性、观点或方案的新颖性等方面进行评价,那么创设模糊或开放性的任务,让学生根据现实任务或情境的多重限制条件,形成恰当的书面或口头文本,就比较合适。
但如果思维品质不仅指如上方面,还包括不同文化背景下人们的思维-行为模式,比如中国人重感情,强调人际和谐,美国人强调人际边界和隐私保护等。这些在特定交际情境下都会有所体现,那么在设计评价任务时,就需要寻找和创设能够彰显这种文化差异的场景或任务,从不同文化群体在特定主题情境下的文化思维内涵出发来分析和评定。
Q3过程性评价中的真实表现性任务感觉有点像项目式学习,这个理解对吗?
答:项目式学习、表现性任务、真实问题解决,都是本次素养导向课标理念的重要构成。从这个意义上,的确,单元过程性评价中依托的真实表现性任务和项目式学习中要学生完成的有现实意义的项目是有一定关联的。但两者也不完全一样,和项目式学习中常见项目相比,单元的真实表现性评价任务可以在结构上更为松散一些,可以更为灵活地设计一系列任务。但是,在评价指向、需要获取的证据上的要求则比用于教学的项目要更为明确一些。具体来说,在评价指向上,要能包含所有的单元素养目标;在需要获取的证据上,无论是证据收集方式、证据类型,还是证据的数量或充分程度上,都需要确保对每个评价目标进行评定的效度(是否准确)、信度(是否可靠)、可推广性(是否有一定范围的普适性)和公平性(是否会对某个或某类学生产生不利情况)。
Q4表现性评价和过程性评价有什么区别?
答:两者是在不同维度上的划分。表现性评价是就评价形式而言的,是和书面的纸笔考试形式相对的。常见纸笔考试中的题目大多是像选择、填空、简答等形式的题目,有标准答案,通常不需要学生动手实践,也不需要制作产品。与之相对,表现性评价通常要求学生解决现实性任务,需要动手操作,需要制作产品(artifacts),通常没有标准答案,需要研制等级性评分标准对学生表现进行评定。
过程性评价是就评价功能而言的,是和形成性评价、终结性评价相对的。在国外通常只有形成性和终结性评价这两种划分方法(也有人将诊断性评价作为第三种)。形成性评价包括课堂评价、作业和教师自编的单元测评等方式,其功能主要是通过评价支持学习;终结性评价即大家熟知的中高考之类的评价,其功能主要是对学生一段时间的学习情况进行评定,用于升学或确认资质(如发毕业证书等)。过程性评价是国内学者提出的,主要强调在任务(或项目)驱动的教学形态下,教学任务和评价任务的一体两面,突出与教学相伴随的评价,如课堂提问、小组汇报与质疑等;从而与教学结束之后的评价,如作业,单元测试等形成性评价分开。
两者关系:过程性评价可以采取表现性评价的形式,也可以采取传统的评价方式;原则上,表现性评价在形成性或终结性评价中也都是可以使用的,关键是要打破终结性评价就一定是纸笔的书面考试的旧观念。
素养导向的试题命制
Q5能不能提供一些指向核心素养的试题和评分标准的设计和分析?
答:与国际上素养导向课程标准强调跨学科素养不同,我国自2014年以来的课程标准(高中和义务教育阶段)都是从学科本质的反思出发,主要提炼的是学科独特的育人价值(即学科核心素养)。对外语类学科而言,语言能力、思维品质和文化意识,包括比较独特的第四个维度——学习能力,都需要在这个逻辑上进行比较清晰的内涵界定和彼此间区别、边界和关系的学理论证。在这个意义上,我国素养导向的课程标准有创新,但也带来如何根据这一框架,创设合理的、符合我国课标理念的、指向核心素养的试题和评分标准的挑战问题。课标颁布之后,希望我们国家外语类学科的专家和老师们经过尝试和研究,能够开发出在理论、框架和路径上都有较高质量的题目和评分标准。就目前而言,理论和实证方面的研究已经有一些(参考后面提供的阅读材料),但从质量和数量上讲都还相对有所欠缺。
Q6未来的中高考题目可能全部都是素养导向的测评题目吗?
答:理论上是可以的。但这里需要厘清几个概念。
首先,素养导向的测评题目不一定都是复杂情境下的、非常综合的开放性任务,也可以是站在素养测评理念下经过改造的传统测评题目,比如目前国外就有根据学科的学习进阶,通过改造选择题的选项来考查学生对学科核心观念的概念性理解程度的题目;也有在复杂情境下,通过适当结构化处理,明确考查某个素养,如科学探究能力,半结构化的、具有一定开放程度的题目等等。如果是这样理解下的素养测评题目,当然可以都是素养导向的。
其次,如果素养导向的测评题目都限于复杂情境下非常综合的开放性任务或表现性任务,那么从中高考的测试目的出发,只是采用这种题目来考查学生,其实会存在一系列问题。比如,这类任务非常耗时,在考试时限内,通常只能考一到两个题目,且评分标准研制耗时耗力却不一定确保质量,评分过程需要人工,既耗时也难以保证评分一致性,在现实的可行性上会受到一些影响;另外,不同学生的表现非常容易受到任务所选主题或情境的影响,进而影响到学生表现水平,导致效度和信度上的问题;再次,只依据学生在特定的一两个题目上的表现,很难保证学生的表现能够延伸到其他情境或条件下,可推广性也会是问题。对于高利害考试,这些方面都是需要考虑的因素。在这种情况下,将传统题目覆盖面广、容易保证信度的优点和开放性的素养题目生态效度较好,能考查高阶思维或综合实践能力等的优点相结合,是比较好的选择。
Q7能否在一套评价试题里转换情境,比如一套试卷里有龙文化和英雄文化?
答:当然可以。只要能够确保在效度上是对核心素养的全面而合理的考查,在信度上确保考试结果具有一定的稳定性和可推广性,一套试卷里可以采取不同的情境作为依托来设计题目或评价任务。相反,那种一张试卷套用一个统摄性情境的做法,反而是值得质疑的。情境的特殊性会在一定程度上限制题目类型、考查范围、涵盖的素养及其边界、相关领域知识和技能的深度和广度等一系列问题。从终结性考试的目的来看,这种做法(一张试卷一个统摄性情境)通常是不可取的。
跨学科素养评价的设计
Q8对于跨学科素养评价的设计,如何确保不同学科之间的素养要求能够相互衔接、有机融合,避免重复评价或遗漏重要素养?
答:关键是要有一个能统摄不同学科的跨学科素养模型,界定明确不同学科之间的个性贡献和共同育人价值;在此基础上,将这些素养与不同学科的课程内容体系和结构安排相结合,随不同学科课程进程开发一个素养发展规划图。有了以上提到的模型和规划图,就可以遵循课标理念,按图索骥,创设系列进阶性任务,分析不同任务指向的学科或跨学科素养构成,检核在整体上素养要求是否相互衔接、有机融合,以及有无重复评价或遗漏重要素养。
Q9构建一个完整的素养评价体系,应该包含哪些内容?跨学科教学中,是仅测量跨学科核心素养吗?
答:不一定。如果跨学科教学中渗透了具体学科的思维、实践方式或知识技能,当然也可以在跨学科教学过程中针对这些方面开展测评。但是,为什么要开展跨学科教学?其主要目的是什么?这是老师们在设计和实施跨学科的教学中必须要想明白的。从这个意义上来说,厘清了跨学科教学的主要目的,也就是指明了跨学科教学中测评的主要方向。
(免责声明:本文转载于《外研测评》公众号,转载旨在分享与交流,版权归属于原作者,文中观点与本栏目无关!如涉侵权,联系立删!)