教育考试研究
EXAM SCIENTIFIC RESEARCHS
论教育测量的特点及对策

2018-06-24

在人类活动所涉及的各个领域都存在拧测量活动,教育测量是教育过程的一个重要环节是对教育及其创起的行为变化进行数量化的确定。教育的目的在于改变人们的行为,由于人类个体之间的差异,在相同的教育条件下,个体的行为变化并不相同,教育测量的核心内容就是科学的对学生的学业成就、思想品德及能力倾向等给出定量的解释。测量的种类很多,测量的方式千差万别,但是测量的基本特征是相同的,都是一种比较活泼,即把选定的标准参照物与测量对象比较而获得。比较的方式有两种,其一是标准参照物与测量对象直接比较。比如,测量教室的长度,选定米尺的一端与教室的一侧对齐,然后一次一次地把米尺摆正直到比较完毕,度量的结果就是与教室等长的米尺数。这种比较方法称为直接测量;其二是测量对象没有外显形体:比如社会现象、精神成果等,科学发展到今天仍然无法用一把“尺手”直接程度,无法进行比较,因此测量者只能选定一个  中介物用以引起测量对象的行为反应,由此推论出测量结果。这种通过中介物而获得测值的方法称为间接测量。由f学生的知识、能力、思想、道德等均无外形体,看不见也摸不到,因而,教育测量属于间接测量的范畴。直接测量对象的测量属性稳定,由此产生的测量工具通用性强,测量结果不受时限制。教育测量的特性受多种因素影响,且时刻在发生变化。因此,教育测量要比直接测量困难得多。这里所说的困难,不仅仅指测量值的获得,更主要的是指如何获得测量对象的真实水平,使测量具有较高的信度和效度。任何测量者力图使测量准确无误,为达此目的,教育测量研究人员不断地完善测量理论,改造测量方法,使教育测量愈加科学化。但不得不承认,就测量的信度与效度而言,教育测量较之物理测量还差得很远。首先,教育测量是一种抽样测量。当我们测量物理特性时,得到的是测量对象的全讯 ,例如-张桌子的氏度,是用米尺与桌予的氏度进行比较而获得;而对社会现象属性程度的确定只能采取抽样测量的方法.就学生的学业成绩而言,一门课程结束后,教师无法用该门课程的全部内容考核学生,这既行不通也办不到,学生的考试是有限制的,题目不可能无限地,即使没有时间限制,也无法把全部学习内容做为考核内容,试卷容量再大,也只能是全部学习内容的一个样本。即我们测量到的仅仅是全部学习内容的一部分。由此就产生了样本的选取问题,同一名学生,对同样的样组 (试卷 )得分一般是不相等的。显然,保证样组的科学性、合理性在教育测量中是非常重要的。选取样组的唯一条件是样组对全部的应考内容有较好的代表性。 其次,教育测量是种间接测量。教育测量的对象是学生的知识、智力、能力、思想等抽象形体,无法用量尺直接比,就只能通过一个中介物一一测验,引起学生的反应并由此推论测量对象的属性程度。测验并非就是学生的知识、智力、能力、思想等,它仅仅是一个剌激物,用以引起学生的行为而已。显然,这组刺激物是否标准是非常重要的。在一次小学生的数学能力竞赛中,有一边排列组合的问题(小学阶段还没有学习排列与组合),笔者问一名应试者是如何理解该题的,回答是:辅导老师告诉我们一个公式,见了这样题一套就往可见这类题目(剌激物)并没有考核到多少数学能力,即使学生完全答对也只能说学生具有套公式的能力,考核的仅仅是记忆。事实上,在许许多多的能力、智力等考试中,到底考核到多少想要考核的东西是值得研究的。教育测量的一个重要概念—效度就是用以反映剌激物的标准化程度的概念。效度是教育测量特有的概念。在物理特性测量中意义不大,因为没有人用秤去量桌子的长度。如何保证测验的有效性,至今世界各国均无好的办法,至多只能靠专家的经验。 再次,教育测量的工具局部有就由于物理特性稳定,人们创造发明了通用性很强的测量工具,由此测量结果不受时宅限制。一般来说,一公斤就是一公斤,无论是在哈尔滨还是在北京,无论是今天还是明天变化都不大,而教育测量不具有这种品性。教育测量的对象受多种因素影响,变化速度较快,加上测量者的认识水平、价值观念的差异,对同一测量特性所编制的量尺差异较大。例如在考试的百分制评分中,80分比70分多10分,60分比 50分多10分,这两个相差的 10分,并不是由相等的标准确定的,即各个不同的分数段其单位并不相同。因此,教育测量的结果受一定时空限制,只有相对的意义,为了克服教育测量的这一缺点,当前最有效的办法是施行标准化考试,并把考试分数转换成某种量在分数,进而使教育测量结果也有较大的通用性。教育测量的特点,实际上就是教育测量与物理测量相比的不足之处,两种不同性质测量的差异,对教育测量方法的改进显然是有益的。事实上,教育测量的许多方法借鉴了物理测量。当然,必须清楚的是建立在真分数理论上的经典教育测量理论。在教育测量的实践中越来越暴露出难以克服的弱点。研究人员一方面不断地完善经典教育测量理论,增进教育测量方法,同时也另辟新径,新的教育测量理论——项目反映理论己经在教育实践中显出其优越性。 出处:申亚权.论教育测量的特点及对策[J].北方论丛,1997(1):113-114. (文章内容有调整和删减)

解说专业级差

2018-06-12

考生在阅读“招生章程”的时候,录取规则中常常会看到“专业级差”这个词。很多人不明白为什么院校在录取考生时,要使用“专业级差”这种方式安排专业。什么是“专业级差”,如何理解“专业级差”这个概念呢? 什么是“专业级差”? 所谓“专业级差”是院校在安排考生专业时,按招生章程中公布的一个或几个分数值,来确定选报不同专业志愿考生的录取专业,这种分数值就是“专业级差”。也就是院校在录取考生第一专业志愿和非第一专业志愿时的分数差额,各专业志愿间级差分数,如3分、2分、1分等。 例如,某高校规定:对进档考生的专业安排,实行分数级差的办法,级差分为“3、1、0、0”。也就是说,该校第一、二专业志愿之间分数级差为3分,第二、三专业志愿间级差为1分,其余专业志愿之间级差为0分。 “专业级差”如何安排专业? 具体来说,在这种方式下院校将进档考生按分数由高到低排队,首先检索位次排在第一的考生第一专业志愿,如该考生第一专业志愿符合专业录取要求且专业未满额,则被录取,然后继续检索位次排在他后面考生的专业志愿。如果该考生第一专业志愿已经满额,则将该考生考分减去预先设置的相应级差,并将其第二专业志愿视为第一专业志愿,再以考生减去专业级差后的分数,参加其第二专业志愿的位次排序录取,以此类推。直至考生专业志愿处理完毕。如果没有符合要求的专业,则看其是否服从专业调剂,将其调剂到还有计划余额的专业中去,如果考生不服从调剂,则被退档。 方便理解 举例说明 假设学生小明报考A高校,考了560分,其专业志愿分别为:计算机、国际贸易、自动化、机械工程、电子商务,A高校的专业录取实行专业级差的办法,级差分为2分、1分、1分、0分。 在进行专业分配时,如果小明的第一专业志愿符合专业录取要求且专业有计划余额,那么小明被录取到“计算机”专业;若计算机未被录取,则他的分数将会被减去2分(即558分),按558分的成绩同第一专业志愿报考“国际贸易”的考生排序,确定是否符合专业录取条件;倘若仍不能满足,分数再减去1分(即557分)进行第三专业志愿“自动化”的录取;若依旧不能满足,分数再被减去1分(即556分)进行第四专业的录取,后续专业如果仍不能满足其专业志愿,将不再减分,以此类推。 没有规定专业级差的学校,在分配专业时,有的采取志愿优先的原则,即首先满足第一专业志愿考生;有的采用分数优先的原则,优先录取分数高的考生。“分数优先”和“专业优先”比较好理解,分数优先考虑的是考生的分数情况,专业优先考虑的是考生的专业志愿情况,而“专业级差”方式则同时兼顾了考生的分数和专业志愿两种情况进行录取。 (转自教育部阳光高考信息平台)

高考语文答题时间、分配策略

2018-06-06


 
 一、总体原则
 
 
 总共150分,考试时间150分种,平均每分钟得1分。要给作文留足50分钟的时间。
 
 
 二、各个题型时间分配
 
 
 1.论述类文本阅读,3道选择题,共9分,大约需要10分钟。
 
 
 2.文学类文本阅读,1道选择题,2道简答题,共14分,大约需要15分钟。
 
 
 3.实用类文本阅读,2道选择题,1道简答题,大约需要15分钟。
 
 
 4.文言文阅读,3道选择题,1道翻译题,共19分,大约需要16分钟。
 
 
 5.古代诗歌阅读,1道选择题,1道简答题,共11分,大约需要10分钟。
 
 
 6.名篇名句默写,6个空,共5分,控制在2分钟左右。
 
 
 7.语言文字运用,大约需要20分钟。
 
 
 8.作文,共60分,最少需要50分钟,这是底线。即使时间不够,最好也有一个提纲,再动笔。
 
 
 语文答题时间怎么分配
 
 
 一、考前20分钟到达考场
 
 
 太迟了,来不及安心定神,进入考试角色的心理准备时间太短,有可能导致整个考试在慌乱中度过,造成不必要的失误。
 
 
 二、开考后前5分钟
 
 
 1. 发卷前,首先暗示自己:这只是一次平常测验!我自信,所以我成功!
 
 
 2. 接到试卷,要不慌不忙地在规定处按要求写上姓名、填涂考号、贴好条形码,然后检查试卷、答题卡是否有缺漏、破损情况。
 
 
 3. 接下来快速浏览全卷,大体弄清试卷的版块结构、各种题型,此时切忌一边看题一边急着抢时间考虑答案,因为你不能指望哪道题可以一眼看出答案。对于作文,无论是什么题型,无论是否熟悉,都不必深想,相信自己一定有话可说,一定可以写好。大体浏览一遍,心情就会慢慢放松,等到答卷铃响,就可集中精力答卷。
 
 
 三、开考后前30分钟
 
 
 1. 做选择题力避两种倾向:一是一味抢时间、求速度,这样势必导致审题不严,思考不周密,从而出现不应有的失误;二是速度过慢,太过谨慎小心,甚至反复徘徊不敢选。
 
 
 2. 选择题审题要细,一定要看清选是还是选非,可以在题目的正确与不正确等这样一些字眼上加上着重号。
 
 
 3. 做选择题要有一次成功的意识,既注意考点设置,又要凭借语感。如有二选一时干扰性极强的情况,也一定要在认真辨析的前提下,定下一个预选答案,这时可在题号前打一个问号,以备做完后有针对性地检查。
 
 
 4. 选择题每做一题,必须在题号前写明答案,切忌在选项上打,这样可能导致填涂失误;也不要选定一个便手忙脚乱在卡上填涂一个,这样会阻碍思维。
 
 
 5. 选择题全部做完后,便集中时间填涂答案,要注意:首先在所选答案的方框内一次性做好记号,如打小,或者涂黑点,并按题号再一一核对无误,然后一次性按要求规范填涂。
 
 
 四、开考后30-90分钟
 
 
 1. 即开考后一个半小时内要完成作文以外的所有试题。
 
 
 2.因为是网上阅卷,同学们在答主观题时一定要有强烈的规范意识:
 
 
 一是书写规范,卷面整洁。答题卡上不允许书写潦草,乱涂乱画;
 
 
 二是对号入座,按题号在规定的矩形框内作答。绝对不能张冠李戴甚至私自改动题号,这样会导致扫描无效,判分为零。
 
 
 三是要点分明,表述规范。主要是诗歌鉴赏与现代文阅读中的一些题型,一定要据分值设定要点,先观点后阐释。
 
 
 五、最后1个小时
 
 
 1. 作文时间要确保50分钟,利用10分钟左右的时间审题立意,并列好提纲,然后用40分钟左右的时间形成文字。
 
 
 2. 作文要力避扣分点:缺题扣2分,字数每少50字扣1分,错别字或卷面脏乱扣分,不完篇扣分等。
 
 
 3. 网上阅卷,书写以清晰、整洁为原则。字不宜过小或大而潦草,或用力过轻;如有写错处,字数少可用橡皮擦,字数多最好用直尺在上面划一横线,不允许用其它方式夸大暴露问题。
 
 
 4. 留下3到5分钟做全卷的检查,不要轻易改动选择题答案。 
 
 
 
 
 
 
 
 
 (转自教育部阳光高考信息平台)
 


浙江新高考制度改革方案

2018-05-10

一、指导思想 全面贯彻党的教育方针,适应经济社会发展对多样化高素质人才的需要,从有利于促进学生健康发展、科学选拔各类人才和维护社会公平出发,实施高校考试招生制度综合改革,构建更加公平公正、科学高效和灵活多样的高校考试招生制度。 二、工作原则 遵循教育规律和人才成长规律,把促进学生健康成长和全面而有个性的发展作为改革着力点,深入推进素质教育。强化分类考试、综合评价和多元录取机制,增加学生的选择性,分散学生的考试压力。加强政府宏观管理,健全社会监督机制,确保高校考试招生公平公正。 三、基本内容 全面深化统一高考招生改革,进一步完善高职提前招生、单独考试招生和“三位一体”招生改革,加快建立多类型、多元化考试招生制度。 实行统一高考和高中学业水平考试(以下简称高中学考)相结合,考生自主确定选考科目,高校确定专业选考科目及其他选拔条件要求,综合评价,择优录取。   (一)科目与分值 必考科目:语文、数学、外语3门。外语分为英语、日语、俄语、德语、法语、西班牙语。 选考科目:考生根据本人兴趣特长和拟报考学校及专业的要求,从思想政治、历史、地理、物理、化学、生物、技术(含通用技术和信息技术)等7门设有加试题的高中学考科目中,选择3门作为高考选考科目。 语文、数学、外语每门满分150分,得分计入考生总成绩;选考科目按等级赋分,每门满分100分,以高中学考成绩合格为赋分前提,根据事先公布的比例确定等级,每个等级分差为3分,起点赋分40分。考生总成绩满分750分。 语文、数学成绩当次有效,外语和选考科目成绩2年有效。 (二)考试 依据高校人才选拔要求和国家课程标准,科学设计命题内容,增强基础性、综合性,突出能力立意。主要考查考生运用所学知识独立思考与分析问题、解决问题的能力。 语文、数学考试于每年6月进行。外语每年安排2次考试,1次在6月与语文、数学同期进行,考试对象限于当年高考考生;1次在10月与选考科目同期进行。选考科目每年安排2次考试,分别在4月和10月进行。外语和选考科目考生每科可报考2次,选用其中1次成绩。 (三)录取 高校根据自身办学定位和专业培养目标,分专业类或专业确定选考科目范围,但至多不超过3门,并在招生2年前向社会公布;考生选考科目只需1门在高校选考科目范围之内,就能报考该专业(类)。高校没有确定选考科目范围的,考生在报考时无科目限制。 高校可对考生高中阶段综合素质评价提出要求,作为录取参考。 根据实考人数的一定比例,按照考生高考总分(含政策加分,下同),分段填报志愿、分段录取。 1.分段办法。分三段,分别按实考人数的20%、60%、90%确定。 2.志愿设置。实行专业平行志愿。一所学校的一个专业(类)作为一个志愿单位。考生每次可填报不超过80个志愿。 3.录取流程。第一段考生先填报志愿,随即投档录取;剩余计划重新公布,未被录取的第一段考生和第二段考生填报志愿,再组织投档录取。以此类推。第三段志愿填报和录取后,如仍有院校专业(类)未完成计划的,经学校申请,可适当扩大比例征求志愿。 4.投档办法。以考生符合所填报志愿的选考科目范围为前提,根据考生高考总分,实行专业平行志愿投档,直接投到考生所填报的具体学校的具体专业(类)。投档比例为1:1,高考总分相同的考生,依据位次、志愿顺序投档。 5.考生位次。根据所有考生高考总分确定。考生高考总分相同时,按文化总分、语文数学总分、语文或数学单科成绩、外语单科成绩、选考科目单科成绩高低排序,全部相同者为同位次。

教育测量在教育评价中的角色

2018-03-02

教育评价是教育实践活动不可或缺的组成部分。不管是全国教育质量的监控、学校课程的建设、教师水平和效率的分析,还是学生学习情况的掌握,都离不开教育评价的介入。在教育这样一个复杂的开放性系统中,学习、评价、反馈和控制是四个必备的功能。教育评价作为其中的重要组成,对于保证教育系统的健康和成长起着非常关键的作用。 教育系统中的评价活动是非常复杂的。教育评价在教育理论和实践中的表现形式也是多种多样的。正确认识教育评价在教育系统中的内涵、范围、组成与方法具有重要的理论和实践意义。然而,许多教育研究和实践工作者常常将教育评价单纯地理解为教育测量,从而将教育评价活动简单地与教育测量的研究范畴相等同。由于教育评价和测量学的理论框架都是源于西方,这种理解上的偏差不可避免地具有语言障碍上的原因,即如何辨析敏育评价(Educational Evaluation ) 和教育测量(Educational Measurement)在语义上的异同。但是,更具有意义的则是如何从学科的角度来理解两者的关系,以促进两个学科的进一步发展。基于这种理解,本文不准备在语义上对教育评价和敏育测量进行辨析,而是将要着重分析作为她立学科的教育测量学与教育评价在研究的问题、范畴以及方法等方面的交叉和不同,并在这种分析的基础上讨论教育测量学在教育评价中所应扮演的角色。 测量是科学研究的基础。从方法的角度来讲,现代意义上的科学的发展是建立在两个基础之上的即实验方法的引入与测量技术的进展。实验方法使得系统化分析研究对象成为可能,从而实现对无关变异和客观规律的分离,达到科学知识的不断积累。测量技术的进展则使得研究人员能够更为精确地界定科学理论中的概念和研究命届,量化研究现象,从而使得数理逻辑思维的方法在科学研究中的应用成为可能。从深层意义上讲某学科领域中测量技术的进展直接决定该学科领域在人们传统意义上所谓的科学程度维度上的坐标。 长期以来,教育或者心理测量研究工作者一直沿用20世纪40年代美国著名心理测量学家史蒂文斯(Stevens)对测量的界定,即测量是“按照规则给客体和事件赋予数字”。受当时哲学思潮的影响,史蒂文斯对测量的这一界定在今天看来具有比较明显的操作主义和表征主义的特征,因而不可避免地带有操作主义和表征主义的局限。这种局限性主要表现在:(1)按照该定义,测量活动根本在于制定规则。测量活动被归结于某种规则下的一系列具体操作。这种做法的一个直接后果是将所要测量的客体或者事件的某种属性 (Attribute)与测量该属性的具体操作相等问。(2)在缺乏客观评判标准的情况下,这种做法有可能导致测量活动背离对客体和事件的某种属性的实际特征(Property)和结构关系(Structural relation) 的确定。(3)该定义颠倒了所要测量的客体和事件的属性特征或结构与数字系统的关系,将数字系统视为独立于客体和事件属性的实际特征或结构关系之外的存在。实际上,要保证按照规则给客体和事件赋予数字的正确性和科学性,必须要首先建立数字系统与所要测量的客体和事件的某种属性的实际特征或结构关系具有同构性。然而,要建立这两者之间同构性,必须首先发现所要测量的客体和事件的某种属性的实际特征或结构关系的性质。从这一意义上讲,测量活动是“发现( discover)”所要测量的客体和事件在某种属性上的量化关系(numerical relationship),而不是通过数字系统来表征这种量化关系。那么,测量的基本内涵是什么呢?具体来讲,测量是通过某种合适的工具或者仪器( instrument)确定客体在某种属性 (attribute)上的量( magnitude)的过程。客体在这种属性上的量通常是通过数值(numerical value)来表示的。而该数值则是在某一特定量表系统(scale system)中,比较客体在这种属性上的量与其它类似的量的量化关系(numerical relationship)而确定的。比如,我们用米尺确定某个人的身高是175厘米。这里,身高是我们所要测量的属性,而这个人是测量的客体。所使用的测量工具或者仪器是米尺。175 厘米是我们通过测量确定的此人在身高这属性上的量。而该数值的确定是通过在国际标准长度系统中,通过比较此人在身高这一属性上的量与单位长度(在此处是厘米)的关系而决定的。一般来讲,测量活动包括五大因素,即测量对象或者客体、所要测量的属性、测量仪器、量表系统以及在该量表系统中蕴含的测量单位。通常,量表系统以及测量单位是明确包含在测量仪器之中的。因此,测量仪器不仅提供了确定客体在所测量的属性上的量的标准还蕴含了一种特定的结构(structure)。这种结构的确定是建立在通过经验研究发现所要测量的该种属性所具有的量化关系(numerical relationship)的基础上的。然而,在敬育或心理测量中,由于所要测量的属性的独特性,测量活动通常具独特的特征。 (一)教育测量学的基本框架  从学科本质上讲,教育测量学涵盖了三个基本问题:测验的编制、测验分数特征的分析、测验及测验分数的科掌使用。对这三个问题的研究构成了教育测量学的基本理论框架。由于有关心理或教育测量学的文献资料浩如烟海,限于篇幅,这就使得教育测量学在研究测验工具的编制时不得不涉及四个根本方面:(1)对所要测量的心理建构的界定;(2)对测量剌激的相关性、代表性以及对测量剌激的反应的认知过程的分析;(3)对基于测量剌激而设计的测验题目的质量分析;(4)对合理的计分框架的分析与开发。根据所要测量的建构的性质不同,界定心理建构或者可以参照以往的相关研究,或者设计新的实证研究,或者依据领域专家的评判,或者进行有针对性的领域分析(Domain analysis)。比如,敬育测量中较多涉及到对学生在某年级的某一学科领域的学业成就的测量。这里,学业成就是所要测量的潜在心理建构。在正确解决测量剌激的相关性和代表性问题之后,需要对基于测量剌激而设计的测验题目进行分析。概括来讲,题目分析是根据测验试测时所收集到的数据,针对所编制的题目进行的有关题目的测量学特征(Psychometric property)分析。该阶段的分析至少包括三个方面:(1)验证所设计的题目是否正确反映了所界定的建构的维度;(2)估计所设计的题目的难度、鉴别力等参数对题目的公平性分析,即除了所要测量的建构之外,测验题目不应该受任何其它因素的影响。对该问题的回答需要进行题目偏差分析(Item bias analysis)。如果所测量的建构是多维的,相应的计分框架必须正确反映这种多维性。根据特定情况下对测验分数的应用,对多维建构条件下的计分方法可以采用分析式的方法,即对被试在每个维度上的反应进行计分,也可以采用综合式的方法,即综合被试在每个维度 上的反应,对被试在所要测量的建构的整体水平进行计分。 (二)教育评价的基本框架  与教育测量学不同,教育评价似平并没有一个统一的、得到公认的理论框架。虽然这表明教育评价的复杂性,但是在某种程度上它也表明教育评价还处在学科发展的初期、距离成熟的学科还有相当的距离。划分教育评价的维度有很多。例如,按照评价人员的来源,教育评价可以划分为内部评价,即评价人员隶属于所要评价的机构,和外部评价,即评价人员独立于所要评价的机构。按照是否具有既定目标,教育评价可以划分为目标定向评价,即针对既定目标展开评价,和目标游离评价,即没有预定评价目标,评价目标在评价过程之中逐渐形成。虽然这种种分类有助于我们理解教育评价的某些方面但是对于我们形成关于教育评价的整体认识帮助不大。因此在接下来的讨论中,我们采取一种不同的方式对教青评价的框架进行分析。教育评价可以从两个角度来加以分析。一个角度是教育评价的对象或者客体,另一个角度是评价时所专注的教育对象的成分。两者的综合可以帮助我们理解教育评价的整体框架以及可能涵盖的范畴。教育评价的对象大体上包括四类,即人员(personnel)、机构(institution)、材料(material)与方案(program)。抛开对评价人员的职责是否应该包括价值评判的争论,价值观念的影响在教育评价中其实是无时无刻不存在的。价值观念的影响不仅仅表现在对评价结论的认同的影响,还表现在对评价问题的提出,对不同评价目标的重要程度的排序,对信息收集方案的选择,对评价结果等方面的影响。因此价值观念的不同将直接导致教育评价模式和过程的不同,导致对同一结果的不同诠释。对任何事物,井不存在所谓的绝对的、单一的“正确的价值”。 (三)教育测量在教育评价中的角色 以上的分析应该比较清楚地表明教育测量和教育评价的区别。从根本上讲,教育测量是对各种客体在某个或者多个属性上的特征的描述(description)。其强特性在于测量是一种量化的描述,即运用数字系统来对教育客体的属性的量加以描述。相比之下,仅有对教育对象的描述是不能称其为教育评价的。教育评价必须包含在某种标准之下对教育对象的价值或者特征的评判,价值在教育评价中不仅可以成为评价的对象,还可以成为教育评价的过滤嚣。 (四)结语 教育评价在教育活动中的普遍性来自于评价在人类活动中的普遍性,是人类对自身活动和行为的反思和内省,是人类意识能动性的自然反映。教育评价的研究水平和实践与教育活动和系统的健康发展息息相关。有鉴于教育研究者对于教育评价与教育测量理解上的差异。本文从学科的角度对两者在内涵、研究的问题、范畴以及方法等方面的交叉和不同进行了分析,并在这种分析的基础上讨论教育测量学在敬育评价中所应扮演的角色,希望能抛砖引玉,促进教育评价研究在我国的进一步发展。    出处:杨向东. 教育测量在教育评价中的角色[J]. 全球教育展望, 2007, 36(11):15-25. (文章有调整和删减)