离退休工作处
 首页  离退休档案  工作扫描  相关法规  离退生活  流金岁月  时事纵横  党旗飘飘 
离退休工作处
当前位置: 首页>>离退风采>>正文
考试的理论与实践
2015-05-29 20:50 韩兆杰 老科协

一、《考试学》的历史与现状

追起源头来,考试学其实还是国内首创。自1982年被誉为“考试学之父”的廖平胜教授提出创建该学科至今,也才仅仅走过27年时间。

廖平胜生前曾是华中师范大学考试研究院的院长。2006年11月9日不幸去世时,年仅53岁。王后雄目前是华中师范大学考试研究院的考试科学研究中心主任,考试学教授,接替廖平胜主持研究院的研究工作。“顾名思义,考试学主要是研究各类考试的规律和方法。”王后雄说,一般的教育考试、司法、人事考试以及党政干部公选等各类考试的命题、规律甚至应考办法等,都属于该学科的研究对象。

1998年,廖平胜教授和他的团队合作出版了我国第一本《考试学》专著,这标志着考试学作为一门学科在我国正式创立。这之后,国内多所高校先后成立了相关的学科并开始招生。该校领导曾对媒体介绍,《考试学》的问世一度引起国际学术界震惊,一举填补了我国教育考试研究领域多年来的空白。

1、考试学的发展历程

1984年,华中师范大学建立考试学研究组。

1987年,华中师范大学13个专业首次开设考试学本科通选课程[1]

1989年,华中师范大学建立考试学研究室。

1990年,华中师范大学在全国首家招收考试学方向硕士研究生。

1992年,华中师范大学创建“考试科学研究中心”。

2003年,华中师范大学在江苏省开设考试管理自考本科专业。

2003年,经国务院学位办批准,建立“国家治理与考选制度”博士专业,2004年开始招收培养本专业博士、硕士研究生。学生的专业课包括考试学、考试统计、考试理论与实践、考试管理等各类科目。

200412月,华中师范大学成立考试研究院,这是我国高校中唯一承担考试学学科建设任务,集科学研究、人才培养、技术开发、社会服务于一体的综合性研究机构,并以大考试学观的学科视野吸纳众长、整合力量;以科研、育人、开发、服务的良性互动,不求所有、但求所用、高绩高资的原则,形成开放、灵活、高效的运行机制;以强化特色研究,着重特色专业高层人才培养,提高本土化技术工具开发能力和服务功能,构筑研、学、产协调发展的综合性学科基地。

2、考试学的专业研究机构

1984年 建立考试学研究组

1989年 建立考试学研究室

1992年 创华中师范大学考试科学研究中心

1995年 华中师范大学与国家劳动部共建华中师范大学职业技能鉴定研究所

2004年 建立华中师范大学考试研究院

二、考试的意义

考试是教育测量的重要工具,是课程评价的重要手段,也是评价学生学业成绩、教师教学工作成效的重要方法;也经常作为教育行政部门检查各基层教育教学单位工作质量的重要方法。具体地说,考试是对人的知识、技能和智力的测量。

考试有三个要素:

首先,考试要有一个特殊的情境,就是主测人提出问题令考生作答的考场。在这个情景中,被测者能够把待测的知识、技能和智力,用最明快的方式表露出来。

其次、有明确的被测者表露知识和能力的方式:口答、笔答或操作。

第三、主测者和被测者对回答过程和结果作出统一规格的记录,为最后评定结果提供依据。

三、考试的特点

1、考试是一种抽样测量。

受考试时间限制,命题只能选取部分待测内容作被测样本来推断总体特征,是抽样测量。

2、命题即编制试题与试卷,既是选取测量样本的过程,又是制造、选取测量工具的过程,它是确保考试质量的的关键环节。

3、每次考试都要制作专用的试题与试卷,每次考试之前必须对所有的考生保密。

4、创设有利于被测者应试的环境,以保证考试的有效性。

四、考试的功能

1、鉴定功能

考试的鉴定功能指考试能够鉴定被试者在某方面的知识和能力是否达到规定的水平和标准,这是进行各种水平考试、资格考试和达标考试的依据。

2、诊断与反馈功能

考试的诊断与反馈功能考试能够检查被试者在知识和能力掌握上的不足、问题所在和变化程度;能够提供调整和改进被试者教育教学进程的信息。考试的诊断与反馈功能是进行各种摸底考试、诊断性考试和课堂测验的依据。

3、预测功能

考试的预测功能是指考试能够在某种程度上预测人的能力发展倾向。这是国家举行的学术能力倾向(简称学能倾)考试、智力测验的依据,也是各种选拔性考试(中考、高考)的重要依据。

4、激励功能

考试能够激励考生及教师的进取心,促进他们更加勤奋地学习与工作。这就是考试的激励功能。

五、考试的分类

1、按考试的性质划分,考试应分为学业水平考试和选拔性考试。

1)、学业水平考试包括知识水平和能力水平考试,是对学生的知识和能力的测量。考试的目的是测量学生对学习内容掌握的数量与程度。学校的平时考试、期中考试、期末考试都是学业水平考试。

2)、选拔性考试包括高等学校、高中、中专等各类学校的招生考试,也包括各级研究生招生考试和国家招考公务员考试。

2、按考试的形式划分可分为教师自编考试和标准化考试两类

1)、教师自编考试是教师个人或教师集体为改进日常教学工作编制试卷进行平时测验的考试。试卷编制、组织考试和评卷都由教师集体或个人完成。

2)、标准化考试是指考试全过程的标准化,包括试卷的编制过程、考试的实施过程、评分过程、分数的合成与分解过程,都要按规定的标准进行。

标准化考试的目的在于最大限度地减少主观因素造成的考试误差,使测量的结果更接近考生的实际水平。

标准化考试的关键在于试题的标准化和评分的标准化。一般都从已建成的题库中选取试题组成试卷。通常全部选用选择题,使用机器阅卷。

3、按考试的任务划分,考试可分为形成性考试和终结性考试。

1)、形成性考试是过程性评价。以提问、测验、口试等形式对学生达到教学目标的过程中不断本地明确学生的达标程度,及时发现学生学习过程中存在的问题和缺陷,从而随时调整教学的考试。

2)、终结性考试是指教学的单元、期中、期末、学年教学结束后对教学结果的评价。

4、按试题的形式划分,考试可分为客观性考试和主观性考试。

以客观性试题为主体的考试称为客观性考试。

以主观性试题为主体的考试称为主观性考试。

5、按解释分数的方法划分,考试可分为常模参照考试和目标参照考试。

1)、常模参照考试是以已知的常模为标准来解释分数高低的考试。常模是指被试群体的一般状态和平均水平,它是建立的具有反映某种特征常态的标准。常模是用来比较、平衡的数据,可用中位数、众数或标准差作为常模,常模参照性考试是把考试成绩作横向比较,在同类考生中判定每个考生个体成绩的优劣。

2)、目标参照考试是以考试目标为参照标准的考试。考试目标是教学目标的浓缩。考前确定考试目标,制定符合目标的标准细则,按照细则拟定试题和评分标准。目标参照考试测验的是学生的知识、能力与教学目标的关系,着眼于达到教学目标的程度。

6、按考试材料划分为笔试和口试。

六、考试的设计

考试设计就是规定考试目标、内容和标准,决定考试方法和命题计划。

(一)、考试目标、考试内容和考试标准的制定。

1、考试目标的确定

确定考试目标的依据:一是对考试的期望,就是考试所能提供的情况与信息,这是确定考试目标的外在依据;二是考试所能发挥的功能,这是确定考试目标的内部依据。

例如高考的考试目标是“选拔中学基础知识掌握较好的,更能适应大学某类专业学习的高中毕业生”。而学业水平考试的考试目标是教学目标的浓缩。

2、考试内容的确定

1)、考试目标本身就明确规定了考试的具体内容。例如学业水平考试的考试目标是教学目标的浓缩,它就明确规定了考试内容。

2)、高等学校招生考试和公务员考试的考试目标没有直接表示考试的具体内容,需要制定考试内容。

3、考试标准的制定

考试标准是根据考试目标规定的关于考试范围、深浅程度等方面的具体要求,是编制试题和试卷,阅卷和给分的基本依据,也是学生备考的基本依据。

各种水平考试的“考试标准”要特别说明达到“合格水平”的基本要求、规定出合格的标准线。学业水平考试的合格标准的制定,必须执行以下规定:

将合格标准的最低限度规定为关于知识和能力的基本要求(就是考试目标中的要求),根据合格者可能通过的程度,规定必须通过的百分比率(例如60%)为合格分数的最低线和最高线,如满分为100分,及格为60分。

七、命题计划的设计

命题计划应包括两部分内容:一部分是试题和试卷编制的原则要求,具体说明考试的目。标和内容范围、考试的方法和试题类型、编制试题和组配试卷的要求等;另一部分是试卷中试题分布的规定,具体规定出考试内容中各部分试题数量和分数比例,列成“双向细目表”。

双向细目表是一个二维的试题分布表格,纵向第一行是知识单元和该知识单元应占比例,横向第一列是各知识单元的知识由低到高的能力层次和各层次所占的比例(我国义务教育教学大纲中通常用“了解”、“理解”、“掌握”、“灵活运用”来表达知识的难度层次)。中间空格应填写试题类型和分数分布。例如某英语考试的双向细目标:

了解15%

理解35%

掌握25%

灵活运用25%

合计

语法 15%

填空题5

简答题10

15

词汇 15%

填空题10

选择题5

15

阅读 15%

选择题15

15

综合 15%

选择题15

15

听力 15%

简答题15

15

写作 25%

解答题25

25

合    计

15

35

25

25

100

八、命题工作的实施

(一)、主观性试题的设计

1、主观性试题:解答过程复杂、解答方法多样,凭分凭评卷人主观经验给分或按解题步骤给分的试题。

2、主观性试题的优缺点:

优点:

1)、主观性试题不仅可以对某项知识进行整体性综合考察,而且可以考查该项知识的不同知识点或知识环节。

2)、主观性试题可创设问题情境,使解答者充分表述见解。

3)、主观性试题能反映解答者的思维过程和解答的正确程度,使评分者可根据解答过程和正确程度给分。

缺点:

1)、一次考试的题量太少,对于考试的覆盖面小。

2)、阅卷评分因阅卷人而异,不够客观准确。

3)、评阅主观性试题困难、复杂,评分这劳动强度大。

3、主观性试题的设计

主观性试题的适用范围:

1)、提供教学反馈信息的考试,包括平时课堂测验等。

2)、着重考查考生综合运用知识、能力的考试。

3)、诊断性考试和高级学习阶段的综合性考试,入大学的某些综合考试和研究生考试。

主观性试题的设计:

1)、简答题的设计

简答题是指答案比较简短的主观性试题,他特别适合于基本概念、基本史实、基本原理等知识的考核。编制简答题应尽量从宏观着眼,从微观入手拟题,也可以逆向拟题;可以给出一个命题让考生判断对错并论证正确性获批驳谬误;还可以让考生根据给出某些条件运用某些原理推断其可能的结果。

2)、论述题的设计

论述题是指要做扩展性回答,答案内容较繁多的主观性试题。理科的证明题也属于论述题。它主要包括论述、评价、分析、批驳等部分。论述题是主观性试题的基本题型,它集中体现了主观性试题的长处。编制论述题要注意如下几点:第一,要找出考试内容中的重点问题,如果说简答题考察的是一个点,那么论述题考查的就是一条线,甚至是一个面。点的密集处,特别是线、面的覆盖处就是试卷论述题设计的重点。第二,要从知识总体出发进行综合考察或侧重基本原理的具体运用。第三,要给考生发挥自己的真知灼见的较大空间。

(二)、客观性试题的设计

1、选择题及其设计

1)、选择题是提出一个问题或一句不完整的句子,称为题干,接着给出若干答案或补充句子的若干说法,由考生选择。答案或说法唯一的叫单项选择,否则叫多项选择。

2)、选择题的优缺点。

优点:

考生只需填写规定的符号,答题速度快,可以实现试题容量大,覆盖面广的目标;

评分简单、客观、准确,方便计算机阅卷;

相比其他题型更便于通过测试进行修改。

缺点;

设计编制比较复杂,需要较高的命题技巧和较长的命题时间;

难以考核考生的材料的组织能力和文字表达能力,更难考察考生的发散思维能力。

3)、选择题的设计

基本构思方法是把某个命题的中的一段话编成题干,把另一段话编成正确答案,再根据考生学习中容易出现的错误,设计成几个干扰答案作干扰支。还可以创设一个问题情境作为题干,设计正确答案和干扰答案。

要选择重要的、有考查意义的原理、命题设计选择题;

通常每题设计四个备选答案,各备选答案应按同一原则、同一方向设计;

干扰答案应似是而非,有干扰作用;

题干与备选答案应集中表述一个命题;

表述简练、明确;题干与备选答案搭配形式完美,语句通顺。

2、填空题及其设计

1)、填空题是在某问题或命题的条件或结论处留出空白,由考生填写,完善条件或结论。填空题的设计范围仅次于选择题。

2)、设计填空题注意问题

空白处应设计为问题或命题、原理、事实的关键词语;

空白处的表达具有唯一性;

如有多处空白,空白处空间应一致,避免给考生以错觉。

3、是非判断题及其设计

1)、是非判断题的特点

是非判断题是给出一个意义完整的命题或事件,让考生判断它的是非、对错。优点是设计简单,考查面广,考生操作简单。缺点是考生单凭猜测每个题得分的几率是50%,不能准确地反映考生的知识能力水平。

2)、是非判断题的设计

要考查相对重要的知识;

侧重考查对知识的理解;

命题设计要有迷惑性;

表达清楚,叙述简明扼要。

()、试卷的编制

试卷编制涉及题量及其分布、题型及其搭配,这些已经落实在“双向细目表”中。具体操作安排应注意:

1、教师自编的课堂测验,以收集教学反馈信息为主,也为期末评定学生学业成绩提供部分依据。试卷中难度比例可设计为352,即难度较低的试题占30%,难度适中的试题占50%,难度较高的占20%

2,学业水平考试应把“增大题量,扩大覆盖面”放在试卷设计的首位。尽量采用小题,每题得分要少,做到考查点要多,覆盖面要广。选择题、填空题应占40-50%,简答题应占25-30%,解答题应占20-25%。整个试卷预计难度应在0.3左右。选择题、填空题、简答题的预计难度应在0.2-0.5之间。预计难度低于0.3和高于0.8的试题不宜使用。

3、试卷的格式安排

1)、题卷合一。试题在试卷中应按答案文字量的多寡,升级排列,一般顺序应是选择题、填空题、简答题和解答题。

2)、印制试卷。各题间的空白处要留下足够的书写答案的空白处,并且要求留有余地;试题与答题空白尽量安排在同一页上。同一类型、分量相等的试题后面所留空间大小应大体一致。

3)、登分栏设计在试题前面,按小题登分。题头应有登“题分”的位置设计。

九、评卷应注意问题

1、评卷为避免与考生答卷笔迹相混,相关人员一律使用红笔。

2、只记得分,不记扣分。

3、得分填在指定栏中,并填写阅卷人姓名。

4、纠正得分时,事先划掉错误得分,就近标出正确得分,并填写纠正人姓名。

十、试卷分析

(一)、试卷分析的意义

1、试卷分析是为了评价试卷的质量,包括试题的质量如何?哪些试题质量好,好在哪里?哪些试题质量差,差在哪里?考试成绩如何?考试成绩是否可靠?是否达到考试目标?试卷分析包括定量分析和定性分析。

2、试卷分析是为了完善考试工作。首先是改进考试的设计工作;其次能为改进命题设计提供大量信息,提高试卷和试题的质量;再次,检测题库中试题的质量(在试卷中使用题库试题的前提下);最后,试卷分析也是对评阅试卷等项工作的检查,有利于提高考试的组织管理工作。

3、试卷分析可以推动提高教学工作的质量。

(二)、试卷的定量分析

1、抽取样本

略,因学校是对考生全员的试卷进行定量分析

2、考试分数的分布及分析

1)、列出“考试分数频数分布表”;

2)、做出“频数分布直方图”或“频数分布曲线”;

3)、计算集中量数:众数、中位数、平均分;

4)、计算差异量数:极差、方差或标准差;

5)、对集中量数和差异量数作出分析和解释。

《概率论》告诉我们,实际生活中大量存在着分布曲线呈“中间高、两边低”的钟形曲线的随机变量,这种随机变量呈正态分布,“中间高、两边低”的钟形曲线也叫正态分布曲线。相当数量的群体考生的考试成绩分布就是呈现正态分布的随机变量,因此它的分布函数曲线应该是“中间高、两边低”的钟形曲线。

函数图像的横轴是考试分数,以考试的平均分数作一垂线,应该是钟形曲线的对称轴。平均分高,表明考生考试成绩整体水平高,反之表明考生考试成绩整体水平低。标准差σ决定钟形曲线的形状,标准差小表明考生的成绩想平均分集中的程度高,钟形偏“瘦”;反之,钟形偏“胖”。标准差σ小于10较好,表明考试分数集中在平均分附近;标准差σ大于10,表明考试分数集比较分散,学习成绩有两极分化的趋势。期望状态是:高平均分状态下的小标准差。

考试分数落在区间(平均分-σ,平均分+σ)内的概率为0.683;统计学把这个区间称为置信区间,查表可以知道分数落在区间(平均分-σ,平均分+σ)内的概率为0.683;落在区间(平均分-2σ,平均分+2σ)内的考生占95%;落在区间(平均分-3σ,平均分+3σ)内的考生占99.7%。假如某次考试的平均分是70,标准差σ=10,频数分布曲线近似地呈正态分布,那么考试分数在6080之间的考生应占68.3%,考试分数在59分以下和在81分以上的考生各占15.85%

3、考试信度和效度的分析

1)、考试信度的分析

考试的信度,是指某项考试对同一类考生实施多次,每次所得成绩分数的一致性程度。信度是衡量考试质量的重要指标。实际操作中试卷很少能重复使用,可对同一类考生设计两组在内容、难易程度等价的考试,这两组考试成绩的一致性程度,亦可称为考试信度。实际操作中通常是计算两组考试成绩的相关系数,也称为信度系数。

考试信度包含两层涵义:一是作为测量工具的试题的测量精度,叫做试题信度;二是试题在使用中测得分数的真实性程度,叫做试卷信度。通常考试信度主要指试卷信度。

考试信度的计算方法很多,有等式法、分半法、α系数法等。对于校内的学业水平考试的信度高低的判断,可以简单地从考试成绩的概率分布曲线的形状直观判断。一般说来如果大样本的考试成绩的概率分布曲线呈钟形曲线,考试的信度较高,否则考试的信度较差。

2)、考试效度的分析

考试效度是反映一项考试实现既定的考试目标的达标程度。考试的信度高只是效度高的必要条件,不是充要条件。

由于学业水平考试的考试目标是浓缩了的教学目标,考试的“双向细目表”又是严格按教学目标制定的,考试的效度一定很高。

3、试题的难度和区分度分析

1)、试题的难度与计算

试题的难度是表示考生解答试题的难易程度的指标。

试题难度值是用考生在该题得失分率q来表示;

主观性试题的难度计算公式是:

q=1(该题平均分值 / 该题满分值 )

客观性试题的难度计算公式是:

Q=1-该题答对的人数 / 考生总人数)

试题的理想难度值q=0.5;当0.3q0.6时,试题的质量较好;当q0.3q0.7时,试题质量较差。

2)、试题的区分度与计算

试题的区分度是表示该提取分能力大小的指标,就是使好学生得高分,差学生得低分的倾向力的大小,用D表示。

计算区分度时,先将考生在该题的得分由低到高排列,从低分起,取27%的考生作为低分组,从高分起,取27%的考生作为高分组。

主观性试题的区分度计算公式是:

D=(高分组该题总分-低分组该题总分) / 考生人数×(该题最高得分-该题最低得分)

客观性试题的区分度计算公式是:

D=高分组满分率-低分组满分率

中等难度即q=0.5时,该题的区分度最大为1。试题的区分度在0.4D1时,试题的质量最好;当0.3D0.4时,试题的质量较好;当0.2D0.3时,试题的质量较差;当D0.2时,试题应当淘汰。

4、试卷的难度和区分度

利用计算试题的难度和区分度的计算公式也可以计算试卷的难度和区分度,从而评价试卷的质量。

试卷难度:

q=1(该卷平均分值 / 该卷满分值 )

试卷的区分度:

D=(高分组该卷总分-低分组该卷总分) / 考生人数×(该卷最高得分-该卷最低得分)

试卷的难度和区分度可以衡量作为测量工具的试卷的质量,衡量标准与试题质量好坏的标准一致。

(三)、试卷的定性分析

1、对试题质量的定性分析

根据命题计划(双向细目表)分析试卷中试题分布和知识覆盖面;分析全面考查与重点考查的情况及题型多样性等情况;根据试题难度和区分度评价各个试题质量、试题难易比例情况;分析各题分数分配情况。

2、对试卷质量的定性分析

根据考生答案分析存在的共性问题:知识和能力掌握较好的教学内容,出现错误较多的教学内容即出现错误的类型与原因。

3、对今后考试工作的意见和改进教学的意见。

题库的组建

一、考试试题库的意义

命题是一项很复杂、很细致的智力劳动。每次考试前都要组织命题,费时、费力,命题质量也往往得不到保证。组建题库,是考试命题工作的必然趋势。

近年来,我国许多学校的学业考试命题采用了题库制。实践证明题库不仅减少重复劳动,更有利于统一考试标准、把握试题质量,使各类考试结果具有一定程度的可比性;通过题库的试题多次使用,修正充实,使题库质量更高,更有保证;同时有利于引导学生全面复习功课,教师全面讲授和辅导,改变教师透题,学生押题等不正之风。

二、 题库的要素

1、题库储备试题的数量要求:总体能够覆盖考试大纲要求掌握的某学科的全部内容,要备有从多角度考查把握程度的试题。

2、题库储备试题的质量要求:内容科学合理,用语准确,备有答案或答案要点和评分约定。

3、题库储备试题的形式要求:为满足随机生成所需试卷的需要,命题要附有考核的章节、题型、难度、区分度、答题时间等说明性指标或数据。

4、备有符合考试大纲或教学大纲要求的标准试卷若干份。

三、题库的组建过程

高校考试多为学业水平考试,应在教学内容相对稳定的前提下,考虑题库的组建

1、按学科的教学目标编制考试目标。

2、编制学科的命题计划(即双向细目表)。

3、按命题计划编制、收集命题。

4、试题的来源:

历年的期末考试试卷(注意珍惜教师在编制试卷中付出的劳动,对历年期末试卷做全面的数据处理,应特别关注其中试题的难度和区分度的计算与处理);

教师按教材或习题集编写;

与其它高校合作汇集试题;

聘请专家编写与审定。

四、建立计算机数据题库

1、选择适应高校学业水平考试的题库管理应用软件。

2、按操作软件要求确定入选试题的必选信息及数据指标。

3、按入选试题的必选信息项目及数据指标筛选试题、录入试题。

应选择教学内容、教材相对稳定的学科或专业先行建立计算机数据题库。

关闭窗口
版权所有:黑河学院离退休工作处    地址:黑河市爱辉区龙源路65号