柳学智:信息技术在考试开发中的应用

发布日期:2017-05-09 来源:

柳学智

[摘要]  信息技术应用于考试开发,引发了考试形式和管理的变革。本文从题目的数字化、考试开发的管理、考试领域的深化和扩展、抽题策略的研究和应用、题库系统的研制和应用等方面阐述了信息技术的应用。

[关键词]  考试开发  信息技术  应用

考试开发是指相关机构或人员根据心理测量学的原理、考试的性质、科目的特点、应试人员的水平等要求开发出公平的题目、试卷或题库的过程。将信息技术应用于考试开发,产生了崭新的考试形式,由此引发了考试形式和管理的变革。

一、题目的数字化

传统纸笔考试的介质是纸张,命题人员将题目记录在纸质卡片上,根据试卷组成的要求,抽取相应题目组成试卷,之后进行编辑排版,印刷成纸质试卷,施测于应试人员。随着字处理软件的出现和应用,字处理实现了信息化,命题人员通过字处理软件直接录入、编辑题目和试卷;随着专业排版软件的研制和应用,排版和印刷也实现了信息化,试卷的排版和印刷也进入了信息化时代。题目编辑的数字化,减少了题目编辑、试卷排版和印刷的工作量,大幅提高了工作效率。但是,字处理和排版软件的使用仅在题目编辑和试卷排版阶段实现数字化,编辑和排版工作完成之后,题目和试卷信息又重新印制在纸张上,变成了纸质信息。

在题目编辑的数字化阶段,虽然题目实现了数字化,但题目和试卷是以文档的形式存储的,这些题目或试卷文档是由特定的字处理或排版软件生成的,难以通过计算机施测于应试人员。随着数据库技术的发展,人们将题目及其参数存储于数据库中,利用数据库的强大功能管理题目及其参数,同时根据一定的抽题策略从数据库中抽取题目,呈现在计算机上,施测于应试人员。随着考试领域的扩展和命题技术的发展,题目形式不再局限于纸笔考试使用的文字和图形,图像、动画、程序、视频、音频等计算机化的题目开始出现,题目形式日渐多样。与传统的题目开发相比,计算机化题目的开发不仅需要专业的命题人员设计命题思路和素材,还需要计算机人员将命题思路和素材制作成能在计算机上施测的题目。题目施测实现数字化后,题目的数字化才真正实现,在此基础上建设的电子题库才能通过计算机施测于应试人员。

二、考试开发的管理

考试题目、试卷、题库是考试开发的产品,在考试开发中,题目内容的科学性、题目参数的准确性、题目和试卷对应试人员的适合程度、考试开发人员的主观因素等都会影响考试开发结果。将信息技术应用于考试开发的管理,可以减少不利因素的影响,提高考试题目、试卷、题库的质量。

1、应试人员分析

每一科目的考试总是施测于一定的应试人员群体,考试是否适合应试人员,取决于考试开发人员对该应试人员群体把握的准确程度。对应试人员的总体水平、构成结构、地域差异、时间变化等进行统计分析,可以帮助考试开发人员准确把握应试人员的合格水平,开发出适合的题目、试卷、题库。随着考试实施信息化的推进,各种通用的或专用的针对应试人员的统计分析软件被开发出来,比如EXCEL、SPSS等软件,这些软件广泛应用于各类考试应试人员的统计分析中,通过对应试人员的统计分析,提供有关应试人员群体的分析结果,并将历次考试的分析结果存储于数据库之中,供考试开发人员随时查阅,有助于准确把握应试人员的合格水平,开发出适合的题目。

2、题目分析

对题目、试卷、题库的试测结果或考试实施结果进行心理测量学分析,将分析结果反馈给考试开发人员,可以帮助他们不断改进和提高考试开发技巧和水平。随着考试实施信息化的推进,考试实施结果和试测结果逐步变成数字信息;同时各种通用的或专用的心理测量学分析软件被开发出来,比如EXCEL、BILOG等广泛应用于各科目题目、试卷、题库的分析之中,通过对考试实施结果和试测结果数字信息的分析,将有关题目、试卷、题库的分析结果存储于数据库之中,供考试开发人员随时查阅,可以帮助考试开发人员修正命题思路,提高题目、试卷和题库的质量。

3、考试内容管理

考试题目、试卷和题库的开发是在考试内容的分类和细化的基础上进行的,在考试开发之前,需要对每一科目的考试内容进行分类和细化,将考试科目的内容范围、知识结构、认知层次等进行系统的分类与编码,并将考试内容分类和细化的结果存储于数据库之中。通过考试内容的管理,为考试开发人员在整个开发过程中提供考试内容的分类和细化信息,帮助考试开发人员迅速定位每一题目的内容范围、知识结构、认知层次等属性,并自动设置相关参数,这样可以大幅减少考试开发人员的重复劳动,提高工作效率。

4、考试开发过程管理

考试开发过程是考试题目、试卷、题库的生产过程,题目、试卷、题库的质量很大程度上取决于对考试开发过程的控制程度。在题目命制阶段,命制人员命制出每个题目的思路、素材、结果、内容参数、心理测量学参数等;在题目审定阶段,审定人员对每个题目及其参数提出审定意见,修改人员根据审定意见对题目及其参数进行修改,在不同的考试开发阶段,产生初始产品、过程产品、最终产品等不同阶段的产品。这样,对于每个题目,都有命制人、命制素材、命制结果、各种题目参数、初审人、初审意见、初审结果、终审人、终审意见、终审结果等信息。对考试开发过程进行严格的管理,详细记录每一过程所产生的产品及相关信息,提供给考试开发人员和管理人员,能够及时发现问题,增强考试开发过程的控制程度,提高考试开发的效率。此外,通过统计分析每一考试开发人员的工作量、题目的淘汰比例、题目参数预估的准确程度、审定意见的合理性及采纳程度等信息,可以评估该开发人员的专业能力、责任心、合作精神等影响工作质量的心理品质,为筛选优秀的考试开发人员提供可靠的依据。通过不断地筛选和培训优秀的考试开发人员,可以减少考试开发人员的主观因素对考试开发结果的影响,进而开发出更高质量的题目、试卷和题库。

三、考试领域的深化和扩展

信息技术应用于考试领域,不仅深化和扩展了传统的考试领域,而且开拓了新兴的领域。

1、传统考试领域的深化

在纸笔考试中,只有是非题、单选题、多选题三种题型能够实现大规模机器阅卷和评分,为了满足机器阅卷的要求,需要固定选项个数,是非题为2个,单选题通常为4个,多选题通常为5个;在电子考试中,突破了选择题选项数量的限制,选项数量可以根据具体题目的实际需要确定,少则2个、3个,多则8个、9个,这样就将传统的是非题、单选题和多选题三种题型融合在一起。

在纸笔考试中,对于是非题、单选题、多选题以外的其他题型,由于缺乏统一的规范,难以进行机器阅卷,只能与主观题一起进行人工评阅。在电子考试中,有些题型实现了计算机阅卷。在填空题中,不用要求应试人员从所列选项中选择一个选项填空,可以直接把一篇文章或一个表格中所要测量的内容空出,要求应试人员直接填写,计算机对所填答案直接评分;在改错题中,要求应试人员先对某一内容进行判断,判定为正确,不用修改,判定为错误,将正确的内容写出来,这是一种将正误判断与改错相结合的题型。在这些题型中,计算机直接采集应试人员的答案,根据评分标准,评定分数。

从试卷中各种题型的排列上,与纸笔考试相比,电子考试发生了很大变化。在纸笔考试中,为了满足机器阅卷的要求,需要将相同的题型的题目放在一起,特别是将能进行机器阅卷的选择题放在一起,将不能进行机器阅卷的题目放在一起,这样如果一张试卷中既有选择题,又有主观题或不能进行机器阅卷的客观题,那么试卷就应将这两部分截然分开,每一部分要根据要求在不同的答题卡或答题纸上作答。在电子考试中,计算机可以随时采集应试人员的作答信息,根据评分标准对应试人员的作答信息进行评分,题型的排列不再受到上述限制。

电子考试突破了传统纸笔考试对题型的种种要求和限制,弱化甚至解除了题目形式对测量内容的制约,对于某一测试内容,可以选择最适合、最有效的题目形式,使得题目形式的选择真正服从测量内容的需要。这样深化了传统考试领域的测量,提高了测量的效度和信度,进而提高了考试的公平性。

2、传统考试领域的拓展

在一些传统考试领域,某些考试内容的测量难以大规模推广,尽管这些内容很重要,在考试内容中被迫放弃,比如语言考试中的口语内容,传统的大规模考试只能放弃这方面内容。随着信息技术的发展和应用,可以依赖信息技术对这些内容进行测量,并进行大规模推广,比如现在的口语考试,可以让计算机与应试人员进行口语交流,同时进行现场录音,录音资料汇总后统一评阅,实现了口语考试的大规模推广。这样在大规模考试中,就可以将口语内容包含于语言考试之中,拓展了传统语言考试领域。

3、传统考试领域的革新

在一些实际操作领域,需要考察应试人员的操作技能,这些技能是一种程序性、操作性内容,不适合用纸笔考试的形式来考察,要测量这些操作能力,只能采用现场考试的方式,要求应试人员当场完成实际操作过程,同时进行现场评判。由于受到现场限制,考察内容有限,考试成本高昂,难以大规模推广。随着信息技术的发展,可以通过计算机来模拟实际操作过程,让应试人员在模拟环境中操作,通过计算机模拟就可以考查实际的操作过程。由于计算机模拟突破真实环境的限制,模拟出更为真实的操作环境,可以更全面、更准确地测量应试人员的操作能力,提高了考试的效度和信度。同时由于这种模拟考试不必到实际情景中实际操作,可以大规模推广,方便了应试人员参加考试,降低了考试成本,大幅提高了考试的效率。

4、新兴考试领域的开拓

信息技术在快速发展的同时,也迅速应用到社会各行业,推动了各行业的信息化,测量人们的信息化水平和能力也成为考试的重点内容之一,信息技术的自身发展和各行业信息化也成为一个新兴的考试领域。在这个新兴考试领域,主要采用两种技术测量应试人员的水平和能力:一是模拟技术,考试系统模拟某一任务的操作过程,让应试人员进行操作,应试人员的操作过程受到严格的控制,通过对应试人员操作过程的评价,判断其是否达到操作要求、符合操作规范;二是全真技术,考试系统为应试人员提供真实的操作环境,给出操作任务,应试人员在真实环境中自由操作,完成给定操作任务,通过对应试人员操作结果的评价,判断其是否达到操作要求、完成操作任务。

四、抽题策略的研究和应用

在传统纸笔考试中,施测于应试人员的试卷事先已经组好,命题专家根据相关要求命制一套试卷或者抽题组卷,抽题组卷虽然要遵循一定的要求和规范,但命题专家的经验依然起着重要甚至主导的作用。随着考试开发信息化的深化,电子题库有了长足的发展,直接从题库抽取题目对应试人员进行测试成为可能,如何制定合适的抽题策略为每一应试人员抽取等值公平的题目?这本是心理测量学研究的理论问题,现在成为考试开发人员必须面对的实际应用问题。

抽题策略的研究和应用主要在两个方面:一是直线式抽题,考试系统依据经典测量理论,按照一定的抽题策略,抽取固定数目或固定分值的题目,组成符合要求的试卷,应试人员在规定的时间内做答试卷中的所有题目;二是适应性抽题,考试系统依据题目反应理论,按照一定的抽题策略,抽取适合应试人员水平的题目,应试人员做答后,考试系统根据做答结果对应试人员的水平进行评估,依据评估结果抽取下一道适合应试人员水平的题目……直到准确地评估出应试人员的水平,考试结束。

抽题策略的应用标志着电子题库走向实用。抽题策略是建立在完备的题目参数和准确的估值基础上,是抽题算法对专家经验的取代,应用抽题策略抽取的题目不再需要专家的审定和把关,减少了考试开发人员主观因素对题目抽取的影响,这样也就减少了考试误差,提高了考试的效度和信度。

无论是直线式抽题还是适应性抽题,应用抽题策略为不同的应试人员抽取不同的题目,为安排在一起的不同考试科目的应试人员分别抽取题目,降低了应试人员同场作弊的可能性,提高了考试的公平性。

在适应性抽题中,抽取的题目与应试人员的水平相匹配,避免了太易、太难等不适合的题目,测试过程与应试人员的个体水平相适应,使得测量更有针对性,更准确地测量出应试人员的真实水平,减少了测量误差,提高了测量精度。同时由于避免了不适合的题目,减少了题目数量,缩短了考试时间,提高了考试效率。

五、题库系统的研制和应用

在传统纸笔考试中,为了便于检索和组卷,人们将题目记录在纸质题卡上,并按照一定的规则将题卡分类存放,随着题目的增多,就形成了早期的纸质题库。随着题目和试卷的数字化,试卷以文件的形式存储在计算机之中,众多这样的试卷组成了“卷库”,在题库出现之前,“卷库”是十分普遍的。

随着考试实施的信息化,通过对考后试卷进行心理测量学分析,得到题目的测量学参数值及其他相关参数值,以题目为单元将题目存储在数据库之中,形成了初期的题库,根据题目参数,可以在题库中对题目及其参数进行查询和编辑。但是在高利害性考试中,考过后的题目是难以重复使用的。

为了开发出可重复使用的题库,在一些基础建设较好的考试科目中,在考试内容的分类和细化的基础上,考试开发人员能够设定题目的内容参数,对测量学参数及相关参数进行预估。为了取得题目的测量学参数值及其他相关参数值,一般采取两种方式:一是在可控的情况下对题目进行试测,对试测结果进行分析,取得相关参数值;二是采取滚动开发的方式,在每一次考试实施中,加入一些新题,考完之后,对实际考试结果进行分析,取得这些新题的相关参数值。根据这些参数,可以在题库中抽题组卷。为了弥补题目参数估计可能产生的误差,组成的试卷可以再经过命题专家的审定,借助专家的经验对部分题目进行调整。

在此阶段的题库建设中,人们将题库建设的重点放在题目及其参数上,在基于数据库管理的基础上,将题目及其参数存入数据库,开发出针对题目及其参数的查询、编辑功能,此阶段的题库功能还比较单一,题库的用户主要是考试机构的相关工作人员。

在考试开发过程中,为了帮助考试开发人员准确把握应试人员的水平,需要提供有关应试人员群体的分析结果;为了帮助考试开发人员修正命题思路,提高题目的开发质量,需要提供题目的统计分析结果;为了帮助考试开发人员迅速定位每一题目的内容范围、知识结构、认知层次等属性和参数,需要提供考试内容的分类和细化信息;为了帮助考试开发人员和题库管理人员了解和控制考试开发过程,需要保存和提供考试开发过程中产生的各种中间成果和相关信息。总之,为了提高考试开发的效率,需要通过适当的方式,将考试开发过程中需要的各种信息和产生的各种有用的中间成果集成于题库之中。

在题目入库之后,要根据每个科目题库的实际情况建立相应的抽题策略,每个科目题库抽题策略的建立是一个复杂的过程,不仅要与题目参数的设立相适应,还要根据实际情况对抽题策略进行不断调整,直到找出适合的抽题策略。

在单一题库的基础上,题库系统增加了考试开发过程和抽题策略的管理。题库系统的开发并不是简单地增加题库功能,而是在认真分析考试开发各环节和各方面工作的基础上,从系统的角度对考试开发进行了过程重构和功能重构,建立功能完善的题库系统。题库系统的用户不仅包括考试机构的相关工作人员,还包括考试开发人员、统计分析人员以及其他相关人员。

《考试研究》2009年第1期,第70-78页