
发布日期:2017-05-09 来源:
[摘要] 本文从考试管理信息化的角度,论述了设计大规模考试结构模型应遵循通用性、灵活性、实用性、简单性原则,并根据这些原则设计出大规模考试的结构模型,然后分析了该模型具有层次结构、考生组别、科目单元等特点。
[关键词] 大规模考试 管理 信息化 结构 模型
考试结构是指考试的内部构成。任何一个考试都有其内部构成结构,只是有的简单,有的复杂。大规模考试由于涉及的地域广泛,考生众多,其考试管理一直是各级考试机构关注的头等大事。在当今大规模考试的管理中,信息化是一种发展的趋势。要实施大规模考试管理的信息化,必须将具有各种结构的考试纳入统一的信息管理,而统一的信息管理需要统一的考试结构模型。为了实现大规模考试管理的信息化,必须研究不同考试的特点,抽象出统一的考试结构模型,使各种考试都能适应这一结构模型的要求,以此考试结构模型为基础实施大规模考试管理的信息化。
在设计大规模考试的结构模型时,应遵循以下原则。
通用性是指设计的考试结构模型应通用于各种类型的大规模考试。通用性原则应包含以下内容。
不同的考试拥有不同的考生群体,而且不同考试的考生群体之间差别很大,有的考生群体十分简单,只有一个子群体,所有的考生都考相同的科目;而有的考生群体十分复杂,可以划分出多个子群体,不同的考生所考的科目不同。考试结构模型应在不同考试的不同考生群体之间通用。
不同考生群体所考的科目或科目组合是不同的,而且考试科目或科目组合在不同考生群体之间差别很大。有的考生群体的考试科目十分简单,只有一个考试科目;而有的考生群体的考试科目则十分复杂,有多个考试科目或多种科目组合。考试结构模型应在不同考生群体的考试科目之间通用。
不同考试科目的试卷结构是不同的,而且试卷结构在不同考试科目之间差别很大。有的考试科目的试卷结构十分简单,只有选择题,可以用光电阅读器阅卷,成绩管理十分简单;而有的考试科目的试卷结构则十分复杂,既有客观题,又有主观题,甚至还有选做题,这样的试卷结构既要求光电阅读器阅卷,又要求主观题成绩录入,成绩管理相对复杂。考试结构模型应在不同考试科目的试卷结构之间通用。
不同考试的成绩管理模式是不同的,而且成绩管理模式在不同考试之间差别很大。有的考试的成绩管理模式十分简单,比如有的考试的成绩管理是一次性的,成绩只在本次考试实施中有效,不会带入下一次或几次的考试实施中;而有的考试的成绩管理模式则十分复杂,成绩管理模式是滚动的,成绩不仅在本次考试实施中有效,而且会带入下一次或几次的考试实施中。考试结构模型应在不同的成绩管理模式之间通用。
灵活性是指设计的考试结构模型应灵活适应考试结构的各种变化。灵活性原则应包含以下内容。
在实际的考试实施中,不同类型的考试之间可能发生变化,比如,两个相对独立的考试可能合并为一个考试,某一考生群体可能从某一考试中剥离出来,加入到另一考试之中。考试结构模型应能灵活适应考试类型的变化。
考生群体可能随时间的变化而发生变化,而且这种变化可能很大。有的考生群体在考试刚建立时可能比较简单,但随着时间的推移和实施次数的增加,该考生群体可能变得比较复杂;有的考生群体的变化则相反,在考试建立初期可能比较复杂,但随着时间的推移和实施次数的增加,该考生群体可能变得比较简单;还有些考生群体则保持相对稳定,并不随时间和实施次数发生变化。考试结构模型应能灵活适应考生群体的变化。
考生群体所考的考试科目可能随时间的变化而发生变化,而且这种变化可能很大。有的考试科目或科目组合在考试刚建立时可能比较简单,但随着时间的推移和实施次数的增加,该考试科目或科目组合可能变得比较复杂;有的考试科目或科目组合的变化则相反,在考试建立初期可能比较复杂,但随着时间的推移和实施次数的增加,该考试科目或科目组合可能变得比较简单;还有些考试科目或科目组合则保持相对稳定,并不随时间和实施次数发生变化。考试结构模型应能灵活适应考试科目的变化。
考试科目的试卷结构可能随时间的变化而发生变化,而且这种变化可能很大。有的试卷结构在考试刚建立时可能比较简单,但随着时间的推移和实施次数的增加,该试卷结构可能变得比较复杂;有的试卷结构的变化则相反,在考试建立初期可能比较复杂,但随着时间的推移和实施次数的增加,该试卷结构可能变得比较简单;还有些试卷结构则保持相对稳定,并不随时间和实施次数发生变化。考试结构模型应能灵活适应各考试科目试卷结构的变化。
考试成绩管理模式可能随时间的变化而发生变化,而且这种变化可能很大。有的成绩管理模式在考试刚建立时可能比较简单,但随着时间的推移和实施次数的增加,该成绩管理模式可能变得比较复杂;有的成绩管理模式的变化则相反,在考试建立初期可能比较复杂,但随着时间的推移和实施次数的增加,该成绩管理模式可能变得比较简单;还有些成绩管理模式则保持相对稳定,并不随时间和实施次数发生变化。考试结构模型应能灵活适应考试成绩管理模式的变化。
实用性是指设计的考试结构模型具有可操作性,能够易于被各级考试管理机构掌握和操作。实用性原则应包含以下内容。
实用性原则首先要求考试结构模型具有可操作性。从通用性原则看,在设计考试结构模型时,要求考试结构模型在各种考试类型之间通用,从实用性原则来看,这种通用必须具有可操作性。如果这种通用仅限于理论上的假设或推断,难以按照一定的程序进行操作,那么这种通用就不具有任何实际的价值。因此,没有实用性原则作保障,通用性原则也就难以落到实处。
从灵活性原则看,灵活性要求考试结构模型应灵活适应考试结构的各种变化,从实用性原则来看,这种适应也必须具有可操作性。如果这种适应仅仅是理论上的适应,或假设其适应,没有具体的操作程序去实现这种适应,或者实现的程序太复杂而难以实现,那么这种适应就不具有任何实际的价值。因此,没有实用性原则作保障,灵活性原则也就难以落到实处。
考试的实施是由各级考试管理机构实现的,因此,考试结构模型是否实用于各级考试管理机构,对考试的实施至关重要。如果考试结构模型实用,各级考试管理机构易于理解、掌握,各种考试类型及其设置清晰、明了,各种考务管理过程规范、可操作性强,考试就能够顺利实施;相反,如果考试结构模型不实用,各级考试管理机构难以理解、掌握,各种考试类型及其设置混乱、无序,各种考务管理过程不规范、操作性差,考试就难以顺利实施。
简单性是指在设计考试结构模型时,在保证其功能和实用的前提下,应使模型尽可能的简明扼要,逻辑关系清晰。
从通用性、灵活性和实用性看,考试结构模型既要通用,通用于各种考试类型;又要灵活,适应于考试类型的各种变化;还要实用,实用于各级考试管理机构。这就给考试结构模型的设计提出了很高的要求。从考试结构模型的设计上,要使模型的设计遵守上述三个原则,并非易事。但在此基础上,还应该遵循简单性原则,即考试结构模型要尽可能的简单。简单性主要包括以下两个方面的要求。
由于考试结构模型要遵循上述三个原则,考试结构模型会涉及到考试很多方面的属性和内容,但我们要求模型的结构要尽可能的简单。这就要求在设计考试结构模型时,一定要舍弃非本质的属性和内容,仅包含本质的属性和内容,或者要将非本质的属性进行抽象、概括,提炼出本质的属性。只有包含了考试的最本质的属性,模型的结构才可能简单。
在设计考试结构模型时,除了要包含考试的本质属性和内容,使模型结构尽可能简单以外,考试结构模型内部的各部分之间的关系必须十分清晰。只有逻辑关系清晰,在实际应用时,才能根据这种清晰的逻辑关系,将考试结构模型推广到各种类型的考试之中。否则,各部分之间逻辑关系含混不清,难以根据这种关系将模型应用于实际。
在遵循考试结构模型设计原则的基础上,就可以设计出符合要求的大规模考试结构模型。考试结构模型是对各类考试结构的最概括的抽象,是各类考试进行信息化的基础。
在设计考试结构模型时,要使模型通用于各种考试类型,适应考试结构的变化,遵循模型设计的通用性和灵活性原则,是否意味着我们一定要设计一个庞大、复杂的考试结构模型,涵盖所有的考试类型并适应考试结构的所有变化?答案是否定的,实际上,不存在这么一个模型,我们也不可能设计出这么一个模型。那么,我们如何使模型通用于各种考试类型并适应考试结构的各种变化?实际上我们可以通过适当的方法将这一庞大、复杂的模型进行简化,只留下最本质的东西,这就是我们所要设计的考试结构模型。将简化过程中非本质的东西(比如考试类型的变化和考试结构的变化)设定为特定的模型参数,然后通过模型参数的变化反映考试类型的变化和考试结构的变化,因此,在设计考试结构模型之前,我们还必须进行以下两方面的简化与界定。
我们知道,在实践中,考试都是分类别实施的,在时间上可以是同时的,但在实施上是分别独立的。比如,全国一级注册建筑师执业资格考试和经济专业技术资格考试可以安排在同一时间内实施,但它们是两个独立的考试,它们的实施是各自独立进行的,相互之间没有关联或制约关系。因此,在设计考试结构模型时,我们没有必要为各自独立实施的考试类型分别建立一个模型,实际上,我们只需建立一个模型,通过设定一个考试类型模型参数,根据考试类型模型参数的不同,将同一考试结构模型应用于不同类型的考试。
同样,同一考试是分次实施的,大多数大规模考试一般是一年实施一次,比如,全国专业技术人员职称外语等级考试在每年的春天实施,全国经济专业技术资格考试在每年的秋天实施,于是,很容易给人一种假象,认为年度是考试的一个本质属性,尽管我们的工作计划是按年度安排的,工作也是按年度进行的,但年度不是考试的本质属性。事实上,有些考试并不是一年实施一次,而是多次,比如,全国专业技术人员计算机应用能力考试可以不限制每年的实施次数,而且各地的实施次数还可以不同。还有的考试两年实施一次,比如,全国企业法律顾问执业资格考试,从开始建立到2000年,每两年实施一次。
另外,有些考试在其整个实施过程中,并不能在固定时间内固定其实施次数,其实施次数可能发生变化。例如,全国企业法律顾问执业资格考试,根据《关于调整企业法律顾问执业资格考试有关规定的通知》(2002年3月5日,人发[2002]21号),从2002年开始,企业法律顾问执业资格考试由每2年组织一次调整为每年组织一次。此外,有些考试在实施过程中,可能由于其它因素导致实施次数的变化,这种变化并没有规律性,比如,全国一级注册建筑师执业资格考试,从第一次考试实施到1995年,是一年一次,到1996年,由于多方面的原因,停考一年,从1997年起,又恢复一年一次的实施模式。
综上所述,同一考试是按“次”实施的,“次”是考试实施过程中的一个根本的属性。不同次的考试实施,虽然同属一个考试类型,但在时间上是不同的,在实施上是分别独立的。比如,全国注册资产评估师执业资格考试在1998和1999年的两次实施,虽然它们同属一个考试类型,但它们的实施时间是不同的,它们的实施是各自独立进行的,这两次实施之间没有关联或制约关系。因此,在设计考试结构模型时,我们没有必要为同一考试的每一实施分别建立一个模型,我们只需建立一个模型,通过设定一个考试实施模型参数,根据考试实施模型参数的不同,将同一考试结构模型应用于同一考试的不同实施。
从上述的分析我们知道,在实践中,不同类型的考试都是分类别实施的,同一类别的考试在时间上是分次实施的。在设计考试结构模型时,我们没有必要为各自独立实施的考试类型分别建立一个模型,也没有必要为同一考试的每一实施分别建立一个模型,我们只需建立一个模型,通过设定考试类型和考试实施模型参数,根据考试类型和考试实施模型参数的不同,将同一考试结构模型应用于不同类型考试的不同实施。从建立考试结构模型的角度看,我们只须对某一考试的某一实施来建立模型,而不必对所有考试类型的所有实施来建立,因此,我们要建立的考试结构模型是相对于某一考试的某一实施而言的。
对于某一考试的某一实施,构成考试结构模型的基本要素有两个:一个是考生群体,一个是考试科目。
构成考试结构模型的第一个要素是考生群体,即参加某一考试的全部考生。在一个考试中,考生群体是整个考试的服务对象,也是整个考试过程的主体。考生群体的需求构成了考试服务和管理的主要内容,因此,从考试服务和管理的角度看,了解和研究考生群体,分析、确定并满足他们的合理需求,既是考试服务和管理工作的出发点,也构成了该工作的主要内容。
从考生群体的构成看,由于考生所具备的资历和条件不同,人们往往根据这些资历和条件将考生群体分成不同的子群体,不同的子群体参加不同科目或不同科目组合的考试。
构成考试结构模型的第二个要素是考试科目,即考生群体所考的科目或试卷。在一个考试中,考试科目是考生群体的主要需求,也是考试机构提供的主要产品和服务。一项考试产品和服务能否满足考生群体的需求以及满足的程度如何,主要取决于该产品和服务的质量。一个考试机构能否推出优秀的考试产品,并提供优质的考试服务,是该考试机构在市场竞争中能否胜出的关键。因此,研究和开发高质量的考试产品,构成了考试服务和管理工作的核心。
从考试科目的构成看,考试科目的构成有其内在的规律性,既要符合测量学原理,又要满足考试实施的需要。
在具体的考试中,考生群体与考试科目之间存在着复杂的对应关系,而且在不同的考试中,这种对应关系差别很大。在考试结构模型中,这种对应关系也应该得到清晰的描述。当然,在一个考试结构模型中,将所有考试中考生群体与考试科目之间的对应关系都全面、准确地描述出来是不现实的,但应提供描述的方法,并通过该方法能够保证考生群体与考试科目之间的对应关系的全面与准确。
任何一个大规模考试的结构都包含上述两个基本要素,这两个基本要素通过它们之间的对应关系,构成了有机的考试结构整体。基本要素与对应关系的复杂度决定考试结构的复杂度。首先,从考生群体上看,如果划分考生群体的条件越多,所划分的考生子群体也越多,考生群体也就越复杂,考试结构也就越复杂;其次,从考试科目上看,如果考试科目的构成越复杂,考试结构也就越复杂;第三,从对应关系上看,如果考生群体与考试科目之间的对应关系越复杂,考试结构也就越复杂。
最简单的考试结构是该考试只有一个考生子群体,一个考试科目,而且该子群体只参加这一个考试科目。复杂的考试结构是考生群体复杂,或考试科目复杂,或考生群体与考试科目之间的对应关系复杂,或均复杂。
从上述讨论知道,对于某一考试的某一次实施,考试结构模型包含考生群体和考试科目两个基本要素。对于考生群体,根据资历和条件可以将考生群体分成不同的子群体,我们将不同的子群体称为不同的组;对于考试科目,根据实际情况为不同的科目分别编码;对于组别与科目之间的对应关系,可以根据实际情况来确定,不同的组别参考不同的科目或不同的科目组合。这样,对于某一考试的某一次实施,其考试结构模型可以图示如下,见图1。
从图1可以看出,考试的次别、组别、科目组成了一个倒置的树状结构,这个树的根部是“次别”,茎部是“组别”,叶部是“科目”。需要指出的是,在此树状结构中,组别可以有多个,但不能没有;科目也可以有多个,但不能没有。
这就是大规模考试的结构模型,对于任一考试的任一次实施,其结构都可以通过对该树状结构的“茎部”和“叶部”的适当修剪(也就是增减)而得到。如果只有一个组别,而且该组别中只有一个科目,那么该结构就是最简单的考试结构。在简单结构的基础上,通过增加一些组别或科目,考试结构就会变得复杂,也就能适应复杂的考试。
大规模考试的结构模型具有以下特点。
从考试结构模型可以看出,任何一次考试的结构都是有层次的,其结构具有三个层次:次别、组别、科目。考试的层次结构具有如下特点:
在考试的层次结构中,下一层对上一层具有隶属关系。这种隶属关系表明,同一个上一层可以有多个下一层与之对应,而同一个下一层只能有唯一的上一层与之对应。通过这种确定的隶属关系可以确切地知道,每一个上一层其属下都有多少个下一层,具体是哪些下一层。也就是说,通过这种确定的隶属关系可以知道,某一考试次别下划分了多少个组别(考生子群体),具体是哪些组别;某一组别(考生子群体)下要考多少个科目,具体是哪些科目。
在应用考试结构模型时,下一层的数量和性质可以发生变化。
⑴改变数量
将考试结构模型应用于不同的考试次别时,下一层的数量可以改变。在考试次别中,其属下是组别,在不同的考试次别中,组别可以增加、减少或保持不变,比如在某三次考试实施中,第一次考试实施中有3个组,第二次有4个组,第三次有3个组,这三次考试实施中的组别可以相同或不同;在组别中,其属下是科目,在不同的组别中,科目可以增加、减少或保持不变,比如在某次考试实施的三个组中,第一组中有3个科目,第二组有4个,第三组有5个,这三个组中的部分科目可以相同或不同。
⑵改变性质
将考试结构模型应用于不同的考试次别时,下一层不仅可以改变数量,而且可以改变性质。在不同的考试次别中,相同数量的组别可以改变性质,比如在某两次考试实施中,每次考试实施都有4个组,第一次考试实施中的4个组是A、B、C、D,第二次考试实施中的4个组是A、B、E、F,这两次考试实施的4个组在性质上可以完全不同或部分不同;同样,在不同的组别中,相同数量的科目也可以改变性质,比如在某次考试实施的两个组中,每个组中都有5个科目,第一组中的5个科目是A、B、C、D、E,第二组中的5个科目是E、F、G、H、I,这两个组中的科目在性质上可以完全不同或部分不同。
在考试结构模型的层次结构中,中间层次----组别是对考生群体进行分类的。在任一考试实施中,要以组别划分考生群体。
如何对考生群体进行分组?在不同的考试实施中,分组的标准和方法可能不同。每一考试实施的分组标准和方法必须切合其考生群体的实际情况。尽管各考试实施的分组标准和方法可能各不相同,但都必须遵循以下原则:
⑴组别必须是互斥的
在某一考试实施中,不管采用哪种分组标准和方法,最后分出的组别必须是互斥的,也就是说,对于任一报考考生,只能明确地将其归为某一组,而不能既可归为这一组,又可归为那一组。
⑵组别所包含的科目是确定的
在某一考试实施中,不管采用哪种分组标准和方法,最后分出的组别所包含的科目是确定的。对于任一组别,必须十分明确地列出其包含的考试科目,虽然不同的组别所包含的科目之间可能有重复,但不能因此而省略了某些组别下的科目,或对这些科目的归属进行含混不清的表述。在某一次考试实施的全过程中,这种确定性不能因为实施环节的变化或其它条件的变化而有所改变,例如在某一次考试实施中,某一组别包含了某些科目,无论是在报名环节,还是在成绩管理环节,这种包含关系始终是确定的、不能改变的。
在实际的考试实施中,分组方法是多种多样的。有的考试划分了级别,这些级别就可以当作组别。例如,在2001年全国国际商务专业技术资格考试中,就划分了国际商务师和助理国际商务师两个级别,可以将这两个级别直接当作组别。类似地,2001年全国一级注册结构工程师资格考试可以划分为基础、专业两个组,2001年全国消防专业考试可以划分为消防电器、消防设备两个组。
有的考试划分了级别和专业,可以将这些级别和专业进行组合,形成自己的组别。例如,在2001年全国经济专业技术资格考试中,分为中级和初级两个级别,每个级别下又分成工商管理、农业、商业管理等21个专业,可以组合为中级-工商管理、中级-农业、中级-商业管理、……、初级-工商管理、初级-农业、初级-商业管理、……等42个组。
除了全国经济专业技术资格考试的这种级别、专业的二级划分外,有的考试还有三级划分。例如,在2001年全国专业技术人员职称外语等级统一考试中,共有A、B、C三个级别,每个级别下又分为英语、日语、俄语、德语、法语、西班牙语等6个语种,英语下又分为综合、理工、卫生等3个专业,对于这种级别、语种、专业三级划分方式,可以采取自下而上的方式进行组合,即将专业和语种进行组合,可以组合成英语-综合、英语-理工、英语-卫生,将这些组合与其它语种合并成英语-综合、英语-理工、英语-卫生、日语、俄语、德语、法语、西班牙语等8种组合,再进行语种和级别的组合,即可以组合成A级-英语-综合、A级-英语-理工、A级-英语-卫生、A级-日语、A级-俄语、A级-德语、A级-法语、A级-西班牙语、B级-英语-综合、B级-英语-理工、……等24个组。
有的考试根据报考考生的资历情况,规定有些考生可以免考一些科目。例如,在2001年全国一级注册建筑师执业资格考试中,资历较高的考生可以免试《设计前期工作》、《场地设计(知识)》、《建筑设计知识》、《建筑材料与构造》、《场地设计(作图)》等5个科目,只考《建筑结构》、《环境控制与建筑设备》、《建筑经济、施工与业务管理》、《建筑设计与表达(作图)》等4个科目,其余的考生要考全部科目,因此,该考试可以划分为考四科、考九科两个组。类似地,2001年全国二级注册建筑师执业资格考试可以划分为考一科、考三科两个组,2001年全国监理工程师执业资格考试可以划分为考二科、考四科两个组,2001年全国注册税务师执业资格考试可以划分为考二科、考五科两个组,2001年全国注册城市规划师执业资格考试可以划分为考二科、考四科两个组,2001年全国价格鉴证师执业资格考试可以划分为考四科、考五科两个组,2001年全国二级注册结构工程师资格考试可以划分为考一科、考二科两个组。
有的考试既对考生的级别进行了区分,又规定有的考生可以免试部分科目,这时还需要将级别与免试的类型进行组合,形成自己的组别。例如,在2001年全国质量专业技术人员职业资格考试中,首先将考生分为中级、初级两个级别,然后根据免试情况将考生分成考一科、考二科两种类型,此时可以将级别与免试类型进行组合,形成中级-考一科、中级-考二科、初级-考一科、初级-考二科等4个组。
有的考试除了规定有的考生可以免试部分科目外,还对考生的专业进行了区分,这时需要将免试的类型与专业进行组合,形成自己的组别。例如,在2001年全国执业药师资格考试中,除了根据免试情况将考生分成考二科、考四科两种类型外,还要区分药学、中药学两个专业,此时可以将免试类型与专业进行组合,形成考二科-药学、考二科-中药学、考四科-药学、考四科-中药学等4个组。类似地,2001年全国注册资产评估师执业资格考试可以划分为考四科-免建筑工程评估基础、考四科-免机电设备评估基础、考四科-免财务会计、考五科等4个组,2001年全国造价工程师执业资格考试可以划分为考二科、考四科-土建、考四科-安装等3个组,2000年全国企业法律顾问执业资格考试可以划分为考一科、考二科-考经济与民商法律知识、考二科-考企业管理知识、考四科等4个组。
全国专业技术人员计算机应用能力考试到2002年为止,共开设了《中文Windows 98操作系统》、《Word 97中文字处理》、《Excel 97中文电子表格》、《PowerPoint 97中文演示文稿》、《计算机网络应用基础》、《Visual FoxPro 5.0数据库管理系统》、《AutoCAD制图软件》、《Photoshop 6.0图像处理》、《WPS Office 办公组合中文字处理》、《Access 2000数据库管理系统》、《Project 2000项目管理》、《FrontPage 2000网页制作》、《用友U8管理软件》等13个科目,为了最大限度地满足各地专业技术职务评审的差异,我们将划分该考试组别的权利下放到了各地,因此,各地在实施该考试之前,可以根据本地的实际情况划分出本地的组别。
除此以外,还有其它一些分组方法,只要这些方法能够切合考生群体的实际情况,又符合分组原则,就可以将这些方法应用于实际的考试实施。
在考试结构模型中,科目是构成模型的基本单元。
科目作为考试结构的基本构成单元,主要有以下两点依据:
⑴考试管理是分科目进行的
在大规模考试管理中,自考试的科目设置之后,大纲制订、教材编写、题目命制、试卷预订、测试实施、试卷评阅、成绩管理、成绩分析等各个环节都是分科目进行的,科目作为一个基本的单元一直处于考试管理的全过程之中。
⑵合格线是分科目划定的
大规模考试的分数线都是分科目划定的,这些科目的分数之间是不能相互替代的,不能用某一科目的高分弥补另一科目的低分,也就是说对每一设定的科目都有一个只针对该科目的单独要求。
在实际工作中,由于科目大多是由主管部门设定的,存在着较大的随意性。从心理测量学看,科目的构成应具备一些基本条件。
⑴单维性
在实践中,单维性是构成科目时非常容易忽视的一个基本条件。在建立考试时,为了达到考试目的,往往要考查很多内容,主管部门为了使考试易于实施,往往将很多内容合并到一个科目(即一张试卷)中去考查,这些内容如果相同或相近,合并后一般还能大致保证该科目的单维性,如果这些内容完全不同,在统计上是相互独立的,那么合并后就会产生严重的问题,会导致该科目的测量误差增大,信度降低。经过对多种大规模考试多年的统计分析,我们发现,合并多个不同内容的科目,其内部一致性信度较低。比如某执业资格考试,在试点时,其每一科目的信度都比较高,在正式考试时,为了便于实施,主管部门将试点时的其中三个科目合并成了一个科目,结果该合并科目的内部一致性信度较低,其原因就在于合并了三个相对独立的科目,违反了科目构成的单维性原则。从直观意义上看,如果两个内容在统计上是相互独立的,那么这两个内容就不能相互替代,在这两个内容上的分数也就不能直接相加,因而也就不能将这两个内容合并成一个科目。例如,在有些地方实施的计算机考试中,将很多方面的计算机内容合并在一起(而不管这些内容是多么的不同),每一方面的内容出一点题目,组成一张试卷,目的是为了考得更全面,其实这样的试卷往往测量误差很大,信度很低,其根本原因在于没有满足单维性的要求。
⑵科目之间相关较小
在新考试的设计初期,考试范围往往包含很多内容,如果将每一内容都设置成一个考试科目,那么该考试将会包含很多考试科目,这样就给考试实施带来很多困难。如何解决这一问题?一个切实可行的办法就是将相近的内容进行合并。在合并的过程中,应当遵循单维性原则,合并后的内容应遵循“科目之间相关较小”原则,要尽量将不同的内容设计成不同的科目。
⑶足够题量
大规模考试由于涉及的考生众多,一张试卷要施测于各个能力水平的考生,因此一个科目中应有足够的各种难度的题目。如果题量太小,不能保证各种难度的题目有足够的数量,导致测量误差较大,试卷的信度较低。要保证试卷有较高的信度,就必须有足够的题量。经过对大规模考试多年的统计分析发现,即使题目质量很好,但题量太小,试卷的信度就会很低。比如某全国统一考试,在试点时,某一科目试卷只有20道题目,而且这些题目都是0、1记分的二分题目,尽管这些单个题目的评价指标都不错,但是由这些题目所组成的试卷的指标却不佳,原因就在于组成试卷的题量太小。后来在全国推广后,该科目扩充了题量,试卷指标随之改善。
作为构成考试结构模型的基本单元,科目具有如下属性:
⑴考试日期与时间
在某一次考试实施中,考试日期与时间是科目关于实施方面的属性。考生根据考试日期与时间,在考试机构的安排下参加考试。离开了考试日期与时间,势必引起考生参加考试的混乱。
⑵题型、题量与分值
题型、题量与分值是科目关于试卷结构方面的属性。通过题型、题量与分值,可以定义一张试卷的组成结构,首先,从题型上,根据试题的评分是否客观,可以分为客观题和主观题两大类,客观题评分客观,适合于大批量的机器阅卷,主观题评分通过人工方式进行,难以客观,也难以进行大批量阅卷。客观题又分为单选题、多选题和是非判断题,主观题一般有简答题、计算题、案例分析题、论述题等,通过题型的界定,可以确定一张试卷的题型结构。其次,从题量上,要为确定的每一题型定义相应的题量。再次,从分值上,要为每一题型的每一道题目确定分值。这样,通过题型、题量与分值,就可以定义一张试卷的组成结构。
⑶合格分数
合格分数是科目关于成绩管理方面的属性。通过科目的合格分数,可以确定某一次考试实施中哪些考生在该科目上成绩合格,哪些考生不合格。离开了科目的合格分数,将无法判断考生的分数是否合格。
⑷合格年限
合格年限是科目关于合格有效期方面的属性。根据科目的合格年限,可以判断在某一时刻考生该科的合格成绩是否在有效期之内。离开了科目的合格年限,将无法判断考生合格成绩的有效性。
《考试研究》2002年第2期,第40-54页