柳学智：我国大规模考试实施模式之分析

发布日期：2017-05-09 来源：

柳学智

[摘要] 基于公平性、效率和可行性，本文比较和评价了我国当前四种大规模考试实施模式：省级政府、中央政府、企业和政府-企业模式，并根据不同的时限和情景状态，给出了相应的结论和建议。

[关键词] 大规模考试考试实施公平性效率可行性

自上世纪七十年代末我国实行对外开放以来，经济高速增长，社会发生深刻变革，考试也处在历史发展的最好时期，不仅表现在数量上，而且表现在规模上。在需要进行评价、筛选、提拔、录用等重要决策时，人们开发使用了各种不同的考试。依据传统，这些考试都由政府开发并实施。与此同时，由企业和非政府组织开发和实施的国外考试落户中国，国内企业也开始开发实施与其业务相关的考试。

当前，政府和企业同时提供考试实施服务，由此引发严重的问题。一方面，在政府提供的考试实施中，资源配置重复，效率低下，由于缺乏竞争，技术变革乏力，考试服务质量难以提高。另一方面，在企业提供的考试实施中，由于市场缺乏法律规范和有效监管，考试公平难以保证，竞争无序，垄断时现，应试人员不得不负担高昂的服务价格。

为了探索我国大规模考试实施的合适模式，本文检验了当前存在的四种考试实施方式。

一、现行考试实施模式

㈠大规模考试的实施过程

大规模考试主要有纸笔考试和电子考试两种形式，它们有不同的实施过程。

1、纸笔考试的实施过程

在大规模纸笔考试实施中，由于规模巨大，考试实施具有一定的层次，最简单的是二级层次，即顶层和基层考试实施部门，基层部门设置考点考场，具体组织施考，顶层部门管理基层部门，汇总各基层部门的考试信息。随着考试规模的逐步扩大，二级实施层次难以满足需要，需要在顶层和基层之间设置中间层来分级管理。考试规模越大，考生越多，中间层次越多。在考试实施各个层次中，需要有一个层次来指挥协调各个层次的实施事务，在整个考试实施中起中枢作用，该层次一般为顶层部门。

纸质考试实施主要体现在有形的试卷管理和无形的信息管理上。在试卷管理上，一般包括考前、施考和考后三个阶段。在考前阶段，基层考试实施部门负责应试人员报名，预订试卷，试卷预订通过中间层，逐级向上汇总至中枢层，试卷由中枢层印制，再通过中间层，逐级向下运送、分发，封存至基层部门。在施考阶段，基层部门具体负责实施。在考后阶段，基层部门负责收集和密封答卷，通过中间层，逐级向上汇总，封存至中枢层，在中枢层，客观题做答结果由光电阅读机阅读，由计算机进行评分，主观题做答结果由评分员评阅，评分员由中枢层选拔、培训，考试分数由中枢层报告给应试人员。

在信息管理上，中枢层制订信息标准，设计考试管理信息系统，考试实施过程中的各种信息，比如应试人员报名、试卷预订、应试人员座位安排、应试人员做答、评分员安排、考试分数等信息，或由基层部门采集经由中间层汇总至中枢层，或由中枢层直接生成，所有这些信息都存储于中枢层的数据库中，考试实施过程中的各种决策都是基于对这些信息的统计分析做出的。

2、电子考试的实施过程

与纸笔考试相比，大规模电子考试的实施过程发生了很大变化，其中最显著的变化是纸质试卷由电子试卷替代，这些电子试卷在施考前或施考中，根据心理测量学的原则和技术，从题库中抽取题目临时组成，有形的纸质试卷管理过程消失了，题目和试卷由计算机考试系统和网络进行管理，电子考试实施主要体现在无形的信息管理上。

在电子考试实施中，题库和试题通过网络分发给每个考点考场，直至每个应试人员，实施过程中的各种信息通过网络采集，因此需要建立专门的依据网络的考试分发和信息采集系统。由于该系统比较复杂，产生了专门的考试分发商，专门提供考试分发和信息采集系统。在电子考试实施中，考试的分发和信息采集主要有两种方式：一种是考试实施机构自己开发考试分发和信息采集系统，另一种是考试实施机构与考试分发商合作，使用其专门的考试分发和信息采集系统。

从实施层次上看，电子考试实施可以只有两个实施层次：顶层和基层，顶层是中枢层，在实施电子考试时，顶层考试实施部门或分发商建立数据中心，通过考试分发和信息采集系统将试题或题库从数据中心传输到考场，然后将考试实施过程中的信息采集、传输到数据中心，基层考试实施部门具体实施考试并进行监督。应试人员的做答结果由计算机自动评阅，考试信息存储于数据中心，考试分数由顶层考试实施部门或分发商报告给应试人员。

㈡现行考试实施模式

目前，我国大规模考试的实施模式主要有四种。

1、省级政府模式

考试实施的省级政府模式沿用了我国政府的层级设置，考试实施由中央、省（自治区、直辖市）、市（地）和县（区）四级政府考试部门承担，同时接受同级政府其它部门比如公安、卫生、保密、监察等的支持和监督，以及上级考试部门的监督和指导。在四级考试实施层次中，考场一般设置到县，县级政府考试部门是基层，省级政府考试部门是中枢层。考试实施的省级政府模式实施的主要是纸笔考试，试题和试卷一般由中央或省级政府考试部门负责命制。

2、中央政府模式

考试实施的中央政府模式仍然沿用了我国政府的层级设置，考试实施有两种类型：一种是二级实施，考试实施由中央和省（自治区、直辖市）两级政府考试部门承担，考场设置到省，省级政府考试部门是基层考试部门；另一种是三级实施，考试实施由中央、省（自治区、直辖市）和市（地）三级政府考试部门承担，考场设置到市，市级政府考试部门是基层考试部门。在这两种类型中，考试实施都要接受同级政府其它部门比如公安、卫生、保密、监察等的支持和监督，以及上级考试部门的监督和指导。在考试实施层次中，无论是二级实施还是三级实施，中央政府考试部门都是中枢层。考试实施的中央政府模式实施的既有纸笔考试，也有电子考试，试题和试卷由中央政府考试部门负责命制。

3、企业模式

考试实施的企业模式打破了政府模式中的层级设置，考试实施仅有顶层和基层两个实施层次，无论是顶层，还是基层，都是由企业或非政府组织承担。这种模式实施的主要是电子考试，一般由专门的考试提供商提供，考试提供商委托分发商实施，分发商为顶层，也是中枢层，分发商在不同地域建立基层考试实施层，负责本地考试实施事务。考试提供商、分发商和基层考试实施部门相互协商，签定合同，分工合作，共同完成考试实施任务。

4、政府-企业模式

与考试实施的企业模式类似，政府-企业模式也打破了政府模式中的层级设置，考试实施仅有顶层和基层两个实施层次。这种模式实施的既有纸笔考试，也有电子考试，一般由专门的考试提供商提供。考试提供商委托政府考试部门（通常为中央政府考试部门）实施，在实施电子考试时，也可能有专门的分发商参与。政府考试部门为顶层，也是中枢层，政府考试部门在不同地域建立基层考试实施层，负责本地考试实施事务，由所在地域的企业或非政府组织承担。考试提供商、政府考试部门、分发商和基层考试实施部门相互协商，签定合同，分工合作，共同完成考试实施任务。

二、比较的标准

为了比较和评价上述考试实施的四种模式，本文确定了三个标准：公平性、效率和可行性。

㈠公平性

研究表明，考试作弊是普遍存在的，早自幼儿园开始，到学校教育阶段，一直持续到职业生涯。几乎每一个人，不仅是大、中、小学生，甚至教师、管理人员、律师、飞行员、建筑师等专业人员也都参与过作弊（Cizek，1999）。从我国古代的科举考试到20世纪末美国纽约州的学生评估考试，作弊现象时有发生（Hoff，2003）。考试和作弊就像孪生兄弟，考试一旦开发实施，作弊也随之产生。

在考虑我国当前考试实施中的作弊现象时，有两点应当引起重视：一是考试对于应试人员的重要性，考试越重要，考试实施中的作弊可能越大，相对于其它国家，我国的大规模考试对于应试人员的重要程度更高；二是我国目前尚未建立个人信誉系统，无法记录考试实施中的作弊行为，更不能跟踪或预防作弊行为，这反过来会助长作弊行为的蔓延。在我国大规模考试实施中，减少作弊现象，增加公平性，既是公众关注的焦点，也是考试实施部门的首要任务。

大规模考试实施主要涉及两类人员：考试工作人员和应试人员。考试工作人员是指在整个考试实施过程中参与工作的人员，一部分工作人员知道试题或答案，这些试题或答案在一段时间内是保密的，他们负有保密的责任，还有一部分工作人员对应试人员的行为进行监督，他们负有监督的责任。应试人员是参加考试的人员，他们希望通过考试，在应试人员做答试题时，其行为应在考试工作人员的监督之下。在考试实施中，为了减少作弊，提高公平性，考试工作人员和应试人员的行为都应该规范，而且受到监督。

1、对考试工作人员行为的规范

在考试实施中，如果考试工作人员的行为没有规范或监督，作弊行为就可能发生。考试工作人员作弊是一种腐败行为，因为他通过出卖或滥用考试实施中所赋予的特权，从应试人员那里直接或间接地获得某种利益或方便，获得的利益或方便越多，作弊的可能性越大。

在整个考试实施过程中，为了防止考试工作人员作弊，应制定相应的规范以确保其行为适当，如果考试工作人员行为失当，一旦被发现，就应受到惩处。该规范应能有效地调节考试工作人员的行为。某一规范的有效性可以通过处罚来体现，考试工作人员在考试实施中作弊，一旦被发现，如果他所得到的处罚越大，其作弊的可能性越小，反之亦然。

2、对考试工作人员作弊行为的探查

考试工作人员的作弊可能不仅取决于上述处罚，而且取决于对作弊行为的探查，这种探查可以通过管理程序或技术措施实现。在考试实施中，用于探查考试工作人员作弊的管理程序和技术措施越多，作弊行为越容易被发现，考试工作人员作弊的可能性越小。然而，使用的管理程序和技术措施越多，考试实施的成本会越高，随着成本的上升，考试工作人员作弊的可能性下降。

3、对应试人员行为的规范

应试人员作弊的原因多种多样，但归纳起来都是为了获得好的分数（Cizek，1999），应试人员通过作弊获得高分越容易，其作弊的可能性越大。

在考试实施中，影响应试人员作弊的因素主要有以下两个：一是考试对应试人员的重要性，如果某一考试对应试人员不太重要，其作弊的动机小，作弊的可能较小，考试的重要性增大，作弊的可能性也随之增大；二是应试人员在知识、技能、能力、态度或其它考试所测量的特质上真实与期望水平之间的差距，如果这个差距很小，应试人员很容易通过个人努力弥补这个差距，差距越大，弥补的困难越大。

与规范考试工作人员行为一样，为了防止应试人员作弊，应制定相应的规范以确保其行为适当，如果应试人员行为失当，一旦被发现，就应受到惩处。该规范应能有效地调节应试人员的行为。某一规范的有效性可以通过处罚来体现，应试人员在考试实施中作弊，一旦被发现，如果他所得到的处罚越大，其作弊的可能性越小，反之亦然。

4、对应试人员作弊行为的探查

与考试工作人员一样，应试人员的作弊可能不仅取决于上述处罚，而且取决于对作弊行为的探查，这种探查可以通过管理程序或技术措施实现。在考试实施中，用于探查应试人员作弊的管理程序和技术措施越多，作弊行为越容易被发现，应试人员作弊的可能性越小。然而，使用的管理程序和技术措施越多，考试实施的成本会越高，随着成本的上升，应试人员作弊的可能性下降。

㈡效率

效率是指用相对较低的投入生产出较高质量或较大数量的产出。在大规模考试中，要评估考试服务的效率比较困难，因为考试服务的投入和产出都难以测量。然而，通过对考试实施中评分误差的控制、信息的交流等重要环节的质量的分析，再结合考试服务价格的确定，可以获得评估考试服务效率的线索和启示。

1、评分误差的控制

根据对试题答案评阅的客观性，考试题目可以分为两大类：客观性题目和主观性题目。客观性题目的答案在多次重复评阅时能得到同样的结果，由于评阅过程不受人的主观性的影响，客观性题目的做答结果可以填涂在专用的答题卡上，由光标阅读机将做答信息读入计算机，由计算机评阅。随着计算机和光标阅读机在大规模考试实施中的广泛应用，客观性题目做答结果的评阅质量可以保持在一个很高的水平。

主观性题目的答案在多次重复评阅时会得到不同的结果，由于评阅过程受人的主观性的影响，容易产生评分误差。由于兴趣、爱好、价值观等个人特征上存在差异，对同一主观性题目，不同评分者评阅的结果不同，有的分数普遍较高，有的普遍较低，有的分数分散，有的分数集中，在评分之前，应根据评分者的评分倾向，对评分者进行筛选，以排除极端者。评分者经过筛选后，为提高评分者对评分标准理解的一致性，应对评分标准进行说明和细化，使大家能够取得理解上的共识，之后每个评分者应进行试评，然后对评分标准进行再次讨论和细化，进一步提高评分者对评分标准理解的一致性。

由于受到情绪、心情、疲劳等心理或生理因素的影响，评分者在评分过程中对评分标准的把握和应用会出现波动。这种波动应受到监督，并被控制在合理的范围之内，如果波动超过预定范围，应告知评分者重新评阅，如果多次超过，应停止该评分者的评分，查找原因，采取相应对策。

为了将评分误差控制在可接受水平，需要制定相应的管理程序和技术措施。在筛选评分者时可以用到心理量表和统计技术，随着信息技术在评分过程中的应用，主观性题目的做答结果可以扫描入计算机，存储于高容量的服务器中，通过网络分发给评分者进行评阅，评分者的评阅结果自动记录，评阅行为受到监控。在评分过程中，使用的技术越多，评分误差越小。

2、信息的交流

作为考试服务的两个部分，考试命题与实施相互联系而又相互依赖。一方面，考试命题生产出试题、试卷和题库，提供给考试实施，另一方面，考试实施产生了大量的信息，特别是应试人员对试题的做答信息，随着光标阅读器和信息技术在信息采集、传输、储存等方面的广泛应用，这些信息可以采集起来，进行分析，分析结果反馈给考试命题，用于题目的命制、修改，甚至命题计划的更改、细化等，这些都有助于提高试题、试卷和题库的质量。因此，考试命题与实施之间需要进行信息交流。

在大规模考试实施内部，涉及多个层次的实施部门，这些部门往往参与多个考试的实施。为了应对考试工作人员和应试人员的作弊，不同层次的实施部门之间以及同一层次的不同部门之间，需要交流实施信息。如果某一考试实施部门A管辖的范围是地域A，考试实施部门B管辖的范围是地域B，在某一考试实施中，有一应试人员在地域A作弊并被发现记录，处以3年内不得参加任何考试的处罚，但该应试人员为了参加某一重要的考试，为躲避处罚，该应试人员到地域B报名参加考试，如果在考试实施部门A与B之间没有信息交流，该应试人员很容易通过报名，对其处罚也就难以执行。如果在考试实施部门A与B之间有信息交流，该应试人员在考试实施部门B报名时就很容易被发现，其报名就不会被通过，这样其所得到的处罚就能落到实处。

在大规模考试实施中，随着考试实施对考试命题的信息反馈，随着考试实施内各部门之间的信息交流，命题质量有望得到逐步提高，作弊现象逐步减少。

3、价格的确定

考试服务由考试命制部门开发，由考试实施部门实施，由应试人员消费，应试人员为获得考试服务支付费用。考试服务的价格取决于下列因素。

1）市场机制的建立和完善。如果考试服务是通过市场提供的，而且市场是竞争性的，市场机制就会起作用，考试服务的价格由市场决定；如果市场是非竞争性的，或存在垄断，垄断者为了追求高额利润，会制定高昂的垄断价格。如果考试服务作为一种公共服务由政府提供，政府的首要任务是维护社会公平，政府为提高效率可以对考试服务收费，但不具备市场竞争性，考试服务的价格不能充分反映考试服务的质量或数量，因此会降低考试命题和实施部门提高服务质量的动力。

2）考试的规模。如果考试服务是通过竞争性市场提供的，考试服务的提供具有规模经济效益。考试规模越大，考试服务的价格越低，反之亦然，这是因为考试服务的成本，包括考试命题和考试实施，可以由更多的应试人员平摊，由此导致平均成本下降和最终费用的降低。

3）服务的质量。随着心理测量学和统计学的进步以及信息技术在考试命题和实施中的应用，考试服务的质量逐步提高，不仅表现在试卷的效度、信度等方面，而且表现在应试人员对获取服务的方便程度上。在竞争性考试服务市场中，随着技术的应用，最终会导致服务质量的提高和服务价格的相对下降，但在非竞争性市场或政府提供的服务中，这种关系并不明显。

㈢可行性

考试实施的可行性可以从政治、管理、技术三个方面进行比较和评价。

1、政治方面

从政治上看，渐进的变革比激进的变革更容易被公众接受。在历史上，我国的大规模考试一直由政府部门实施，依据传统，由政府实施的考试更容易被公众接受，如果考试不由或不完全由政府实施，在政治上具有更大的不确定性。

2、管理方面

在大规模考试实施中，根据应试人员的数量和覆盖的地域，需要设立一定数量的考试实施机构承担考试实施事务。随着实施地域的扩大，考试实施的环境变得越来越动态，越来越复杂，要使考试实施的平稳和顺利，考试实施的灵活性变得越来越重要。在一个动态变化的环境里，考试实施是否能够快速、顺利地适应该环境？在某一地区设立考试机构是否容易？在考试实施过程中，如果发生了紧急事故，考试机构需要多长时间做出反应？所有这些问题在不同的考试实施模式之间存在着差异，可以检验某一考试实施的灵活程度。

3、技术方面

随着越来越多的技术应用于考试命题和实施，考试服务的提供越来越依赖技术的创新和发明，而技术的创新和发明与市场竞争相联系。在竞争性市场中，企业如果想获得竞争优势，技术变革往往是最有效的方式，通过技术革新，可以降低成本，提高质量，因此企业在新技术的研究与发展上具有动力。但在非竞争性市场和政府提供的服务中，往往缺乏技术革新的动力。

三、实施模式的比较

基于公平性、效率、可行性，我们对大规模考试实施的省级政府、中央政府、企业、政府-企业四种模式进行讨论和比较。

㈠省级政府模式

1、公平性

在考试实施的省级政府模式中，对考试工作人员和应试人员的行为，中央和省级政府制定了严格的规范和程序。在对考试工作人员和应试人员作弊行为的探查上，各政府相关部门协调一致，共同应对，可用资源充沛。然而，由于业务的处理和信息的采集主要是分省进行的，省与省之间的考试实施信息难以充分交流，对考试工作人员和应试人员的作弊行为的惩处也就难以跨省执行。

2、效率

在省级政府考试实施模式中，主观性题目做答结果的评阅是分省进行的，各省独立选拔、培训评分者。虽然也有全国性的评分标准，但省与省之间对同一评分标准的理解和细化上可能存在某种程度的差异，由此导致对评分标准把握的不一致，并最终产生一定的评分误差。

由于考试实施中的信息是分省采集的，不仅省与省之间的信息难以自由交流，而且省与中央之间信息交流也不够充分，处在中央层次的考试命题难以从考试实施中获得信息反馈，不利于进一步提高试题、试卷和题库质量。

考试服务的价格主要由省级政府物价部门确定，各省之间存在一定的地区差异，价格水平普遍较低。由于价格由政府确定，未形成竞争性市场，考试服务的需求和供给基本未受价格的影响，价格机制没有发挥调节需求和供给的作用。

3、可行性

在历史上，我国大规模考试一直由政府实施，因此考试实施的省级政府模式无论对于公众还是政府，在政治上都容易接受。在现阶段，一方面考试对于应试人员十分重要，另一方面社会缺乏诚信，考试作弊形势严峻，在考试实施上，与企业和其它社会组织相比，公众更信赖政府能够公正地实施考试。

在管理上，根据政府的管理层级来设置多层考试实施机构，职能重叠，不易适应复杂、多变的考试环境，给应试人员和考试工作人员带来诸多不便。

在技术上，由于缺乏竞争压力，技术革新的动力很小，进展缓慢，各级考试实施机构既无机制也无动力适应技术的变革。

㈡中央政府模式

1、公平性

与省级政府模式一样，在考试实施的中央政府模式中，对考试工作人员和应试人员的行为，中央和省级政府制定了严格的规范和程序。在对考试工作人员和应试人员作弊行为的探查上，各政府相关部门协调一致，共同应对，可用资源充沛。由于业务的处理和信息的采集是以中央政府考试部门为核心进行的，信息的采集和处理具有全国性，不同考试部门之间的考试实施信息可以充分交流，考试工作人员和应试人员的作弊行为可以跨地域识别和惩处。

2、效率

在考试实施的中央政府模式中，主观性题目做答结果汇总集中，由中央政府考试部门统一组织评阅，评分者统一选拔、培训，降低了评分者对评分标准把握和应用的不一致性，由此减少评分误差。

由于考试实施中的信息是统一采集的，同一层次以及不同层次的考试机构之间的信息可以充分交流，处在中央层次的考试命题能够从考试实施中获得信息反馈，有利于进一步提高试题、试卷和题库质量。

与省级政府模式类似，考试服务的价格由政府确定，未形成竞争性市场，考试服务的需求和供给基本未受价格的影响，价格机制没有发挥调节需求和供给的作用。

3、可行性

与省级政府模式一样，考试实施的中央政府模式在政治上容易被公众和政府接受；在管理上，根据政府的管理层级来设置多层考试实施机构，职能重叠，不易适应复杂、多变的考试环境；在技术上，各级考试实施机构技术革新乏力，难以适应技术变革。

㈢企业模式

1、公平性

在考试实施的企业模式中，对考试工作人员和应试人员的行为，虽然也制定了相应的规范和程序，但与政府模式相比，其权威和效力逊色许多。在对考试工作人员和应试人员作弊行为的探查上，与政府模式相比，所能利用的资源要少得多，考试工作人员和应试人员作弊的概率也不可能那么低。由于业务的处理和信息的采集具有全国性，不同考试部门之间的考试实施信息可以充分交流，考试工作人员和应试人员的作弊行为可以跨地域识别和惩处。

2、效率

在考试实施的企业模式中，主观性题目做答结果汇总集中，由考试提供商或分发商统一组织评阅，评分者统一选拔、培训，降低了评分者对评分标准把握和应用的不一致性，由此可以减少评分误差。

考试实施中的信息是统一采集的，同一层次以及不同层次的考试机构之间的信息可以充分交流，考试实施的信息能够反馈到考试命题，有利于进一步提高试题、试卷和题库质量。

在考试服务市场中，由于缺乏监管，市场存在一定的垄断，考试提供商和分发商为了追求高额垄断利润，制定了高昂的服务价格。

3、可行性

与政府模式相比，考试实施的企业模式在政治上不易被公众接受。在现阶段，由于社会缺乏诚信，考试作弊形势严峻，公众不易信赖企业能公正地实施考试。

在管理上，考试实施的层次减少，结构扁平，可以适应复杂、多变的考试环境，方便了应试人员和考试工作人员。

在技术上，由于面临竞争压力，各考试提供商和分发商往往通过技术进步获得竞争优势，技术革新的动力较大，能适应技术变革。

㈣政府-企业模式

1、公平性

在考试实施的政府-企业模式中，对考试工作人员和应试人员的行为，虽然也制定了相应的规范和程序，但与政府模式相比，其权威和效力逊色许多。在对考试工作人员和应试人员作弊行为的探查上，与政府模式相比，虽然所能利用的资源要少得多，但政府考试部门在长期考试实施中获得的专业工作经验和声誉，有利于对作弊行为的探查，考试工作人员和应试人员作弊的概率可以控制在较低水平。由于业务的处理和信息的采集具有全国性，不同考试部门之间的考试实施信息可以充分交流，考试工作人员和应试人员的作弊行为可以跨地域识别和惩处。

2、效率

与企业模式类似，在考试实施的政府-企业模式中，主观性题目做答结果汇总集中，由考试提供商或政府考试部门统一组织评阅，评分者统一选拔、培训，降低了评分者对评分标准把握和应用的不一致性，由此可以减少评分误差。考试实施中的信息统一采集，同一层次以及不同层次的考试机构之间的信息可以充分交流，考试实施的信息能够反馈到考试命题，有利于进一步提高试题、试卷和题库质量。在考试服务市场中，由于缺乏监管，市场存在一定的垄断，考试提供商为了追求高额垄断利润，制定了高昂的服务价格。

3、可行性

在政治的接受程度上，考试实施的政府-企业模式低于政府模式，但要高于企业模式，在应对作弊和维护考试公平上，该模式逐渐赢得社会的接受和声誉。

与公司模式类似，在管理上，考试实施的层次减少，结构扁平，可以适应复杂、多变的考试环境。在技术上，由于面临竞争压力，各考试提供商往往通过技术进步获得竞争优势，技术革新的动力较大，能适应技术变革。

上述讨论和比较可以概要于表1。

表1 考试实施模式的比较

QQ截图20170509111901.jpg

需要指出的是，表1中的总结是对各考试实施模式在各比较标准上最佳结果的预测，在实际中，各模式的实际表现取决于对各标准的重视程度，即使是同一模式的不同考试实施，对各标准的重视程度不同，其实际表现也会存在差异。

四、结论和建议

基于对上述四种考试实施方式的比较和评价，根据不同的时限和情景状态，可以得出如下结论和建议。

从短期来看，由于考试关系重大，而且个人信誉系统尚未建立，在这种情景下，考试实施的可信度是公众优先考虑的问题，考试实施的政府模式也许是切合实际的选择，尽管效率是考试实施中的一个问题。与省级政府模式相比，中央政府模式更为可选。

从长期来看，为保证考试服务领域的公平性，应制定相关法律法规进行规范。由于政府提供的考试实施服务效率偏低，应退出考试实施的提供，致力于建立和维护一个公平、公正的考试环境，在这个环境中，考试实施由企业来提供，考试服务的价格由市场来确定，资源能够有效的分配。因此企业模式也许是将来大规模考试实施的方向。

在从政府模式到企业模式的转型阶段，可以试行政府-企业模式，逐步减少政府、同时增加企业的干预程度。

参考文献

Cizek, G.J. (1999). Cheating on tests: How to do it, detect it, and prevent it. Mahwah, NJ: Erlbaum.

Hoff, D.J. (2003, November 5). New York teachers caught cheating on state tests. Education Week, 23 (10).

《考试研究》2005年第2期，第42-56页