柳学智:考试信息化的原则

发布日期:2017-05-09 来源:

柳学智

[摘要]  考试信息化是考试领域的一场革命,不仅涉及对传统考试理念和管理方式的改变,而且涉及相关各方利益的调整。要推动考试信息化顺利、平稳的进行,应遵循公平性、效率和可行性三个原则。

 [关键词]  信息化  原则  公平性  效率  可行性

考试信息化是考试领域的一场革命,不仅涉及对传统考试理念和管理方式的改变,而且涉及对相关各方利益的调整,是一个十分复杂的过程。在实施考试信息化项目时,如果任何一个方面考虑不周或处理不当,都可能导致项目的失败,延缓甚至终止信息化的进程。回顾考试信息化的历程,要提高考试信息化项目实施的成功率,降低失败的可能,推动考试信息化顺利、平稳的进行,考试信息化应遵循公平性、效率和可行性三个原则。

        一、公平性

纵观我国考试的历史,在进行评价、筛选、提拔、录用等重要决策时,考试正是因为为公众和社会提供了公平机会而产生、发展,并经久不衰。

早在科举考试诞生之前的汉代和魏晋南北朝时期,选拔官员的制度是察举制和九品中正制,选拔的基本方法是推荐,并不是考试,但由于推荐没有严格的标准,操持推荐权柄者可以随意“高下从心”,推荐过程滋生大量腐败,而考试可以克服推荐过程中的弊端,使当权者不能“高下从心”,结果推荐制被科举制取代,科举考试之前,平民贵族之阶级,截然划分,科举考试之后,人人皆可为治人之人,人人皆可为治于人之人,科举考试为每一个士子提供一个公平竞争的机会[1][2]。科举考试这种“公开竞争、平等择优”的精神受到公众的普遍欢迎,超越了时代,是我国封建社会难得的较为公平的制度[3]

在“文化大革命”期间,统一的高等学校招生考试被取消,实行推荐上大学,由于大学招生没有客观的标准,上大学“走后门”成风。“文化大革命”结束后,为了尽快拨乱反正,恢复社会公平,高等学校招生成了邓小平整顿教育的“突破口”,邓小平提出,高校招生要下决心恢复从高中毕业生中直接招考学生,不要再搞群众推荐。高考的恢复赢得了社会的广泛欢迎,正如有的群众所形容的,恢复高考象爆炸了一颗原子弹,震撼了整个中国大地[4][5][6]

考试之所以有如此强大的生命力,能够得到如此广泛的应用,根本原因在于考试作为一种决策依据,在决策时能为每一利益相关人提供一个公平的机会,这种公平机制有助于激发学习者的积极性,提高应试人员的素质,促进人才的流动,推动社会的进步。

那么,什么样的考试才是公平的考试?如何定义考试的公平性?采取何种方法和手段才能达到考试公平?

考试的公平性是一个十分复杂的问题。从考试本身来看,任何考试都没有百分之百的信度,效度在任何情况下也都是一个程度问题。因此,对每个应试人员来说,考试要做到绝对公平是不可能的,考试公平只是一个程度问题。

考试公平性至少涉及两方面的问题:一是对考试公平性的理解和定义,在高校录取时是否应该给少数民族考生降低分数线?是否应该对教育条件差的地区的考生给予照顾?等等;二是从技术角度如何实现考试的公平性,比如,如何命制公平的试卷?考试实施中有哪些作弊现象?如何保持施测过程的公平?如何合理地解释考试分数?等等。

第一类问题涉及价值和判断,在不同的意识形态、政治体制和公共政策下,人们有不同的价值体系和判断标准,对公平性有不同的理解和定义,在这类问题上往往意见分歧较大,共识程度低;第二类问题从技术角度来实现公平性,共识程度高。由于价值体系和判断标准涉及价值观、世界观等人的深层次观念和倾向,对于考试公平性的理解和定义上的分歧,在短时期内取得共识非常困难,第一类问题不是我们探讨的重点。我们依据大多数人对公平性的理解和定义,重点探讨第二类问题,即,如何实现考试的公平性。

从考试的内涵上,考试包含试卷命制和考试实施,在考试信息化的推进过程中,考试的公平性也可以从这两个方面来讨论。

       ㈠试卷命制

某次考试有一作文题,以“妈妈爱吃鱼头”为题给出了一幅漫画,有一位妈妈和一个儿子,在儿子小时候,妈妈说自己爱吃鱼头,每次吃鱼时,都抢着吃鱼头,把鱼身让给儿子,儿子长大后,每次吃鱼时,依然把鱼头夹给妈妈,把鱼身留给自己。试题要求考生对此进行评论。

这道题的本意是讽刺儿子自私,没有爱心,但是带有明显的地域偏见。因为鱼用鳃呼吸,鳃帮的活动量很大,两鳃附近的肉极鲜嫩,富含养分,在我国南方,经常吃鱼的南方人就专挑鱼的面颊肉吃,鱼头是美味,南方考生很难理解儿子的行为是自私的和没有爱心的,这道题对南方考生产生了不公平。

这是一种试题偏见。考试公平性起源于对试题偏见的认识和研究,试题除了存在地域偏见外,还有其他类型的偏见。例如,在智力测验的研究中,人们发现不同人口群组之间的差异:母语为非英语的儿童会因语言上的障碍而影响其智商分数,经济地位较低的儿童由于受到家庭的影响而在一些题目上的得分较低。人们认识到一些考试表现中的差异并不一定反映实际水平。在20世纪60年代,试题偏见问题受到重视,进行了大量的研究,一般认为,如果一项考试不会系统地高估和低估某一群体,这个考试就是公平的[7]。1985年版的美国《教育与心理测量标准》(Standards for Educational and Psychological  Testing)认可了试卷公平性的这个定义。很长一段时间,人们认为一些重要的考试,比如学业评估考试(Scholastic Assessment Test,SAT),低估了黑人的能力,并因此认为这些考试存在偏见[8]

但是,更深入的研究表明,如果考察考试分数与效度标准行为之间的关系,在许多情况下,学业评估考试不仅没有低估黑人考生的实际能力,反而高估了黑人考生的实际能力。今天,心理测量学术界已经普遍改变了最初的看法,高估或低估某一群体不能作为考试偏见的定义。

试卷公平性是指对来自不同群体而且具有相同能力或熟练水平的个体所测得的特性是否相同,如果测得的特性相同,说明试卷具有公平性,如果测得的特性不同,说明试卷不公平,具有偏见。这里,试卷的公平性就与试卷的效度联系起来。在上述作文例子中,由于地域的原因,南方和北方的考生会有不同的理解,南方考生得分较低,北方考生得分较高,南方和北方考生得到不同的测量结果,按此测量结果预测,南方考生的大学表现会较差,北方考生的大学表现会较好,会有不同的预测结果,但实际上,南方和北方考生群体具有相同的能力和熟练水平,他们在大学中会有相同的学业表现,由此可以说明该试题不公平,具有偏见。同样,学业评估考试对白人和黑人考生是否公平,需要考查该考试在预测白人和黑人考生的大学表现上是否同样有效。

       ㈡考试实施

在考试实施过程中,平等对待所有应试人员,是考试公平性的必要条件。首先,要求所有应试人员能够享受到合乎规范的测试条件,在标准化考试中,一般能够保证测试条件符合要求。其次,应试人员最好也能有均等机会准备考试,应试人员应有同等渠道和机会获得考试开发人或考试实施部门提供的有关考试的目的、内容、要求等方面的材料,当然不包括考试保密的内容,如果有些人事先知道了考试保密的内容,对另外的人来说就有失公平。最后,在分数报告中,应做到内容准确并解释严谨,特别是在向非专业人员报告时,要使用准确、恰当的语言,尽可能减少误解。

研究表明,考试作弊是普遍存在的,早自幼儿园开始,到学校教育阶段,一直持续到职业生涯。几乎每一个人,不仅是大、中、小学生,甚至教师、学校管理人员、律师、飞行员、建筑师等专业人员也都参与过作弊[9]。从我国古代的科举考试到20世纪末美国纽约州的学生评估考试,作弊现象时有发生[10][11][12][13][14]。考试和作弊就像孪生兄弟,考试一旦开发实施,作弊也随之产生。

在考试实施中,减少作弊现象,提高公平性,既是公众关注的焦点,也是考试实施部门的首要任务。

考试实施主要涉及两类人员:考试工作人员和应试人员。考试工作人员是指在整个考试实施过程中参与工作的人员,一部分工作人员知道试题或答案,这些试题或答案在一段时间内是保密的,他们负有保密的责任,还有一部分工作人员对应试人员的行为进行监督,他们负有监督的责任。应试人员是参加考试的人员,他们希望通过考试,在应试人员作答试题时,其行为应在考试工作人员的监督之下。在考试实施中,为了减少作弊,提高公平性,考试工作人员和应试人员的行为都应该规范,而且受到监督。

在考试实施中,如果考试工作人员的行为没有规范和监督,作弊行为就可能发生。考试工作人员作弊是一种腐败行为,他通过出卖或滥用考试实施中所赋予的特权,从应试人员那里直接或间接地获得某种利益或方便,获得的利益或方便越多,作弊的可能性越大。

在整个考试实施过程中,为了防止考试工作人员作弊,应制定相应的规范以确保其行为适当,如果考试工作人员行为失当,一旦被发现,就应受到惩处。该规范应能有效地调节考试工作人员的行为。某一规范的有效性可以通过处罚来体现,考试工作人员在考试实施中作弊,一旦被发现,如果他所受到的处罚越大,其作弊的可能性越小,反之亦然。

在考试实施中,仅仅制定规范是远远不够的,还必须通过各种管理程序和技术措施,将考试工作人员的作弊行为探查出来。在传统考试实施中,限于保密的要求,用于探查考试工作人员作弊行为的管理程序和技术措施十分有限,考试工作人员的很多行为难以置于监督之下,为考试工作人员的作弊留下自由空间。

随着信息技术的广泛应用,考试实施中的信息实现了数字化,与传统的纸质信息相比,数字信息易于复制和备份,相关部门甚至公众都可以掌握,考试工作人员的行为更容易置于相关部门和公众的监督之下,更容易保持考试实施的公开和透明,因此也更容易预防考试工作人员的作弊。

只有当某一考试信息化项目能够提高对考试工作人员行为的规范,才能提高考试的公平性,该项目才有可能获得成功。

应试人员作弊的原因多种多样,归纳起来都是为了获得好的分数[15],应试人员通过作弊获得高分越容易,其作弊的可能性越大。

在考试实施中,影响应试人员作弊的因素主要有两个:一是考试对应试人员的重要性,如果某一考试对应试人员不太重要,其作弊的动机小,作弊的可能较小,随着考试的重要性增大,作弊的可能性也随之增大;二是应试人员在知识、技能、能力、态度或其他考试所测量的构念上真实与期望水平之间的差距,如果这个差距很小,应试人员很容易通过个人努力弥补这个差距,差距越大,弥补的困难越大,作弊的可能性也随之增大。

与规范考试工作人员行为一样,为了防止应试人员作弊,应制定相应的规范以确保其行为适当,如果应试人员行为失当,一旦被发现,就应受到惩处。某一规范的有效性可以通过处罚来体现,应试人员在考试实施中作弊,一旦被发现,如果他所得到的处罚越大,其作弊的可能性越小,反之亦然。

在考试实施中,与应对考试工作人员的作弊行为一样,要应对应试人员的作弊行为,仅仅制定规范是远远不够的,还必须通过各种管理程序和技术措施,将应试人员的作弊行为探查出来。在传统考试实施中,应试人员的作弊手段各种各样,用于探查其作弊行为的管理程序和技术措施也很完善,即便如此,应试人员的很多作弊行为仍然难于探查。随着信息技术的发展,应试人员将日益先进的信息技术用于作弊,使作弊行为更为隐蔽、迅速,给作弊的探查带来严重挑战,严重威胁着考试实施的公平性。

随着信息技术在考试实施中的广泛应用,考试实施中的信息实现了数字化,无论是应对传统的还是新的作弊行为,与传统的纸质信息相比,数字信息易于复制和交流,应试人员的行为更容易置于相关部门和公众的监督之下,更容易保持考试实施的公开和透明,因此也更容易预防应试人员的作弊。

例如,在大规模考试实施中,涉及多个层次的实施部门,这些部门往往参与多个考试的实施。为了应对应试人员的作弊,不同层次的实施部门之间以及同一层次的不同部门之间,需要交流实施信息。传统的纸质信息不容易复制,难以进行交流,数字信息可以直接进行交流、复制。如果某一考试实施部门A管辖的范围是地域A,考试实施部门B管辖的范围是地域B,在某一考试实施中,有一应试人员在地域A作弊并被发现记录,处以3年内不得参加任何考试的处罚,但该应试人员为了参加某一重要的考试,为躲避处罚,该应试人员到地域B报名参加考试,如果考试实施中的信息是传统的纸质信息,在考试实施部门A与B之间就不容易进行信息交流,该应试人员很容易通过报名,对其处罚也就难以执行。如果考试实施中的信息是数字信息,在考试实施部门A与B之间则可以很容易进行交流,该应试人员在考试实施部门B报名时就很容易被发现,其报名就不会被通过,这样其所得到的处罚就能落到实处。

在考试实施中,随着信息化的推进,纸质信息转换为数字信息,考试实施各部门之间的信息交流能够方便进行,应试人员的作弊现象有望逐步减少。只有当某一考试信息化项目能够提高对应试人员行为的规范,才能提高考试的公平性,该项目才有可能获得成功。

二、效率

在考试领域推行信息化,还应以提高考试的效率为原则。效率是指用相对较低的投入生产出较高质量或较大数量的产出。在大规模考试中,要评估考试的效率比较困难,因为考试的投入和产出都难以测量。然而,当某一信息化项目在考试领域推行后,可以评估出推行前后考试过程中误差、质量、数量水平,通过两种水平的对比分析,再结合信息化项目的投入,可以对考试的效率做出评估。

从心理测量学上,任何一个考试都包含一定水平的测量误差,每一应试人员的考试分数都是其真分数与误差的一个组合。例如,某一应试人员在某一考试上得80分,在一定的概率水平下,如果测量误差是5分,该应试人员的真实水平应理解为80±5分,即其真实水平应在75~85分之间;如果测量误差是10分,该应试人员的真实水平应理解为80±10分,即其真实水平应在70~90分之间。测量误差的大小决定着对真实水平估计区间的大小,也直接决定测量的精确性。测量的精确性是考试质量的一个重要指标,也是评估考试效率第一个重要方面。要评估考试的质量和效率,可以从考试的误差控制水平着手。

考试包括试卷命制与考试实施两个部分,考试信息化对考试效率的影响也可以从这两个方面来考察。

试卷命制

试卷命制的效率可以通过试卷命制的质量和成本进行评估。试卷命制的信息化要遵循效率原则,或者提高试卷命制的质量,或者降低试卷命制的成本,或者既提高试卷命制的质量又降低了成本。

试卷命制的质量可以通过试卷信度和效度进行评估。试卷信度反映了对测量误差的控制程度。从试卷命制上,造成测量误差的原因很多。题目内容的科学性和准确性,题目难度对应试人员水平的适合程度,题目类型(主观题或客观题)对考核内容的适合程度,题目赋分与题目难度的适合程度,甚至题目的指导语、题目在试卷中的排列顺序等等,都可能导致测量误差的产生。试卷效度可以从多种渠道进行考察,如果试卷考核的内容定位不准,没有测量出所要测量的构念,或者没有适合的测量形式测量所要测量的构念,这些都会导致考试的效度降低。

无论是控制测量误差,提高试卷信度,还是界定和测量所要测量的构念,提高试卷效度,都可以通过试卷命制的信息化得到不同程度的改善。一方面,随着考试实施的信息化,获得大量考试实施信息,通过对这些信息的定量分析,可以判定测量误差的来源和大小,进而有针对性地提出改进措施和控制办法,提高试卷的信度和效度。另一方面,随着计算机软硬件性能的提高,将信息技术试卷命制和测试过程,开发出新的考试形式,甚至新的考试题型,测量出传统考试形式和题型无法测量的构念,大幅提高了考试的信度和效度。

试卷命制的成本需要考察试卷命制中的实际投入。在试卷命制中,需要综合考虑信息化对试卷命制的质量和成本带来的影响,进而对试卷命制的效率作出判断,试卷命制的信息化应以提高试卷命制的效率为原则。

考试实施

考试实施的效率也可以通过考试实施的质量和成本进行评估。考试实施的信息化要遵循效率原则,或者提高考试实施的质量,或者降低考试实施的成本,或者既提高了考试实施的质量又降低了成本。

作为考试服务的两个部分,试卷命制与考试实施相互联系而又相互依赖。一方面,考试命题生产出试题、试卷和题库,提供给考试实施,另一方面,考试实施产生了大量的信息,特别是应试人员对试题的作答信息,随着光标阅读器和信息技术在信息采集、传输、储存等方面的广泛应用,这些信息可以采集起来,进行分析,分析结果反馈给考试命题,用于题目的命制、修改,甚至命题计划的更改、细化等,这些都有助于提高试题、试卷和题库的质量。因此,考试命题与实施之间需要进行信息交流。

在大规模考试实施内部,往往涉及多个层次的实施部门,这些部门之间需要进行充分、有效的信息交流,才能协调一致,共同完成某一大规模考试的实施。同时,随着信息技术的广泛应用,无论是对应试人员个人信息还是答题信息,信息采集的准确性都明显提高,大幅减少了考试实施过程中的误差,提高了考试的信度。更为重要的,通过对这些信息的分析,可以为相关部门的决策提供可信的依据。

信息技术对客观题和主观题的评阅影响不同。由于客观题作答结果的评阅过程不受人的主观性的影响,在多次重复评阅时能得到同样的分数,客观题的作答结果可以填涂在专用的答题卡上,由光标阅读机将作答信息读入计算机,由计算机评阅。随着计算机和光标阅读机在大规模考试实施中的广泛应用,客观题作答结果的评阅质量可以保持在一个很高的水平。

由于主观题作答结果的评阅过程受人的主观性的影响,在多次重复评阅时会得到不同的结果,容易产生评分误差。由于兴趣、爱好、价值观等个人特征上存在差异,对同一主观题,不同评分者评阅的结果不同,有的分数普遍较高,有的普遍较低,有的分数分散,有的分数集中,在评分之前,应根据评分者的评分倾向,对评分者进行筛选,以排除极端者。评分者经过筛选后,为提高评分者对评分标准理解的一致性,应对评分标准进行说明和细化,使大家能够取得理解上的共识,之后每个评分者还应进行试评,然后对评分标准进行再次讨论和细化,进一步提高评分者对评分标准理解的一致性。

由于受到情绪、心情、疲劳等心理或生理因素的影响,评分者在评分过程中对评分标准的把握和应用会出现波动。这种波动应受到监督,并被控制在合理的范围之内,如果波动超过预定范围,应告知评分者重新评阅,如果多次超过,应停止该评分者的评分,查找原因,采取相应对策。

为了将评分误差控制在可接受水平,需要制定相应的管理程序和技术措施。在筛选评分者时可以用到心理量表和统计技术,随着信息技术在评分过程中的应用,主观题的作答结果可以扫描入计算机,存储于高容量的服务器中,通过网络分发给评分者进行评阅,评分者的评阅结果自动记录,评阅行为受到监控。在评分过程中,使用的技术越多,评分误差越小。

随着信息技术在考试实施中的应用,为应试人员提供了方便,为考试相关部门的决策提供了依据,有效地控制了评分误差,提高了题目评阅的质量。总之,考试实施的质量能够大幅提高。

考试实施的成本需要考察考试实施中的实际投入。在考试实施中,需要综合考虑信息化对考试实施的质量和成本带来的影响,进而对考试实施的效率作出判断,考试实施的信息化应以提高考试实施的效率为原则。

三、可行性

信息化的推进需要多种条件,只有具备了这些条件,信息化项目才有可能成功,信息化才有可能顺利推进,因此,在信息化的推进过程中,要考虑这些条件是否具备,要以可行性为原则。在考试信息化的推进过程中,也应考虑所需要的各种条件,一旦考虑失当,有可能导致信息化项目的失败。在考试领域推行信息化,应考查政治、管理、技术三个方面的可行性。

㈠政治方面

人们认为,信息技术,特别是互联网,能够帮助弱势群体,提高公共服务的质量,改善公众与政府的关系,加强非政府组织的作用等。但是大量的研究表明[16][17][18][19][20],在信息时代,信息资源更倾向于向社会强势群体集中,难以为弱势群体所利用,使富者更富,贫者更贫,由此产生了数字鸿沟,这种鸿沟不仅存在于社会内部,而且存在于国家之间。包括世界银行和联合国秘书长安南在内的国际组织和政治名人强烈呼吁各国政府、非政府组织、企业采取有效措施填平数字鸿沟,减少信息贫困,降低信息富有者和贫乏者之间日益增长的不平等性[21]

面对来势凶猛的信息化革命,面对日益加宽的数字鸿沟,在考试领域,我们是消极应对还是积极追赶?这是关乎一个国家的考试发展甚至存亡的重大课题。每一位考试工作人员都应顺应历史潮流,知难而上,承担起历史赋予我们的责任,积极推进考试的信息化建设,使古老的考试在信息时代焕发出新的生机和活力,在信息社会中发挥其应有的作用。

在政治上,要充分认识考试信息化的长期性和曲折性。

从1946年世界上第一台数字计算机问世至今,信息技术的发展突飞猛进,这期间先后出现了微型计算机、互联网、第三代无线通信、全光通信、量子计算等技术和应用[22][23],但直到现在,还看不到信息技术进步的尽头。只要技术脚步不停,信息化就要继续。工业化用了约两百年,信息化也应该具有长期性,不可能毕其功于一役,也不可能由一代人完成。在考试领域推行信息化,不可能单独进行,考试与社会其他领域密切相关,考试的对象是社会成员,整个社会成员的信息化意识和水平直接决定着考试信息化的水平,也将决定考试信息化是长期的。

在我国推进信息化的过程中,不少重大工程一波三折,以至当初的目标没能完全实现,组织机构反反复复不断调整,投入巨资后推倒重来的项目不在少数,信息化的道路十分曲折。考试信息化也是一样,在整个考试信息化历程中,虽然我们一直在前进,信息技术的应用不断深入,信息化水平不断提高,但是这种进步不是一帆风顺的,有些项目的投入完全交了“学费”,没有任何结果,有效项目虽然也出了结果,但不能令人满意。信息化仿佛是在走迷宫,大目标明确,但路径并不清楚,没有可以遵循的固定模式。人们提出各种各样的建议,试图改变这种局面,但似乎成效不大。回顾工业化的历史,可以推断信息化的曲折推进是信息社会初期的必然现象,在这一历史阶段,信息化只能沿着曲折迂回的道路前进,失败和挫折难以避免。

从信息技术的应用对象来看,可粗分为简单的和复杂的应用。简单的应用是将信息技术应用于单一设备或过程,可变因素较少;复杂的应用是将信息技术应用于一个组织、一个组织群、甚至多个组织群,可变因素较多。简单的应用有可能依靠引进解决,但复杂的应用是买不来的。与发达国家相比,不论是企业、政府,还是各类非政府组织,各种组织在结构、功能、业务过程、价值观念、文化氛围、外部环境等方面差别巨大,难以靠简单引进实现组织或组织群的信息化,这一点已为多年来许多信息化项目和管理信息系统的失败反复验证。因此,组织或组织群的信息化是买不来的,它是一个循环往复、永无止境的知识积累、运用、创造的过程,是一个具有本组织特色的观念创新、业务创新、管理创新的过程。在考试领域,特别是大规模考试实施领域,往往涉及多个组织甚至多个组织群在多个不同地域分工协作,共同完成,因此,在考试领域推行信息化必须立足于行业本身,通过不断的积累和创新,逐步实现信息化。

在信息技术应用于组织和组织群的过程中,不可避免地导致组织的结构层次、部门功能、业务流程、角色分配、岗位职责等的变动,这种变动往往涉及权力、利益、观念、价值观、工作方式等的调整。这是一种组织重构,是传统社会向信息社会演进过程中必然发生的现象,重构会在组织内、组织间、甚至社会各阶层中发生,处在不利地位的群体倾向于抵制信息化带来的重构。在考试领域,由重构带来的抵制必须引起高度的重视,必须妥善解决,否则会影响社会的安定。在我国目前的体制中,组织中强势领导人的积极干预,往往是克服重构抵制的唯一有效方法。因此,信息化是一把手项目,这是信息化推进过程参与各方的共同感受。经验表明,成功的信息化项目大多为一把手项目,但一把手并不能保证信息化项目能够成功,一把手负责信息化项目只是该项目成功的一个必要条件,不成功的信息化项目中相当一批也是一把手项目。对重点系统,不论是一个行业、一个企业、一级政府,没有得力的一把手,成功的可能性极小。及时发现、培养和重用信息化人才,将他们放在一把手的位置上,非常有利于信息化的推进。

㈡管理方面

在考试信息化的推进过程中,从管理角度,应着重考虑信息化的理论、人才、资金等方面的可行性。

信息化的关键不在技术,也不在业务,而在重构。这里既需要对传统组织结构、业务流程、岗位职责等方面的详尽了解和分析,还需要依据信息技术的发展水平和趋势,结合实际情况建立切实可行的信息化的理论和模型,更需要进行平稳、可控地重构。如果没有科学的信息化理论,没有适合的信息化模型,平稳、可控的重构就无从谈起。

在我国信息化发展的历程中,我们惯于提出“四个现代化哪一个也离不开信息化”之类的原则和要求,形成了大量基于推理演绎、未经试验或调查验证的观点和说法,由此构成的信息化理论演绎色彩浓重,实证成分不足,无法建立信息化模型,难以指导信息化实践。信息化理论贫乏是我们推行信息化时必须面对的现实。

由于无法引进,信息化理论的来源主要有两种途径:总结实践经验和开展学术研究。在社会生活中,每天都会有各式各样的信息技术应用案例,人们会在自己的工作和生活中逐渐积累起信息化的经验,将这些案例和经验用科学的方法加以计量、归类、分析、提炼,就能上升为理论,这种理论来源于实践,具有很强的适用性。另一方面,科学家还可以通过观察、试验、抽样、普查等手段获得相关数据,通过对数据进行定量分析与归纳,也能形成相关的信息化理论。

理论形成的过程就是研究探索的过程,只有通过扎实的研究,提出科学的信息化理论,制定切实可行的信息化政策,才能在信息化推进过程中实现跨跃式发展,因此在信息化推进过程中应实行科研先行。正规的科研应有足够的经费支持,有自由的学术氛围。我国的信息化是在全球化的大背景下进行的,要以跨越为目标,必须进行国际合作,包括学术交流、多边合作等内容。国际合作的目的,不仅仅在于学习先进的知识和经验,更在于掌握全球信息化动态和发展趋势,并以此制定我们的对策。

信息化的推进依赖于信息化人才,尤其是高级人才。信息化高级人才包括两类:一类是有能力驾驭一个较大社会系统(比如一个城市、一个大企业、一个大行业)信息化过程,有较强沟通、协调、决策能力的领导者;另一类是在信息化理论方面有重要贡献,为学术界公认的学术专家。前者的价值在于他们有可以信赖的经验,后者的价值在于他们站在信息化理论研究的最前沿,提出的政策建议有不容质疑的权威性。

我国当前的信息化专家,大多都是信息技术领域的技术专家,对信息技术的应用了解不全,对信息化的核心问题认识不清,他们的知识结构和研究领域与信息化要解决的问题不一致,他们对国内外信息化情况和国际信息化理论前沿状况的了解不完整、不深入,关于信息化的认识和看法主要是经验型的,这种情况导致专家建议缺乏可信性和可行性。近年来关系国计民生的一些重大预测性分析失准,究其原因,所倚重专家对信息化核心问题缺乏了解是一个重要原因。

为了保证信息化的顺利推进,应加强对信息化人才,尤其是高级人才的选拔和培养,从我国信息化人才的现状出发,在总结经验的基础上,根据知识结构和经历特征,制定经验型信息化高级人才的选拔标准,将有潜力的人才选拔出来,进行重点培养。为他们提供宽松的科研环境、真实的实践场所、充足的学术交流机会,通过自身的不懈努力,成为真正的信息化领域的专家,这样才能为信息化的推进提供人才保证。

信息化资金是信息化顺利推进的经济保证,由于信息化的长期性和曲折性,信息化所需资金数额巨大,并且需要持续不断地投入。金税工程国家累计拨款已超过15亿元人民币[24],仍无法真正实现“税控”,还需要继续投入。仅最近5年,国家在信息技术应用方面的投入约为500亿元[25]。即便如此,与发达国家相比,我国在信息化方面的投入仍明显不足。发达国家是在完成工业化的前提下搞信息化,资金实力雄厚。我国是在尚未完成工业化情况下搞信息化,底子不厚,关系国计民生补课性的重大项目很多。因此,在相当长的一段时间内,我国只能在投入力度不太大的状况下推进信息化。

在考试领域推行信息化,也需要持续不断的资金投入,受制于我国当前的经济和社会发展水平,我们也不可能有太大的投入。与其他领域相比,考试领域的信息化资金更多地需要考试系统自身不断的积累,国家难以大量的投入。由于意识、机制、管理等方面的原因,考试信息化资金的投入具有一定的随意性,既不充分也不稳定。

㈢技术方面

考试信息化是信息技术在考试领域的应用,是以信息技术为基础进行的,要推动考试信息化顺利、平稳地进行,既要重视考试对信息技术的依赖性,又要重视信息技术对考试的适应性。

信息化的发展水平还取决于信息技术的发展水平。随着信息技术的突飞猛进,必将推动社会各领域信息化水平的不断发展和深入,由此带动考试领域的信息化,促进考试对信息技术的依赖。在考试信息化不断深入的今天,试卷命制和考试实施质量的提高越来越依赖信息技术的应用,考试服务的提供越来越依赖新技术的创新和发明。在信息社会,要充分认识考试对信息技术的依赖性,主动了解信息技术的发展水平,利用相关信息技术,克服考试弊端,改进考试质量,提高考试效率。

在考试信息化的推进过程中,应选择适合的信息技术,注意信息技术对考试的适应性。由于大规模考试的高利害性和考试实施的复杂性,考试信息化是逐步发展的,在考试信息化发展的某个阶段,信息化的水平还取决于考试的规范化水平。在信息化发展的初期,由于信息技术和考试规范化的发展水平都比较低,只能对一些相对简单、易于规范的重复操作和过程进行信息化,还未形成系统;随着信息技术水平的提高,考试规范化水平也在发展,由于涉及对传统考试结构、关系、过程等的调整,发展水平明显滞后,在其他领域得到成功应用的信息技术,在考试领域未必也能够获得成功应用,到了现阶段,信息技术的发展已经到了相当高的水平,制约考试信息化水平的是考试规范化。因此,应选择与考试规范化水平相一致的信息技术。

 

 

参考文献

[1]吕思勉:考试论,考试研究,2002(2):134-142。

[2]杨学为:考试的起源,考试研究,2003(1):88-94。

[3]刘海峰:科举制----具有世界影响的考试制度,中国考试,2005(1上):13-16。

[4]杨学为:高考四十年,中国考试,1998(3):2-5。

[5]杨学为:恢复高考二十年----兼论高考与社会、经济的关系,中国考试,1998(4):4-7。

[6]郭厚登:回忆邓小平同志有关高考的重要讲话,中国考试,2004(1上):42-43。

[7]Cole,  N.S., & Zieky, M.J., 2001, The New Faces of Fairness, Journal of Eduactiaonl  Measurement, 38(4): 369-382.

[8]谢小庆、王洋:关于考试公平性的一些思考,考试研究,2002(2):1-7。

[9]Cizek,  G.J., 1999, Cheating on tests: How to do it, detect it, and prevent it. Mahwah,  NJ: Erlbaum.

[10]Cizek,  G.J., 1991, Reasoning about Testing, The Eduation Digest,  56(5):56-58.

[11]Cizek,  G.J., 2001, Cheating to the Test, http://www.educationnext.org/  2001sp/40.html.

[12]Cizek,  G.J., 2003, When Teachers Cheat, The Education Digest, 68(6):  28-31.

[13]Hoff,  D.J., 2003, New York teachers caught cheating on state tests. Education Week,  23(10): November 5.

[14]Nichols,  S.L., & Berliner, D.C., 2005, The Inevitable Corruption of Indicators and  Educators through High-Stakes Testing,  http://www.asu.edu/educ/epsl/EPRU/documents/EPSL-0503-101-EPRU.pdf.

[15]同[9]。

[16]Davis,  R., & Owen, D., 1998, New Media and American Politics. New York: Oxford  University Press.

[17]Davis,  R., 1999, The Web of Politics. New York: Oxford University  Press.

[18]Bimber,  B., 1999, The Internet and Political Transformation: Populism, Community and  Accelerated Pluralism. Polity, XXXI(1): 133-160.

[19]Norris,  P., 1999, The Emergent Internet Age in Europe: A New North-South Divide? The  Harvard International Journel of Press-Politics, 5(1).

[20]Norris,  P., 2000, The worldwide Digital Divide: Information Poverty, the Internet and  Development, http://ksghome.harvard.edu/~.  pnorris.shorenstein.ksg/acrobat/psa2000dig.pdf.

[21]Annan,  K., 2002, Perspective: Kofi Annan’s IT challenge to Silicon Valley.  http://news.com.com/2010-1071-978578.html?tag=nl.

[22]Griffiths,  R.T., 2002, History of Internet, Internet for Historians.  http://www.let.leidenuniv.nl/history/ivh/frame_theorie.html.

[23]Gromov,  G.R., 2005, History of Internet and WWW: The Roads and Crossroads of Internet’s  History. http://web.bilkent.edu.tr/History/ valley/.

[24]吴观、鲁钰峰,“金税”工程建设概况,http://www.cia.org.cn/h/h26.htm。

[25]张琪,软件产业发展要服务于国家现代化建设,http://www.cena.com.cn/ htm/Article_detail.asp?id=12635。

《考试研究》2006年第2期,第47-61页