如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
万方数据三参数模式:p(口)=c+(1一c’r忑‰单参数模式:p∽2石j莉双参数模式:烈叨2i孑瓦两项目反应理论在试题库系统中的应用L(■,X:,墨,...,以Ip)=兀e(口)。O』(口)1。~薛宝山兮InL(Xl,x2,x”.,x。Io)=∑[xjln弓(p)+(1一xyinQj(p)】电脑2010年第1期福建(山东胜利职业学院山东东营257097)【摘要】:本文针对传统试题库系统的不足,引入了项目反应理论,分析了项目反应理论在试题库系统中的应用,并介绍了试题库系统整体架构的设计。【关键词】:项目反应理论;试题库;考试系统;计算机辅助教学试题库系统是进行计算机辅助教学的一种重要的工具.在远程教育、高等学校、教育培训等诸多方面有着广泛的应用。试题库是严格遵循教育测量理论.在计苒机系统中实现的某个学科题目的集合.是在精确的数学模型基础上建立起来的教育测量工具.是计算机科学和教育测量理论相结合的产物。近年来.随着教育测量理论的发展.基于项目反应理论的试题库系统逐渐得到了越来越广泛的的应用。这种系统可以根据测试者的实际情况.从题库中选出难度水平适合他们的试题,从而可以解决测量精确度和能力跨度不能兼顾的问题。2、试题库中的参数设计在试题库中应用项目反映理论时.需要对每个题目进行分析与设计.考察一个各道题日的设计是否合理和选用是~否得当,主要包括难度、区分度、效度和信度等几个参数。难度是指试题的难易程度.它是衡量试题质量的一个重要一般用以下公式计算:P=R/N(P代表试题的难度系数,R代表试题的答对人数,N代表考生人数)。区分度是区分考生能力水平高低的重要指标。试题区分度高.可以有效拉开不同水平应试者分数的距离,使水平高的考生得高分.水平低的考生得低分,而区分度低则反映不出不同考生的水平差异。区分度可用以下公式计算:D=(H—L)/N(D代表区分度系数.H代表水平高考生答对题的人数。L代表水平低考生答对题的人数,N代表二者人数之和)。信度是指测试所测得的结果的一致性或稳定性.稳定性越大.一致的程度越高.就意味着测评结果越可靠。一般来说,测试要求的信度应该在O.7以上。信度可以用再测信度、复本信度和内部一致信度三种方法来进行评估。效度是指测试的有效性和正确性.即测试是否达到它所预定的测评目标。效度是一个相对概念,而不是一个绝对概念,即效度只有高低之分.而没有全部有效和全部无效之分。效度从种类上可分为卷面效度、内容效度、预测效度等。3.项目反应理论(IRT)项目反应理论(ItemTheory)是一种教育测量理论.是针对经典测量理论c'Yr的局限性提出来的一种新兴的教育测量理论。项目反应理论构建于复杂的数学模型之上,将被试者的能力水平与其在项目上的行为关联起来.并将其参数化、模型化。项目反应理论研究中的一项重要工作就是要确定项目特征曲线的形态,然后写出这条特征曲线的解析式。即项目特征函数(ItemFunction。简称ICF)。在项目反应理论模型的研究过程中.人们提出了多种理论模型,可以分为两大类:静态模型与动态模型。目前比较成熟的是静态模型.根据项目特性曲线的形状可以分为正态卵型和逻辑斯蒂型等多种.应用较广的是逻辑斯蒂克模型(109istice1)。在逻辑斯蒂克模型中,根据参数的不同,特征函数可分为三种模式:l其中,D=1.702为量表因子常数;O为受测者能力值。P(0)表示能力为0的人答对此题目的概率:a为题目的区分度,即特征曲线的斜率.它的值越大说明题目对受测者的区分程度越高;b表示题日的难度.即特征曲线在横坐标上的投影:c表示题目的猜测系数.即特征曲线的截距,c的值越大,说明不论受测者能力高低.都容易猜对本道题目。在测试过程中.题目的选取是根据考生先前的答题情况而采用某种选择策略进行的.也就是根据考生的能力进行估计。在估计考生能力参数0的方法中.应用最普遍的是最大似然估计法。在项目参数已知的情况下.能力参数0的最大似然估计是通过被测试者的似然函数区的最大值来求0的估计方法:ln(眈)=max(In口)其中L表示概率,e为能力估计值,xj为第j题的项目反应,如果回答正确则为1,否则为0;n为估计题目的数目。然后分别对参数a、b、c。0采用Newton—Rapson法求偏导。a、b、c这三个参数的估计值在建立题库之初已经得到了,因此在用迭代法处理时,先把a、b、c的初始值当成已知,代人方程式估计能力参数0,再将0作为已知去估计项目参数。直到迭代程序完成。4.试题库系统的设计建立试题库是一个复杂的系统工程。首先要根据功能需求,确定试题的属性指标.建立题库的数学模型.接下来组织大量优秀的在该领域有特长的专家编写试题。为了保证试题的科学性和有效性.还要组织大量的被试样本,进行抽样测试,对试题参数进行校正。使试题系数更加规范。在传统的是试题