测量、测试与评价-第一文库 | 海量文档资源下载与分享平台

免费试读已结束，剩余 16 页请下载文档后查看

10 金币

下载此文档

/ 26

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

我们在工作中经常用到“测试”、“测量”、“考试”、“测验”、“评价”等术语或说法。它们之间既有联系，又有区别，不能混为一谈。1．测量什么是测量？Stevens（195）认为，“广义而言，测量（measurement）就是根据法则赋予事物数量。”也就是说，按照一定的规则给事物的属性指派数字或符号的过程就是测量。这是迄今为止公认的测量定义。举例来讲，要测量一下桌子的高度，我们可以拿尺子来量一量，看看它有多高。尺子是人们根据一定的法则制定的量具，利用它就可以把事物的属性，即桌子的高度用数字表示出来，如，0.75米。这种测量属于客观测量，因为它基本上不受观察者的主观判断的影响。由此可以看出，测量这一定义包含三个要素：①事物及其属性这是测量的对象或目标。上面提到的对桌子的高度进行测量，属于对物体进行测量，其属性——高度，是可以观察到的，可以进行客观测量的。在外语教学领域，我们感兴趣的是学生的语言能力，而学生的语言能力属于人的心理特征，是无法直接测量的，但是人的心理活动会在人的具体活动和行为中体现出来，所以只能通过测量其外显行为或外在表现特征来推论一个学生语言能力的高低。②指派数字或符号所谓指派数字或符号，就是用数字或符号来代表某一事物或事物的某一属性的量。如张三在本次阅读考试中得了87分，李四得了92分，我们说李四比张三多考了5分。数字本身没有意义，只是一种符号。我们用它来代表考生的阅读成绩，这时它就变成了量化的数，可以对其进行解释和分析。在一定的条件下，还可以对数据进行运算从而对事物的属性进行推测。③法则法则是指测量所依据的规则和方法，是测量的关键。法则不好或不可靠，得到的测量结果就会出偏差，失去测量的意义。简单来说，尺子不准，测量的结果就无法使人信服。对客观世界的物体进行测量时，由于有公认的测量法则或尺度，如测量物体的高度、重量等；一般不会出现大的偏差。而对人的某些特性（心理特征）进行测量时，则往往会出现较大的偏差。举例来讲，有几个评委对某学生的英语口语进行评定。评委A认为一个人的口语要好，必须发音准确，而该学生的发音好，所以他给打了个5分。评委B认为流利性最能体现一个人的口语水平，该同学尽管发音不错，但流利性差一些，所以她给他3分。同一名学生，让不同的评委去打分，成绩出现了偏差。这也很自然，原因是他们没有按照一个评定口语成绩的统一法则（rules）去给这名学生打分，结果造成了偏差。这个例子提醒我们，在对人的某些心理特征，如口语表达能力、阅读理解能力等等进行测量时，首先要制定一个便于操作的，稳定的法则或标准。这样得到的测量结果才可靠，才具有可比性。2．测试测试（test）又称测验。不同的心理学家对此下的定义不同。Anastasi（1982）认为，“测试实质上是对行为样本所做的客观的标准化的测量。”这个定义是人们公认的最权威的定义，它包含以下三个基本要素：①行为样本语言测试的目的是要测量受试者的语言能力。上面提到，语言能力是无形的，如何主测量？只能测量它的有形表现，这里所说的有形表现，是指语言表现，如说出来的话，写出来的句子，对测试题目所做的各种反应等等、这些行为，都是无形的语言能力的有形表现，用心理学术语叫“表征”（manifestation）。所谓行为样本，是指对语言能力表现行为的有效的抽样。我们知道，一个人的语言能力的表现行为会有各种各样的形式，测试时不可能也没有必要把它的全部表现行为都测到，只能选取一部分有代表性的抽样进行测量，然后据此对受试者的语言能力作出推测。②客观的测量所谓客观的测量是指测量的标准是否符合实际。对于一项测试的客观性程度可以从这么几个方面去评价：⑴测试题目的难易度和区分度如何；⑵测试结果的可靠性程度如何？⑶测试结果的有效性如何？这几项指标是衡量一项测试质量的重要指标。③标准化的测量标准化的测量是指在测试题目的编制、测试的实施、记分以及对分数的解释等方面有一套严密的系统的程序。只有这样，测试才有统一的标准，对不同人的测量结果才有可比性。凡是不标准化的测量，都没有可比性。3．评价Weiss（1972）认为，“评价（evaluation）是指为作出某种决策而收集资料，并对资料进行分析，作出解释的系统过程。”与测量、测试相比，评价的含义更广、综合性更强。Bachman（1990）指出，决策的正确与否，一方面取决与决策者本身的能力，另一方面则取决于收集到的信息的质量。在其它条件等同的情况下，如果收集到的信息越可靠，相关性越强，那么，作出正确决策的可能性就越大。所以说，评价的一个很重要的