2013抽样技术.doc
上传人:sy****28 上传时间:2024-09-10 格式:DOC 页数:2 大小:31KB 金币:16 举报 版权申诉
预览加载中,请您耐心等待几秒...

2013抽样技术.doc

2013抽样技术.doc

预览

在线预览结束,喜欢就下载吧,查找使用更方便

16 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

调查作为一种系统的信息搜集(收集)活动,其应用范围十分广泛。事实证明,一方面,不论在政策制定、投资决策、科学研究、机构管理甚至司法实践都“当然”地贯穿着或多或少的调查活动。另一方面,调查也出现在许多毫不相干的学科中,如社会学,经济学,医学,农学,林学,管理学,生物学,统计学,教育学,工程学,等,对调查都有很高的依赖度。调查的重要性是获得公认的。从孙子兵法“知己知彼,百战不殆”、毛泽东“没有调查研究,就没有发言权”,到“实事求是”、“实践是检验真理的唯一标准”等至理名言,都直接或间接地肯定了调查的某种至高无上的地位。测量活动六要素:测量主体、测量客体、测量对象、测量法则、测量工具、测量结果变量(数据)按所反映的对象不同可以分为:分类型变量,顺序型变量,数值型变量根据取得测量结果的方法不同分为:测量还分为直接测量和间接测量分类型变量:用于区分单元和个体属于不同类别组别的变量。顺序型变量:能够反映单元和个体属于不同等级或顺序的变量。分类型变量和顺序型变量都属于定性变量。数值型变量:反映单元或个体之间数值差异的变量。信度:再测信度、复本信度、折半信度效度:在一定条件下进行多次测量时,所得结果平均值与真实值之间的符合程度。(内容效度,准则效度,结构效度)内容效度:指测量工具与测量内容的适合性或相符性,也就是说测量所使用的题目是否符合测量目的和要求。准则效度:对同一测量对象,使用不同的测量方式进行测量,将其中的一种方式当作参照物,其他的测量方式与参照物进行比较。结构效度:受测变量x和y如果在概念层面上是相关的,那么在经验层面上,对x的测量与对y的测量也有关。现引入另一个测量指标x2取代x1,复测以建立起来的x与y的关系,如果测量结果同使用x1时相同,则称新的测量工具具有结构效度。效度含义两重性:(1)测量手段恰恰测量了本来就要测量的特征,而不是别的特征(2)该特征被准确的测量。抽样是与调查活动联系在一起的,抽样调查是当今最重要的调查方式。概率抽样特点:(1)能够表明一个确定的样本包含那些单元(2)对每个可能的样本,都有一个确定的被抽取的概率(3)以随机原则抽取样本。估计量:是从样本的n个单元计算出的对总体特征的估计。估计量是一个随机变量。最常见的估计方法是简单线性估计。辅助变量的选择满足条件:与要估计的变量高度相关,同时其总体信息又已知,不需在本次调查中加以收集。抽样误差:由于用样本数据对总体特征进行估计所引起的代表性误差。非抽样误差:的来源比较复杂,主要有抽样框未能不重不漏的包含所有抽样单元导致的抽样框误差,调查测量不准确引致的测量误差,此外还有无回答误差,粗大误差等。置信区间与误差限:置信区间:设为标准正态分布的双侧分位数,则置信水平为1-α的近似置信区间可以写成:,其中为的标准差,需要利用样本数据进行估计。误差限可以分为:绝对误差限和相对误差限。绝对误差限和相对误差限之间的转换关系:。分层抽样又称为类型抽样或分类抽样。先按照某种规则把总体划分为不同的层,然后在层内再进行抽样,各层的抽样之间是独立进行的。优点:分层抽样不仅可以用于估计总体,同时也可以估计各层的值,当划分的各层之间差异较大,而层内的各单元差异较小时,分层抽样可以显著提高估计精度,另外,分层抽样的单元比较集中,有利于调查的实施。它是最广泛的抽样方法之一。整群抽样(集团抽样):设总体由N个单元即初级单元组成,每个初级单元又由若干个较小的次级单元或二级单元组成,首先从总体中按某种方式(不限于简单随机抽样方式)抽取n个初级单元,然后抽出其中所包含的所有次级单元,构成一个样本,这种抽样称为整群抽样。优点:样本单元比较集中,如果群是按照空间或系统进行划分的,则调查地点集中,可以减少在不同单元之间的奔波,从而节约调查费用。另一个优点是整群抽样只需要初级单元的抽样框,而并不要求全部次级单元的名单,简化了抽样框的编制。缺点:精度较差。抽样调查的具体实施步骤:(1)调查目标确定;(2)抽样框选择;(3)抽样设计;(4)问卷设计;(5)数据收集;(6)数据编码和录入;(7)审核与插补;(8)参数估计;(9)数据分析和调查结果的表述;(10)数据发布;(11)文档建立辅助变量的特点有:(1)必须是与主变量高度相关的;(2)与主变量之间的相关关系整体上相当稳定;(3)其信息质量更好,帮忙而不添乱;(4)其总体总值必须是已知的,或更易获得的。影响样本容量n的因素:总体规模N、置信度1—α、绝对误差限度d和总体方差S2不能得到有效信息的原因:1.抽样框存在缺陷2.受访者调查期间总是不在3.访员的疏失4.设计和管理上的缺陷。层数的确定:1.设总的样本量为n,要想对估计量的方差做出无偏估计,那么需要每层的样本量nh>=22.所以层数至多为n/2。