最新抽样调查整群抽样专业知识讲座.ppt
上传人:你的****书屋 上传时间:2024-09-12 格式:PPT 页数:81 大小:1.8MB 金币:9 举报 版权申诉
预览加载中,请您耐心等待几秒...

最新抽样调查整群抽样专业知识讲座.ppt

最新抽样调查整群抽样专业知识讲座.ppt

预览

免费试读已结束,剩余 71 页请下载文档后查看

9 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

群划分的一般原则为了提高精度,划分群时应力争使同一群内各单元之间的差异尽可能大,以避免同一群内各单元提供重复信息.这个原则与分层抽样中划分层的原则恰好相反.由此看来,整群抽样和分层抽样是针对不同总体结构而提出的两种不同抽样方法.三、群的规模四、附号说明总体中第i群的群总值:总体中的个体均值:总体群间方差:总体中第i个群群内方差:群规模相等时整群抽样样本群内方差:§4.2等概率整群抽样一、群规模相等时的估计定理4.1是的无偏估计,即证明:因为的样本估计为:总体总值【例4.11】在一次对某中学在校生零花钱的调查中,以宿舍作为群进行整群抽样,每个宿舍都有M=6名学生。用简单随机抽样在全部N=315间宿舍中抽取n=8间宿舍。全部48个学生上周每人的零花钱及相关计算数据如下表。试估计该学校学生平均每周的零花钱,并给出其95%置信区间。解:已知故下面计算估计量方差的估计值:2、整群抽样效率分析群规模相等时的整群抽样总体方差分析表我们将整群抽样与简单随机抽样的效率进行比较,假设直接从总体中抽取一个样本容量为nM的简单随机样本,则样本均值的方差为:根据组合及平均值的计算,又可表示为:事实上,前面提到的可以用群内相关系数近似表示:若采用简单随机抽样,直接从总体中抽取整群抽样估计效应与群内相关系数关系密切,若群内方差大于总体方差时,ρ的取值为负,另外,群内相关系数也可以用群内方差和群间方差表示,并由样本统计量估计:【例4.2】估计例4.1中以宿舍为群的群内相关系数与设计效应.由相关系数的估计式有采用整群抽样,如果各群规模因为群规模不等,估计时又未考虑权数,所以2、等概抽样,加权估计如果总体群平均规模未知,可以用样本群它的无偏估计为:3、等概抽样,比率估计根据比率估计量的方差公式,估计量的样本估计为:4、例题和方法比较样本乡编号(1)无偏估计(等概抽样,简单估计)(2)无偏估计(等概抽样,加权估计)(3)以群规模为辅助变量的比率估计(4)种植面积为辅助变量的比率估计【补充】总体比例的估计为样本中第i群具有某特征单元数的比例;二、群规模不等的估计的估计式为:【例6.5】某居民小区有415个居民小组,现采用整群等概抽样,随机抽取25个小组为样本,调查中的一项内容为估计男、女性别比例,下表资料为样本中女性的分布。试用95%的置信度估计该小区女性比例的致信区间,并用简单随机抽样方法进行比较。群(i)解:这是群规模不等的比例估计总体比例的估计为:故置信区间为:于是可以计算设计效应§4.3等概率两阶段抽样多阶段抽样的优点二、抽样方法与推断原理多阶段抽样时,每一个阶段的抽样可以相同,也可以不同。它通常与分层抽样、整群抽样、系统抽样结合使用。多阶段抽样时,抽样是分步进行的,因此,讨论估计量的均值及其方差时,需要分阶段进行,这要用到下面的性质。对于两阶段抽样,有上述性质可以推广到多阶段抽样的情形,例如对于三阶段抽样,有三、等概率两阶段抽样的符号说明第一阶段和第二阶段的抽样比:初级单元内的方差:四、初级单元大小相等的二阶抽样编号表中红字为抽中的房号.在这里,初级单元(楼盘)有15个,每个初级单元拥有二级单元(居民户)12个。首先将初级单元从1到15编号,在15初级单元中随机抽取5个单元,分别是1,6,9,12,13号;然后在被抽中的初级单元中,进行第二次抽样,即分别在抽取的5个楼盘中随机抽取4户。这就是初级单元规模相等的两阶段抽样。规模相等两阶段抽样的估计量及其性质总体均值估计量方差为:【例4.4】欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个有板有5家样本企业的简单随机样本,调查人员对5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水帐。调查的结果如下。解将企业作为初级单元,将每一天看着二级单元。调查月内拥有30天(即拥有30个二级单元)。样本企业置信度为95%的置信区间为:160800±1.96×9216在上面的方差估计式中,第一项是主要的,第二项要小得多!五、初级单元规模不等的二阶抽样第一阶和第二阶的抽样比:按二级单元的平均值:对初级单元进行简单随机抽样的一个无偏估计为:3.比率估计量由于初级单元的大小不同,往往造成初级单元的观测值差异很大,使得估计量方差的第一项很大,从而估计量的方差也就变得很大。这时,可以考虑将初级单元的大小作为辅助变量,采用比率估计量对总体总和进行估计。这是一个有偏估计量,但随着样本量的增加,其偏倚将趋于零。其近似均方误差为:的样本估计为:§4.4等概率两阶段抽样设计二、在设计两阶段样本时,要注意的几个原则(1)估计的精度的要求一般由委托方给出;(2)初级单元(PSU)通常是自然单位;(3)影响估计精度的主要因素是初级单元