如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
参数估计parameterestimation统计学总体、个体和样本统计推断的过程案例:研究2004年某地7岁男孩的身高情况。假如该地2004年的7岁男孩有10万人,则最直接的方法就是普查:调查这10万个儿童,测量他们的身高,然后进行统计分析。但是工作量非常大。我们可以通过随机抽样调查了解7岁男孩的身高情况。如调查200个儿童,测量他们的身高,通过分析这200个儿童的身高推断该地10万个7岁男孩身高情况。总体:该地2004年10万个7岁男孩身高观察值的全体个体:每个7岁男孩样本:随机抽样所得到的200个7岁男孩身高观察值样本容量:200抽样实验:通过样本信息了解总体的情况。即:通过分析200个7岁男孩身高估计10万个7岁男孩身高情况,也就是用样本均数估计总体均数。抽样误差抽样实验思考题已知总体标准误:抽样实验小结样本均数的标准误例2003年某地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,计算当地20岁应征男青年身高的标准误。标准差VS标准误样本率的标准误总体率的标准误计算公式:率的样本标准误计算公式:率的标准误的实际应用样本均值的分布2.来自于同一偏态总体的样本均数的分布Studentt-分布自由度n=n-1XtP431t分布曲线下面积参数估计(estimationofparameter):--用样本统计量估计总体参数。概念参数估计(estimationofparameter):用样本指标(统计量,statistic)估计总体指标(参数,parameter)。点估计(pointestimation)总体均数的点估计总体率的点估计即样本均数和样本率分别是总体均数和总体率的估计值。重复试验时该区间包含总体均数的概率表示为1-a或100(1-a)%常用的有99%,95%,90%相应的a为0.01,0.05,0.103.(1)100%可信区间系指该区间包含总体均数的可能性是(1)100%。总体均数的估计s未知或n较小时即t分布法:例6-3某地2002年9名7岁正常发育男孩,测得其均数为121.44cm,标准差为5.75cm,求总体均数的95%可信区间。解:2.s已知,或s未知但n足够大:例6-4随机抽得某地90名正常成年女子,计算其红细胞数的均数为4.18(1012/L),标准差为0.29(1012/L),试估计总体均数的95%的可信区间。解:影响区间宽度的因素可信区间重复试验时:(1-)的区间包含了的区间未包含95%可信区间的含义:从总体中作随机抽样,例如作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括总体均数m(估计正确),只有5个可信区间不包括总体均数m(估计不正确)。实际中,只作一次抽样,只得到一个可信区间,作为未知总体均数的可能范围的估计,理论上有95%的可能是正确的,而5%的可能发生错误。选择:设某人群的身高值X~N(155.4,5.32),现从该总体中随机抽出一个n=10的样本,算的均数为158.36cm,S=3.83cm,求得m的95%可信区间为(155.62,161.10),发现该区间未包含总体均数m=155.4cm。若随机从该总体抽取n=10的样本200个,每次都求95%可信区间,问大约有多少个可信区间不包括总体均数m=155.4cm在内?A5,B20,C10,D1,E3m95%一、总体率的可信区间正态近似法例:某病患者120人,用某药治疗,治愈90人,治愈率为75.0%,试估计95%和99%的总体率。查表法几个重要概念的区别(计量资料)标准差与标准误的区别(1)100%参考值范围与可信区间的区别含义前者指该区间包含了(1)100%的观察值后者指该区间包含总体均数的可能性是(1)100%计算(双侧为例)参考值范围可信区间可信区间与可信限的区别前者区间,后者两点。小结