如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
第六章参数估计基础总体:研究对象(某项变量值)的全体。样本:总体中随机抽取的一部分研究对象。统计量:从样本计算出来的统计指标。参数:描述总体的统计指标。统计描述:计量(集中水平、变异大小)、计数(相对数)统计推断:用样本信息推论总体特征的过程。参数估计:用样本的统计指标(统计量),对总体统计指标(参数)进行估计假设检验:又称显著性检验,是指通过样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。第一节抽样分布与抽样误差一、样本均数的抽样分布与抽样误差将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图。样本均数的抽样分布具有以下特点抽样误差(SampleError,SE)数理统计可以证明:的总体均数为;而的标准差比原个体值的标准差要小,为区别两者,的标准差用表示样本统计量的标准差称标准误(standarderror,SE)样本均数的标准差称均数的标准误(standarderrorofmean,SEM),反映样本均数的抽样误差抽样误差偏态分布总体中抽样偏态分布总体中抽样偏态分布总体中抽样偏态分布总体中抽样偏态分布总体中抽样偏态分布总体中抽样例子二、样本率的抽样分布与抽样误差将这100个率整理成频数表,如下样本率的抽样误差例子标准差与标准误联系与区别第二节t分布一、t分布的概念t分布二、t分布的图形与特征二、t分布的图形与特征1.特征:t界值表:详见附表,可反映t分布曲线下的面积。单侧面积或单尾面积:用表示;双侧面积或双尾面积:用表示。-t举例:2.t分布曲线下面积用相应样本统计量直接作为其总体参数的估计值可信区间:也称为置信区间(confidenceinterval,CI)按预先给定的概率(1)所确定的包含未知总体参数的一个范围。一般=0.05,为95%的可信区间或置信区间需考虑:(1)总体标准差是否已知(2)样本含量n的大小通常有两类方法:(1)正态近似法(2)t分布法(1)已知时:按Z分布(标准正态分布)(2)未知:按t分布例:已知某地27名健康成年男子的血红蛋白量均数=125g/L,标准差S=15g/L。试问该市地健康正常成年男子血红蛋白血清胆固醇平均含量的95%置信区间和99%置信区间各是多少?95%CI:1252.056=(119.06,130.94)g/L99%CI:1252.779=(116.98,133.02)g/L该市健康成年男子血红蛋白平均含量:95%置信区间为(119.06,130.94)g/L,99%置信区间为(116.98,133.02)g/L。(3)未知但n较大:按Z分布1.96=172.21.96=(171.3,173.1)该市2000年19岁健康男大学生平均身高的95%置信区间为(171.3,173.1)cm。二、总体率的可信区间例子正态近似法例用某种仪器检查已确诊的乳腺癌患者120名,检出乳腺癌患者94例,检出率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。pZ/2Sp=pu0.05/2=0.7831.96=0.709~0.857即该仪器乳腺癌总体检出率的95%可信区间为(70.9%,85.7%)。总体均数可信区间与参考值范围的区别谢谢