如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
第三章总体均数的估计与假设检验均数的抽样误差与标准误t分布总体均数的估计t检验假设检验的注意事项正态性检验和两样本方差比较的F检验第一节均数的抽样误差与标准误了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。对无限总体不可能对所有个体逐一观察,对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究(如对一批罐头质量检查)。借助抽样研究。欲了解某地18岁男生身高值的平均水平,随机抽取该地10名男生身高值作为样本。由于个体变异与抽样的影响,抽得的样本均数不太可能等于总体均数,造成样本统计量与总体参数间的差异(表现为来自同一总体的若干样本统计量间的差异),称为抽样误差。抽样误差是不可避免的。抽样误差是有规律的。1999年某市18岁男生身高值Xi~N(μ,σ2)样本均数抽样分布具有如下特点:8中心极限定理(centrallimittheorem)中心极限定理(centrallimittheorem)样本统计量的标准差称标准误(standarderror,SE)样本均数的标准差称均数的标准误(standarderrorofmean,SEM)标准差与标准误的区别第二节t分布1908年,英国统计学家W.S.Gosset以笔名“Student”在《Biometrics》杂志上发表论文,首次提出t分布概念,后人又称Student’st-distribution,开创了小样本统计推断的新纪元,被认为是统计学发展史上的里程碑之一。WilliamSeelyGosset(1876~1937,英)t分布的概念t分布的图形与特征t分布为一簇单峰分布曲线,不同,曲线形状不同t分布以0为中心,左右对称t分布与有关,越小,t值越分散,t分布的峰部越低,而两侧尾部翘得越高当逼近,逼近,t分布逼近u分布f(t)-t所有检验统计量都是在H0成立的前提条()作散点图值,尽量写出具体P值,而不简单写成H0:1=2H1:1≠2对有限总体限于人力、财力、物力、时间样本均数围绕=167.适用于n较大(n﹥60)或0已知时两总体方差相等,即方差齐性H0:μT-μC≤-δH1:μT-μC>-δstatisticalsignificanceδ值须在等效试验前根据专业知识予以确定t检验(Student’st-test)中心极限定理(centrallimittheorem)t0.05/2,9=2.262-t第三节总体均数的估计一、可信区间的概念预先给定的概率(1)称为可信度(confidencelevel),常取95%或99%。二、总体均数可信区间的计算1–α可信区间故该地18岁男生身高均数的95%可信区间为(164.35,169.55)cm。cm双尾1–α可信区间例某地抽取正常成年人200名,测得其血清胆固醇均数为3.64mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数95%可信区间。(2)已知或未知但n足够大(如n>60)(所拟合的两个正态曲线各按100%面积绘制)对偏度和峰度用一个指标综合评定5731号,用偏度系数(总体:1样本:g1)衡量。若只顾提高可信度,则可信区间会变宽。按水准,拒绝H0,接受H1。412.均数不太可能等于总体均数,造成样本统白含量与正常成年男性的相等未包括0=140g/L研究者可把专业上或公认有临床实际意义的差值作为等效界值δ。Cochran&Cox法(1950)有个体逐一研究(如对一批罐头质量检查)。H0:1=2H1:1≠2正态性检验和两样本方差比较的F检验三、可信区间的确切含义来自N(0,1)的100个样本所计算的95%可信区间示意如果能够进行重复抽样试验,平均有(1)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为(1)。正确性:可信度1,即区间包含总体参数的理论概率大小,愈接近1愈好。精确性:区间的宽度,区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。若只顾提高可信度,则可信区间会变宽。四、可信区间与参考值范围的区别第四节t检验例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?假设样本来自某一特定总体确定最大允许误差计算样本与总体的偏离程度根据小概率反证法思想作出推断t检验(Student’st-test)设计完全随机设计单样本完全随机设计两样本配对设计要求1.n较小(单组﹤60或两组合计﹤