如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
卡方检验是英国统计学家K.Pearson于1900年提出的,以卡方分布和拟合优度为理论依据,一种用途较广的假设检验方法。常用于检验完全随机设计下两个或多个样本率(或构成比)之间有无差别,也可用于检验配对设计下两组频数分布差异,或者线性趋势卡方检验,推断两变量间有无相关关系等。第一节完全随机设计(独立样本)列联表资料的检验在抽样研究中,由于个体间存在变异,必然存在着抽样误差,率(或构成比)的抽样误差与均数的抽样误差概念相同。例1将病情相似的169名消化道溃疡患者随机分成两组,分别用奥美拉唑与雷尼替丁两种药物治疗,4周后评价其疗效,结果见表1。问两药治疗消化道溃疡的愈合率有无差别?表1两药治疗消化道溃疡4周后疗效两组的愈合率不同有两种可能:1.两药的总体愈合率无差别,两样本率的差别仅由抽样误差所致。2.两种药物的总体愈合率确有不同。一、卡方检验的基本思想表1中,64、21、51、33是整个表的基本数据,其余数据都是从这四个基本数据相加而得的,这种资料是两组两分类资料,称为四格表(fourfoldtable),亦称2×2表(2×2table)。表两独立样本率比较的四格表无效假设H0为π1=π2,即两种药物治疗消化道溃疡的愈合率相同,两样本的愈合率的差别仅有抽样误差所致。由于此时总体情况未知,故用样本合计愈合率对总体愈合率进行估计,即H0为π1=π2=68.05%,在此基础上,可以推算每个格子的期望频数,称为理论频数(actualfrequency),用符号T表示;从样本观察到的频数称为实际频数(theoreticalfrequency),用符号A表示。若H0成立,则理论上:奥美拉唑组愈合人数:奥美拉唑组未愈合人数:雷尼替丁组愈合人数:雷尼替丁组未愈合人数:为相应行的合计为相应列的合计n为总例数。表1两药治疗消化道溃疡4周后疗效检验的基本公式:从基本公式可以看出,统计量值反映了实际频数和理论频数的吻合程度。如果假设检验H0(π1=π2)成立,则实际频数和理论频数之差一般不会相差太大,值相应也不会太大;反之,实际频数和理论频数之差相差很大,则值相应也会很大,相应的P值也就越小,当P≤,则有理由认为无效假设不成立,继而拒绝H0,作出统计推断。由统计量的公式(11.2)可以看出,,格子数越多,非负数之和,则卡方值越大,即卡方值的大小除了与A与T的差别大小有关外,还与格子数量有关。因而考虑卡方值大小的同时,应同时考虑格子数的多少。引入自由度v。式中,k为格子数,s为估计的参数个数,R为行数,C为列数。如本例中,4个格子,估计甲乙两药的有效率,则k=4,s=2,v=4-1-2=(2-1)(2-1)=1。分布是一种连续型随机变量的概率分布。如果Z服从标准正态分布,那么Z2服从自由度为1的分布,其概率密度在(0,+∞)区间上表现为L型,取较小值的可能性较大,取较大值的可能性较小。设有v个相互独立的标准正态分布随机变量Z1,Z2,Zv,则的分布称为自由度为v的分布,记为。分布的形状依赖于自由度v的大小,当自由度v>1时,随着v的增加,曲线逐渐趋于对称,当自由度v趋于∞时,分布逼近正态分布。各种自由度的分布右侧尾部面积为时的临界值记为,列于附表8。例2某研究欲比较甲、乙两药治疗下呼吸道感染的疗效,将65例下呼吸道感染者随机分为两组,进行随机双盲试验,结果见表2。两组纳入分析的病例数分别为32和33人。问两药治疗下呼吸道感染的有效率有无差别?表2两药治疗下呼吸道感染的效果例某医师用甲、乙两疗法治疗单纯消化不良,结果如下表,问两种疗法的治愈率有无差别?表两种疗法对单纯消化不良的治愈率比较(一)多个样本率的比较例3某研究者欲比较A、B、C三种方案治疗轻、中度高血压的疗效,将年龄在50~70岁的240例轻、中度高血压患者随机等分为3组,分别采用三种方案治疗。一个疗程后观察疗效,结果见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别?表3三种方案治疗轻、中度高血压的效果例为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的53名产妇随机分成三组,分别按三种不同剂量服用该药,镇痛效果如下表。试分析该药不同剂量的镇痛效果有无差别?表某药不同剂量的镇痛效果(二)两个或多个构成比的比较例4为了解新型农村合作医疗对于农村贫困居民住院服务利用的影响,在经济条件相似的甲、乙两个国家级贫困县(其中甲县2006年已开展新型农村合作医疗,乙县2006年尚未开展)分别进行抽样调查,得到2006年应住院者未住院原因,见表11.5。问甲、乙两县应住院者未住院原因构成比是否不同?表4甲、乙两