如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
2检验对于计数资料来讲是一种用途非常广泛的假设检验方法,可用于两组或多组样本率的比较,两组或多组构成比的比较,以及拟合优度检验等。第一节四格表资料2检验四格表资料的基本形式2.2检验的基本思想A药组74例,理论上应该有7487.59%=74120/137=64.82例为阳性;B药组中63例,理论上应该有6387.59%=63120/137=55.18例为阳性。理论频数的计算公式为:式中TRC为第R行第C列格子的理论数,nR为第R行的行合计数,nC为第C列的列合计数,n为总例数。例1中四个格子的理论数用上式计算结果:T11=74120/137=64.82T12=7417/137=9.18T21=63120/137=55.18T22=6317/137=87.6若无效假设H0成立,则实际频数(A)与理论频数(T)的差值不应该很大,出现大的2值的概率P很小,如果2值较大,则有理由拒绝H0;反之,则不拒绝H0。可见,检验统计量2反映了实际频数和理论频数的吻合程度。二、四格表资料的2检验2.四格表资料2检验专用公式式中a、b、c、d分别为四格表中的四个实际频数,n为总例数。3.四格表资料2检验的连续性校正问题一般原则是:①当n≥40且所有T≥5时,用非校正公式计算2值。②当n≥40但有1≤T<5时,用连续性校正公式计算2值。③当n<40或有T<1时,用Fisher确切概率法.三、交叉分类2×2表的关联性分析对定性变量之间的关系常用方法是根据两个定性变量交叉分类计数所得的频数资料(列联表)作关联性分析,即关于两种属性独立性的2检验。例3为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机调查了消化不良的婴儿82例。对每个个体分别观察腹泻与否和喂养方式两种属性,结果见表10-3。试分析两种属性的关联性。(1)建立假设,确定检验水准H0:两种属性之间互相独立H1:两种属性之间有关联=0.05(2)计算检验统计量2值=9.98ν=(2-1)(2-1)=1(3)确定概率P值和判断结果查2界值表,20.005(1)=7.88,2>20.05(1)=3.84,P<0.005,按=0.05的水准拒绝H0,接受H1,可认为婴儿腹泻与喂养方式之间存在关联性。Pearson列联系数(contingencycoefficient),反映两个分类变量关联的程度,计算公式为Pearson列联系数r=其中2为交叉分类2×2表资料的Pearson2值,n为样本量。四格表的Pearson列联系数值r在0~1之间。r值愈接近于0,说明两个分类变量关系愈弱,r值愈接近于1,说明关系愈密切。第二节配对四格表资料的2检验例4用两种不同的方法对53例肺癌患者进行诊断,结果见表10-4,问两种方法的检测结果有无差别?配对设计资料整理成四格表形式:配对四格表统计量的计算公式:b+c>40b+c≤40检验过程如下:(1)建立假设,确定检验水准H0:总体b=c即两种方法的检测结果无差别H1:总体b≠c即两种方法的检测结果有差别=0.05(2)计算检验统计量2值因为b=2,c=11,b+c<40,故用校正公式,=4.92(3)确定概率P值,作出推断结论查2界值表,20.05(1)=3.84,2>20.05(1),P<0.05,按=0.05的水准拒绝H0,接受H1,可认为两种方法的检测结果有差别,乙法检测出的阳性率较高,因为c>b。例4问两种方法的检测结果有无差别?例4问两种方法的检测结果有无差别?例5对例4数据,问两种方法的检测结果有无联系?检验步骤如下:(1)建立假设,确定检验水准H0:两种方法的结果无相关H1:两种方法的结果有相关=0.05(2)计算检验统计量2值=15.37ν=(2-1)(2-1)=1(3)确定概率P值和判断结果查2界值表,20.05(1)=3.84,2>20.05(1),P<0.05,按=0.05的水准拒绝H0,接受H1,可认为两种方法的结果存在关联性。进一步计算Pearson列联系数:==0.47。第三节行列表资料的2检验计算检验统计量的公式:v=(R–1)(C–1)式中n为总例数,A为每个格子里的实际频数,nR,nC分别为与A值对应的行和列合计的例数。一、多个样本率的比较例6某医院用三种穴位针刺治疗急性腰扭伤,得表10-5数据,试比较三组治愈率有无差别。检验步骤:(1)建立假设,确定检验水准H0:1=2=3H1:1,2,3不全相等=0.05(2)计算