同济医学院-《SAS》课件-SAS的logistic回归(正式).ppt
上传人:yy****24 上传时间:2024-09-10 格式:PPT 页数:39 大小:1.4MB 金币:16 举报 版权申诉
预览加载中,请您耐心等待几秒...

同济医学院-《SAS》课件-SAS的logistic回归(正式).ppt

同济医学院-《SAS》课件-SAS的logistic回归(正式).ppt

预览

免费试读已结束,剩余 29 页请下载文档后查看

16 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

Logistic回归学习目标概述非条件Logistic回归非条件Logistic回归非条件Logistic回归非条件Logistic回归问题的提出分层分析中,可以分别计算出分层后的各层OR值,如果发现与总的OR有较大的差异,则可以认为该风层因素是混杂因素。必须对该因素进行MH调整,调整后的OR值才能真正反映因素和结局间的关系。如果当分层后各层的OR值经过一致性检验发现:各层间的OR值有统计学差异,这时说明分析因素在分层因素的不同水平上与结局变量的联系强度是不同的,这时分层因素和研究因素存在这交互作用(效应修饰作用)。这时应该分层报告OR值,而不能计算调整OR值。分层分析的局限性Logistic模型中系数的意义:回归系数的流行病学意义是:在其它自变量都不变的条件下,当因素X变化一个测量单位时所引起的OR值自然对数的改变量。假设建立了如下的logistic回归方程:LogitP=α+βxx为二分变量,当暴露时,取值为1;不暴露时,取值为0。所以暴露时,Logit(P1)=α+β,比值(odds)=exp(α+β)所以不暴露时,Logit(P0)=α,比值(odds)=exp(α)则,暴露对于不暴露的比值比(oddsratio)为:OR=exp(α+β)/exp(α)=exp(β)以四格表为例来说明最大似然求解的意义及过程。四格表的一般表达形式————————————————————————————发病(y=1)不发病(y=0)————————————————————————————暴露(x=1)ab不暴露(x=0)cd—————————————————合计a+cb+d—————————————————————————————暴露者发病概率p1=a/(a+b);不暴露者发病概率p0=c/(c+d)OR=ad/(bc)用发病概率来表示四格表,可以得到四格表的另外一种表示形式:四格表的另外一种表达形式(1)————————————————————————————发病(y=1)不发病(y=0)————————————————————————————暴露(x=1)p11-p1不暴露(x=0)p01-p0—————————————————————————————暴露者发病概率:p1=exp(α+βx)/[1+exp(α+βx)]暴露者不发病概率:q0=1-p1=1/[1+exp(α+βx)];不暴露者发病概率:p0=exp(α)/[1+exp(α)]不暴露者不发病概率:q0=1-p0=1/[1+exp(α)];用发病概率来表示四格表,可以得到四格表的另外一种表示形式:四格表的另外一种表达形式(2)——————————————————————————————发病(y=1)不发病(y=0)——————————————————————————————暴露(x=1)e(α+β)/[1+e(α+β)]1/[1+e(α+β)]不暴露(x=0)eα/[1+eα]1/[1+eα]——————————————————————————————因为四格表的四个实际数为a,b,c及d,故可构造似然函数为:L={e(α+β)/[1+e(α+β)]}a{1/[1+e(α+β)]}b{eα/[1+eα]}c{1/[1+eα]}d取对数,有Ln(L)=a(α+β)–aln[1+e(α+β)]–bln[1+e(α+β)]+cα–cln[1+eα]–dln[1+eα]在经典流行病学分析里对因素的统计学意义检验是检验OR值是否为1对于Logistic回归来说,对模型中变量的统计学检验就是对检验其回归系数是否为0一般常用的方法有三种:似然比检验、Wald检验、比分检验1)似然比检验似然比检验的原理是通过分析模型中变量变化对似然比的影响,来检验增加/减少的自变量是否对应变量有统计学上的显著意义。检验统计量:G=-2[Ln(Lk-1)-Ln(Lk)]Ln((Lk-1)为不包含检验变量时模型的对数似然值Ln(Lk)为包含检验变量时模型的对数似然值当检验一个变量时则G服从自由度为1的χ2分布当对模型整个进行检验时就是相当于模型中所有n个变量的回归系数都为0,G服从自由度为n的χ2分布2)Wald统计量-检验回归系数是否为0对于方程内单个自变量的检验,采用Wald统计量。W=β/SβSβ为β的标准误。其临界值可