试验判别分析聚类分析.ppt
上传人:天马****23 上传时间:2024-09-11 格式:PPT 页数:28 大小:2.4MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

试验判别分析聚类分析.ppt

试验判别分析聚类分析.ppt

预览

免费试读已结束,剩余 18 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

一、判别分析1.判别分析过程PROCDISCRIM;CLASSG;VARX1-X5;PRIORSPROP;RUN;DISCRIM过程后选项:METHOD=NORMOL参数法(默认)、NPAR非参数法POOL=YES(默认)、NO、TEST先检验,方差齐则合并ANOVA、MANOVA进行一元、多元方差分析检验DISTANCE输出类内及类间的平均距离LISTERR输出回代错判的个体及后验概率CROSSLISTERR输出回代结果中原分类与现分类的列联表OUT=运算结果输出到指定数据集OUTSTAT=中间统计量及二次方程系数输出到指定数据集SIMPLE可输出各自变量的简单统计描述NOPRINT禁止屏幕输出任何结果PRIORS语句指定先验概率,有3个选项:EQUAL指定各类的先验概率相等,为默认值PROR各类的先验概率等于各类样本频率‘1’=P1‘2’=P2‘3’=P3…指定各类的先验概率为P1、P2….Pi,(P1+P2+…+Pi=1)组外回代DATATEST;INPUTX1X2@@;CARDS;PROCDISCRIMDATA=A1TESTDATA=TESTTESTLISTPOSTERR;CLASSG;VARX1X2;RUN;练习1:通过已确诊的100名四类病人的血清生化指标测定值建立判别函数式PA:serumproteinPAAG:serumprotein1-AGAT:serumprotein1-ATHP:serumproteinHPGROUP:健康=1;肝癌(APF+)=2;肝癌(APF-)=3;肝硬化=4程序:d:\mv_sas\unit4\data\discrim1.sas数据:d:\mv_sas\unit4\data\disc1.xls练习2:组外回代调查50-59岁的女性冠心病人15名和正常人16名,试用判别分析法建立判别冠心病与正常人的判别函数式,并作组外病例回代。X1舒张压X2血浆胆固醇G病人=1;正常人=2程序:d:\mv_sas\unit4\data\discrim2.sas2.逐步判别分析过程仅适用于类内为多元正态分布,并具有相同方差协方差矩阵的数据(POOL=TEST时P>α)。PROCSTEPDISC;CLASSG;VARX1-X5;RUN;STEPDISC过程后可加选项:METHOD=STEPWISE(默认)FORWARD、BACKWARDSLE=0.15SLS=0.15练习3:调查心肌梗塞和健康人各30名,分别测得其6项血脂指标,试建立判别函数式TC总胆因醇TG甘油三酯HDLC高密度脂蛋白胆固醇LDLC低高密度脂蛋白胆固醇apoA载脂蛋白AapoB载脂蛋白BGROUP心肌梗塞=1;正常人=2程序:d:\mv_sas\unit4\data\stepdisc.sas数据:d:\mv_sas\unit4\data\stepdisc.xls练习4:通过三组人群的5项心电图指标,建立判别函数X1、X2、X3、X4、X5为5项心电图指标GROUP:健康=1;硬化症=2;冠心病=3设各类先验概率相等程序:d:\mv_sas\unit4\data\discrim3.sas数据:d:\mv_sas\unit4\data\disc3.xls3.Logistic判别分析过程PROCLOGISTIC;MODELY=X1-X5/SELECTION=STEPWISESLE=0.15SLS=0.15;CTABLEPPROB=;RUN;CTABLE要求系统输出判别表PPROB=指定判别概率的临界值以logistic回归模型为判别函数进行判别分类。用于类别不多时,自变量不服从正态分布或自变量是分类变量。练习5:53个接受前列腺癌手术治疗的病人,观察了肿瘤是否已扩散至临近的淋巴结。试用手术前观察到的各项指标建立判别函数。x有否接触X射线g活组织检查肿瘤分级s触诊肿瘤分期age诊断时患者年龄acid血清磷酸酶水平y=1为扩散,y=0为未扩散根据经验,将acid取对数,并在模型中包含s与g的交互作用程序:d:\mv_sas\unit4\data\logistic.sas数据:d:\mv_sas\unit4\data\logistic.xls二、聚类分析聚类分析不仅可以用原始数据,也可以用下列各种统计分析的中间结果矩阵:1.指标聚类作聚类结果的树状图指标聚类3454名成年女子14个部位测量值相关系数矩阵3454名成年女子14个部位的聚类图(类平均法)练习七:指标聚类分析为研究人脑老化的严重程度,测定了不同年龄的60名正常男性10项有关指标的数据:AGE为年龄TJ为图片记忆SG为数字广度记忆XX为心