如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
SPSS数据统计分析与实践第二十二章:典型相关分析(CanonicalCorrelation)主讲:周涛副教授北京师范大学资源学院教学网站:http://www.ires.cn/Courses/SPSS典型相关分析(CanonicalCorrelation)本章内容:一、典型相关分析的基本思想二、典型相关分析的数学描述三、SPSS实例四、小节典型相关分析的基本思想典型相关分析是研究两组变量之间相关关系的一种多元统计方法。简单相关系数;复相关系数;典型相关系数典型相关分析首先在每组变量中找出变量的线性组合,使其具有最大相关性;然后再在每组变量中找出第二对线性组合,使其与第一对线性组合不相关,而第二对本身具有最大相关性;如此继续下去,直到两组变量之间的相关性被提取完毕为止;这些综合变量被称为典型变量(canonicalvariates);第I对典型变量间的相关系数则被称为第I典型相关系数(一般来说,只需提取1~2对典型变量即可较为充分的概括样本信息)。典型相关分析的目的设两组分别为p与q维(p≤q)的变量X,Y:X=(X1,X2,K,Xp)TY=(Y1,Y2,K,Yq)T1121?Σ?X?Σ=?设p+q维随机向量Z=??Σ??Y?协方差阵???ΣΣ1222??,??其中Σ11是X的协方差阵,Σ22是Y的协方差阵,Σ12=ΣT21是X,Y的协方差阵典型相关分析用X和Y的线性组合U=aTX,V=bTY之间的相关来研究X和Y之间的相关性。其目的就是希望找到向量a和b,使ρ(U,V)最大,从而找到替代原始变量的典型变量U和V。典型相关分析的数学描述典型相关系数的数学定义为:Cov(U,V)aTΣ12bρ(U,V)==Var(U)Var(V)aTΣ11abTΣ22b由于随机变量乘以常数不改变其相关系数,为防止不必要的结果重复出现,最好在其中附加如下的约束条件:Var(U)=aTΣ11a=1Var(V)=bTΣ22b=1?1?1?1?1记A=Σ11Σ12Σ22Σ21,B=Σ22Σ21Σ11Σ12,则有Aa=λ2a,Bb=λ2b其中λ既是A又是B的特征根,a和b就是对应于A和B的特征向量。2SPSS实例为研究运动员体力与运动能力的关系,对某高一年级男生38人进行体力测试(共7项指标)及运动能力测试(共5项指标)。体力测试指标:X1反复横向跳(次)X2纵跳(cm)X3背力(kg)X4握力(kg)X5台阶试验(指数)X6立定体前屈(cm)X7俯卧上体后仰(cm)运动能力测试指标:Y150米跑(秒)Y2跳远(cm)Y3投球(m)Y4引体向上(次)Y5耐力跑(s)SPSS实例SPSS操作SPSS采用’Canonicalcorrelation.sps’宏程序来实现。输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数由体力测试指标内部相关系数看,各指标间相关系数较小,即指标间没有多大的重复。如果两个指标相关系数很大,可能这两个指标反映的是同一个方面,可以考虑合并。输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数运动能力测试指标间的相关系数也比较类似(各指标间的相关系数较小),不过y2(跳远)和y4(引体向上)之间的相关系数较大,达到0.6067输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数上表输出的是体力与运动能力之间的相关系数,从二者直接相关系数看,只有X2(纵跳)和y2(跳远)之间关联程度较大(R=0.5584),而其他体力指标和运动能力指标间的直接关联不大,更多的可能是综合影响。由于变量间的交互作用,因此,这个简单相关系数矩阵只能作为参考,不能真正反映两组变量间的实质联系。典型相关系数及显著性检验第一典型相关系数为0.763,第二典型相关系数为0.706,第三典型相关系数为0.607,它们均比体力指标和运动能力指标两组间的任一个相关系数大,即综合的典型相关分析效果要好于简单相关分析。典型相关系数及显著性检验由于此处的典型相关系数是从样本数据算得的,和简单相关系数一样,有必要进行总体系数是否为0的假设检验。此处采用的是Bartlett的χ2检验,零假设为对应的典型相关系数为0。上面的输出结果表明:在α=0.05的情况下,第一与第二典型相关系数是显著的。典型变量的系数-体力变量标准化变量(Standardi