非参数双变量相关分析方法.pdf
上传人:qw****27 上传时间:2024-09-12 格式:PDF 页数:2 大小:1.3MB 金币:15 举报 版权申诉
预览加载中,请您耐心等待几秒...

非参数双变量相关分析方法.pdf

非参数双变量相关分析方法.pdf

预览

在线预览结束,喜欢就下载吧,查找使用更方便

15 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

590中国卫生统计2008年12月第25卷第6期非参数双变量相关分析方法Spearman和Kendall的MonteCarlo模拟比较南方医科大学公共卫生与热带医学学院生物统计学系(510515)胡军张超陈平雁提要目的对Spearman和Kendallstau-b两种非参数双变量相关分析方法在偏态分布和等级变量条件下进行模拟比较。方法应用SAS913软件编程,采用MonteCarlo方法,设置不同偏态分布类型、样本量及总体相关系数,比较两种非参数方法的样本相关系数及相对误差的大小。结果Spearman方法较之Kendall方法,估计的相关系数与总体相关系数更为接近,且相对误差更小。结论在双变量为偏态分布和等级变量条件下,Spearman法优于Kendall方法。关键词非参数相关模拟研究Spearman法Kendallstau-b法对于双变量相关分析,无论是教科书还是权威统表1标准正态分布数据转化为等级资料的具体设置计软体SAS及SPSS等,通常介绍的方法为Pearson积连续性变量等级变量差相关系数,Spearman和Kendallstau-b秩相关系X-21数。Pearson相关适用于双变量正态分布的数据,-2<X-12-1<X-053Spearman和Kendalls秩相关适用于等级资料、非双-05<X04变量正态分布的资料以及分布不确定的数据1-5。0<X055一般而言,当资料服从双变量正态分布时,使用Pear-05<X16son法是无可争议的,而且较非参数方法效率高也是1<X27无争议的。但在偏态分布或等级变量条件下,Spear-X>28man法和Kendall法两种非参方法何者为优却未见报道。为此,本研究拟对两方法进行模拟比较,以期为资结果料分析时选择方法提供参考。1双变量偏态分布模拟研究方法图1和图2描绘了不同参数组合下Spearman法(方法S)和Kendall法(方法K)的相对误差。由两图采用方法利用中矩阵运MonteCarlo,SASIML可见,两种偏度和峰度系数设置的结果相近。样本相算模块及随机数函数从双变量偏态分布总体进行抽关系数r均低于总体相关系数。样本量的变化对结样。总体相关系数设置为、及。样本量030609果影响不大。随总体相关系数的不同,Spearman法变n设置为10、30、60及100。在每个总体中按样本量化不大;Kendall法则有较大波动,总体相关系数愈小的不同重复抽样次而后计算并比较各种条件下2000,相对误差愈大。Spearman法的相对误差明显小于样本相关系数与总体相关系数的相对误差即,Kendall法,即Spearman方法的样本相关系数r均比相对误差。=(r-)/Kendall方法更接近总体相关系数。偏态分布双变量数据的获得可参照Fleishman的研究结果6,由标准正态分布进行转换,其公式为:Y=a+bz+cZ2+dZ3其中Y为服从一定偏度和峰度的偏态分布随机变量,Z为标准正态分布随机变量,a、b、c、d为参数,a=-c。本研究设置两种偏态分布类型:偏度系数1=075,峰度系数2=12;1=2,2=7。等级资料数据的生成,先由SAS中IML矩阵运算模块及随机数函数从双变量标准正态分布总体进行抽样,而后将连续型计量数据划分为等级资料。具体作法如表1。图1偏态分布下Spearman与Kendall方法相对误差对比图(1=075,2=12)通讯作者:陈平雁ChineseJournalofHealthStatistics,Dec2008,Vol.25,No.6591(3)样本量对两种方法的估计精度影响不明显。(4)两种方法均表现出总体相关性越高,估计的相对误差越小。概括而言,在双变量偏态分布或等级资料条件下,Spearman法相对于Kendall法为优选的估计方法。SimulatingComparisonsbetweenSpearmanandKendallstau-bMethodsfortheNonparametricBivariantCorrelationAnalysisHuJun,ZhangChao,ChenPingyan.DepartmentofBiostatis-tics,SouthernMedicalUniversity(510515),Guangzhou图2偏态分布下Spearman与Kendall方法相对误差AbstractObjectiveTocompar