如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
教育与争鸣英国医学杂志中文版2000年2月第3卷第1期©1995-2004TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.教育与争鸣沃登编辑—如何阅读医学论文(五)如何阅读医学论文(五)供非统计学家使用的统计学“:显著性的”关系和这种关系中的陷阱HowtoreadapaperStatisticsforthenon2statistician:“Significant”relationsandtheirpitfallsTrishaGreenhalgh这篇文章继续列举一系列问题,这些问题有助于人们评价并判断某篇论文是否正确合理地使用统计学方法。这个题目是由两篇文章组成的,第一篇已在上期发表。相关、回归和因果关系有没有把相关和回归区别开?相关系数(r值)的计算和解释是否正确?本文要点如果两个变量之间的联系很强,而且这种联系在很多研究中的表现都是一致的、特定的、可以用已有知识加以解释的,同时这种联系服从时间序列逻辑并出现剂量2效应梯度变化,那么两个变量间的关系可能就有因果关系。本文为系列文章之五,第1~4篇见本刊1999年1~4期,其它文章将陆续刊登。UnitforEvidence2BasedPracticeandPolicy,DepartmentofPrimaryCareandPopulationSciences,UniversityCollegeLondonMedicalSchool/RoyalFreeHospitalSchoolofMedicine.Whittington对许多不搞统计的人来说“,相关”和P值小于0.05表示这个结果是由Hospital,LondonN195NF“回归”这两个词是同义的,这两个词大概在他们的脑子里都指的是围绕着从坐标轴一定截距上发出的一条对角线而散乱分布的点所构成的散点图。如果两种事物不相关的话,试图去做回归是毫无意义的,这一点很明确。但回归和相关是两个定义确切的、有不同作用的统计概念1。r值(Pearson积距相关系数)是被人们用得太多的一种统计方法。严格来说,如果下面这些条件不具备,使用r值就是不合理的:ᅮ数据(或更准确地说,产生数据的总体)应该是正态的分布。如果不是正态分布,就应当用非参数的相关检验。ᅮ两个数据集应当是彼此独立的(一个不应当自动随另一个而变化)。如果它们不是独立的,应当使用配对的t检验偶然机遇引起的可能性小于1/20。在临床试验中,一个结果的可信区间指的是两个处理组的“真实的”差异可能落在哪个数值范围之间,因而可信区间也可表示从结果中得到的某种推断的强度。统计学的显著性结果有可能在临床上并没有意义。这种干预试验的结果所表示的就是某个个体可能从干预试验中得到的益处(如:绝对危险性低了多少)。或其它配对的检验。ᅮ对于每一个研究对象应当只对两个数据做一次测量,如果要重复测量这两个数据,那么应当使用方差分析代替相关。TrishaGreenhalgh,seniorlecturerp.greenhalghHYPERLINKmailto:@ucl@ucl.ac.ukᅮ给出每个r值时应列出相应的P值(P值所表示的是这一相关程度是由偶然的机遇引起的可能性有多大),或者列出可信区间,可信区间表示“真实的”r值可能落在什么范围内。还要记住,即使某套数据可以使用r值,不论r值多大,它都不能说明相关关系是因果关系(见下文)。“回归”这个词指的是一个能从一个变量(自变量)预测另一个变量(目标变量)的数学方程。回归因而提示某种作用的方向,当然,从下面的讨论中我们可以看到,回归也不能证明有因果关系。多元回归用的是更复杂的数学方程(谢天谢地有计算机计算它的奥秘),从两个或更多的自变量(经常称为协变量)来预测目标变量。回忆一下上课时学过的最简单的回归方程y=a+bx,y是因变量(标在纵轴方向),x是自变量(标在横轴方向),a是y的截距。没有多少生物学上的变量能用这样一个简单方程进行预测。例如,一组人群的体重随着他们的身高变化,但这种变化不是线性关系。我的身高是我儿子身高的两倍,体重是他体重的3倍,但是我的身高是我那个刚出生的侄子的4倍,而我的体重却是他的体重6倍还多。实际上,体重更可能随人的身高的平方变化,而不是随身高本身变化(所以用二次回归也许比线性回归更恰当)。当然,即便把身高2体重数据输入到计算机已足以计算回归方程,用这个方程可以从一个人的身高对他的体重做出最佳预测,但是你的预测效果仍旧可能很糟糕,因为体重与身高并非那么密切相关。除身高外还有其