如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
双变量回归与相关本章内容:第一节直线回归第二节直线相关第三节秩相关第四节加权直线回归(不讲)第五节两条回归直线的比较(不讲)第六节曲线拟合(简单介绍)双变量计量资料:每个个体有两个变量值总体:无限或有限对变量值样本:从总体随机抽取的n对变量值(X1,Y1),(X2,Y2),…,(Xn,Yn)目的:研究X和Y的数量关系方法:回归与相关简单、基本——直线回归、直线相关第一节直线回归一、直线回归的概念为了直观地说明直线回归的概念,以8名儿童的年龄(岁)与其尿肌酐含量(mmol/24h)数据(见例9-1)在坐标纸上描点,得到图9-1所示散点图(scatterplot)。在定量描述儿童年龄与其尿肌酐含量数量上的依存关系时,将年龄称为自变量(independentvariable),用X表示;尿肌酐含量称为应变量(dependentvariable),用Y表示。由图9-1可见,尿肌酐含量Y随年龄X增加而增大且呈直线趋势,但并非8个点子恰好全都在一直线上,此与两变量间严格的直线函数关系不同,称为直线回归(linearregression),其方程叫直线回归方程,以区别严格意义的直线方程。回归是回归分析中最基本、最简单的一种,故又称简单回归。直线回归方程的一般表达式为1.a为回归直线在Y轴上的截距。2.b为回归系数,即直线的斜率。儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系:也即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归”。目前,“回归”已成为表示变量之间某种数量依存关系的统计学术语,并且衍生出“回归方程”“回归系数”等统计学概念。如研究糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。残差(residual)或剩余值,即实测值Y与假定回归线上的估计值的纵向距离。求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。例9-1某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。表9-18名正常儿童的年龄(岁)与尿肌酐含量(mmol/24h)解题步骤此直线必然通过点(,)且与纵坐标轴相交于截距。如果散点图没有从坐标系原点开始,可在自变量实测范围内远端取易于读数的值代入回归方程得到一个点的坐标,连接此点与点(,)也可绘出回归直线。三、直线回归中的统计推断(一)回归方程的假设检验1.方差分析数理统计可证明:上式用符号表示为上述三个平方和,各有其相应的自由度,并有如下的关系:如果两变量间总体回归关系确实存在,回归的贡献就要大于随机误差,大到何种程度时可以认为具有统计意义,可计算统计量F:式中2.t检验例9-2检验例9-1数据得到的直线回归方程是否成立?(1)方差分析表9-2方差分析表(2)t检验注意:(二)总体回归系数的可信区间例9-3根据例9-1中所得b=0.1392,估计其总体回归系数的双侧95%可信区间。(0.1392-2.447×0.0304,0.1392+2.447×0.0304)=(0.0648,0.2136)(三)利用回归方程进行估计和预测(9-15)(9-16)例9-4用例9-1所得直线回归方程,计算当X0=12时,的95%可信区间和相应个体值的95%预测区间。计算步骤第二节直线相关直线相关(linearcorrelation)又称简单相关(simplecorrelation),用于双变量正态分布(bivariatenormaldistribution)资料。其性质可由图9-6散点图直观的说明。目的:研究两个变量X,Y数量上的依存(或相关)关系。特点:统计关系二、相关系数的意义与计算2.计算:样本相关系数的计算公式为由例9-1算得,三、相关系数的统计推断例9-6对例9-5所得r值,检验尿肌酐含量与年龄是否有直线相关关系?检验步骤(二)总体相关系数的可信区间具体步骤如下例9-7对例9-5所得r值,估计总体相关系数的95%可信区间。四、决定系数(coefficientofdetermination)五、直线回归与相关应用的注意事项2.进行相关、回归分析前应绘制散点图—第一步3.资料的要求反应两变量关系密切程度或数量上影响大小的统计量应该是回归系数或相关系数的绝对值,而不是假设检验的P值。P值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著”。另外,直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围。第三节秩相关(非参数统计方法)适用条件:一、Spearman秩相关3.计算公式表9-3某省19