如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
回归:退回regression父亲们的身高与儿子们的身高之间关系的研究160从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下:如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”——见1889年F.Gallton的论文《普用回归定律》。后人将此种方法普遍用于寻找变量之间的规律第七章相关与回归分析第一节相关与回归分析的基本概念1.按相关关系的程度划分可分为完全相关,不完全相关和不相关。2.按相关关系涉及的变量多少划分分为单相关、复相关和偏相关。3.按相关的方向划分可分为正相关和负相关。4.按相关形式划分可以分为线性相关和非线性相关。三、相关分析与回归分析回归分析与相关分析相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;相关分析中x、y均为随机变量,回归分析中只有y为随机变量;相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。定性分析(二)相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。(1)确定现象之间有无相关关系,以及相关关系的表现形态。(2)确定相关关系的密切程度。(3)确定相关关系的数字模型,并进行参数估计和拟合优度检验。(4)回归预测,并分析估计标准误差。相关系数的计算2、相关系数r的取值范围:-1≤r≤1例:下表是有关15个地区某种食物需求量和地区人口增加量的资料。203、线性相关的显著性检验相关系数的显著性检验(t检验法)学生相关关系不等于因果关系;相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系;极端值可能影响相关系数。注意相关关系成立的数据范围。警惕虚假相关第二节、简单线性回归分析2、回归模型的类型标准的一元线性回归模型简单线性回归模型的假设一元线性回归模型的假定总体一元线性回归方程:随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响残差(Residual):e(三)误差项的基本标准假定残差(Residual):e(四)回归方程估计(经验)的回归方程三、参数0和1的最小二乘估计(一)最小二乘法3、回归系数的估计的最小二乘法公式设将Q对求偏导数,并令其等于零,可得:加以整理后有:最小二乘法(和的计算公式)例:现以前例的资料配合回归直线,计算如下:42上式中b表示人口增加量每增加(或减少)1千人,该种食品的年需求量平均来说增加(或减少)0.5301十吨即5.301吨。估计方程的求法(Excel的输出结果)最小二乘法估计的优良性质(二)估计标准误差Sy计算例子可得简化式:了解四、一元线性回归模型的检验判定系数与相关系数的关系学生判定系数与相关系数的区别:总离差平方和的分解离差平方和的分解(三个平方和的关系)离差平方和的分解(三个平方和的意义)(三)回归方程的显著性检验(线性关系的检验)回归方程的显著性检验(检验的步骤)回归方程的显著性检验(方差分析表)回归系数的显著性检验(要点)是根据最小二乘法求出的样本统计量,它有自己的分布的分布具有如下性质分布形式:正态分布数学期望:标准差:由于无未知,需用其估计量Sy来代替得到的估计的标准差回归系数的显著性检验(样本统计量的分布)回归系数的显著性检验(步骤)回归系数的显著性检验(实例)回归系数的显著性检验(Excel输出的结果)预测及应用利用回归方程进行估计和预测利用回归方程进行估计和预测(点估计)利用回归方程进行估计和预测(点估计)根据回归方程,可以给出自变量的某一数值来估计或预测因变量平均可能值。例如,前例中当人口增长量为400千人时,该食品的年需求量为利用回归方程进行估计和预测(区间估计)利用回归方程进行估计和预测(置信区间估计)影响区间宽度的因素置信区间、预测区间、回归方程第三节多元线性相关与回归分析多元线性回归模型二、参数的最小二乘法三、回归方程的显著性检验(线性关系的检验)回归方程的显著性检验(步骤)回归系数的显著性检验(要点)回归系数的显著性检验(步骤)第四节非线性相关与回归分析几种常见的非线性模型几种常见的非线性模型几种常见的非线性模型几种常见的非线性模型几种常见的非线性模型非线性回归(实例)非线性回归(实例)非线性回归(实例)