应用统计学之相关与回归分析.pptx
上传人:王子****青蛙 上传时间:2024-09-12 格式:PPTX 页数:106 大小:1.4MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

应用统计学之相关与回归分析.pptx

应用统计学之相关与回归分析.pptx

预览

免费试读已结束,剩余 96 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

本资料来源第一节相关分析联系与相互影响是普遍的现象相关分析的意义现象之间的相互关系,可以概括为两种不同的类型:函数关系相关关系相关关系是现象之间数量上不严格的相互依存的关系,现象中的变量关系是对等的,函数关系是现象之间数量上严格的相互依存关系,变量关系不对等。函数关系在实际生活中往往通过相关关系表现,其在统计意义上是完全的相关关系。单相关直线相关正相关线性正相关线性负相关·无(不)相关相关关系的种类:相关关系的测定相关表简单相关表企业编号平均每昼夜产量相关图X·在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指标,用r表示r值的意义是:相关系数的取值范围是:—1≤r≤1(︱r︱≤1)︱r︱越接近1,表示相关程度越高;︱r︱越接近0,表示相关程度越低;︱r︱=0表示两个变量之间不存在直线相关;r=1表示存在着完全正相关;r=-1表示存在着完全负相关。用相关系数表示的相关程度的等级有如下几种情形:需注意:序号【例】计算工业总产值与能源消耗量之间的相关系数(资料见上页表)回归:退回regression父亲们的身高与儿子们的身高之间关系的研究160从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下:如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”——见1889年F.Gallton的论文《普用回归定律》。后人将此种方法普遍用于寻找变量之间的规律第三节简单线性回归模型自变量(independentvariable):解释变量,给定的或可以控制的、用来解释、预测应变量的变量。因变量(dependentvariable):响应变量,由自变量来解释其变化的变量。回归分析的分类回归分析与相关分析相关分析研究的变量关系是对等的,而回归分析研究的两个变量关系不是对等的相关分析对于两个变量只能计算出一个相关系数,而回归分析对于两个变量可以根据不同目的分别建立两个不同的回归方程。相关分析两个变量必须是随机变量,而回归分析的两个变量一个是随机变量,一个是给定变量。简单线性回归模型总体一元线性回归模型:简单线性回归模型的假设在实际应用中,我们对X和Y所代表的总体往往不可能全面的观察和了解,而只能从中抽取部分资料作为样本,并通过样本提供的信息来认识总体,找出总体回归模型的估计式,其估计式的方程式可写为:一元线性回归方程的几何意义总体一元线性回归方程:随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响一元线性回归方程中参数a、b的确定:整理得到由两个关于a、b的二元一次方程组成的方程组:学生(二)估计标准差当观测点离回归直线越近,实际值Y与估计值《应用统计学》第七章相关与回归分析估计标准误差是分析回归误差的一个重要尺度,它和相关系数之间存在着密切的关系。即:可以看出,r与Sy的变化方向是相反的。r越大,Sy越小,回归方程的代表性较大;r越小,Sy越大,回归方程的代表性较小。例:根据表中资料:即产量与生产费用之间的相关系数r=+0.9202,说明二者之间存在高度正线性相关关系。将表中有关数据代入公式中:生产费用对产量的直线回归方程为;如根据上表中有关数据,可计算出生产费用对产量回归的估计的标准误差:相关与回归分析习题课本章学习的重点和难点2.掌握相关关系的种类以及判断现象之间有无相关关系的几种常用方法。4.要搞清楚回归分析和相关分析的联系与区别。掌握应用相关分析与回归分析应注意的几个问题。(一)判断题4.当直线相关系数r=0时,说明变量之间不存在任何相关关系。7.在直线回归分析中,两个变量是对等的,不需要区分因变量和自变量。8.相关系数r越大,则估计标准误差s的值越大,从而直线回归方程的精确性越低。(二)单项选择题3.相关系数r的取值范围()(1)-∞<r<+∞(2)-1≤r≤+1(3)-1<r<+1(4)0≤r≤+15.相关分析与回归分析,在是否需要确定自变量和因变量的问题上()(1)前者无需确定,后者需要确定(2)前者需要确定,后者无需确定(3)两者均需确定(4)两者不需确定7.直线相关系数的绝对值接近1时,说明两变量之间相关关系的密切程度是()(1)完全相关(2)微弱相关(3)无线性相关(4)显著相关9.下列关系中,属于正相关关系的有()(1)合理限度内,施肥量和平均单产量之间的关系(2)产品产量与单位产品成本之间的关系(3)商品的流通费用与销售利润之间的关系(4)流通费用率与商品销售量之间11.下列两个变量之间的相关程度高的是()(1)商品销售额与平均流通费用率的相关系数是-0.74(2)商品销售额与商业利润率的相关系数