相关性分析.doc
上传人:sy****28 上传时间:2024-09-13 格式:DOC 页数:16 大小:14KB 金币:14 举报 版权申诉
预览加载中,请您耐心等待几秒...

相关性分析.doc

相关性分析.doc

预览

免费试读已结束,剩余 6 页请下载文档后查看

14 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

2.3.1-2前面我们学习了怎样对收集来的数据进行分析:集中趋势频率分布图离散程度下面我们来介绍一中更为常见的分析方法:小明,你数学成绩不太好,学不好数学,物理物理怎么样?也是学不好的?????...也不太好啊.你认为老师的说法对吗?事实上,我们在考察数学成绩对物理成绩影响的同时,还必须考虑到其他的因素:爱好,努力程度数学成绩学习兴趣物理成绩花费时间其他因素如果单纯从数学对物理的影响来考虑,就是考虑这两者之间的相关关系我们在生活中,碰到很多相关关系的问题:商品销售收入??K×广告支出经费粮食产量K×施肥量付出??K×收入人体脂肪含量K×年龄以上种种问题中的两个变量之间的相关关系,我们都可以根据自己的生活,学习经验作出相应的判断,“规律是经验的总结”,不管你多有经验,只凭经验办事,还是很容易出错的,一次在寻找变量的相关关系时,我们需要一些更为科学的方法来说明问题.在寻找变量间的相关关系时,统计同样发挥了非常重要的作用,我们是通过收集大量的数据,对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.下面我们通过具体的例子来分析在一次对人体脂肪含量和年龄的关系研究中,研究人员获得了一份样本数据:说明:各个年龄阶段的脂肪数据是这个年龄样本的平均数根据上述数据,人体的脂肪含量与年龄之间有什么样的关系?分析:从总体上看随着年龄的增长,脂肪含量也在增加,为了确定这一关系的细节,我们需要对数据进行分析,我们可以通过前面的做统计图表的方法分析,我们可以对两个变量间的关系有一个直观上的影响和判断.我们也可以通过下面的图(散点图(scatterplot))来分析:通过分析、观察可以看到:随着年龄的增长,人体脂肪含量越高,这表明两个变量之间的确存在一定的关系。递增我们叫它们正相关递减我们叫它们负相关从散点图可以看出:所有的点大致在一条直线附近波动,我们称这两个变量间存在线性相关关系,这条直线叫做回归直线(regressionline)如果可以求出这条直线的方程(回归方程),那么我们就可以比较清楚的了解年龄与体内脂肪含量的相关性.这条直线就可以作为两个变量具有线性相关关系的代表1.测量法:移动直线l使所有点到它的距离之和最小(1)(2)(3)2.两点确定法:选取两点作直线,使其两边点个数一样3.分组法:将点进行分组点,分别求其斜率和截距,求平均值我们上面给出的几种方案可靠性都不是很强,人们经过长期的实践与研究,已经找到了计算回归方程的斜率与截距的一般公式:?b??(x?x)(y?y)?xy?nxyi?1iinn?(x?x)i?1in?i?1nii2?x?nxi?12i,2a?y?bx以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。例.下表是某小卖部6天卖出热茶的杯数(y)与当天气温(x)的对比表:(1)试用最小二乘法求出线性回归方程;(2)如果某天的气温是-3℃,请预测这天可能会卖出热茶多少杯解(1)作散点图如图所示由散点图知两个变量是线性相关的,计算各种数据如下表分步计算减少出错于是:则:于是,线性回归方程为y=57.557-1.648x2)由回归方程知,当某天的气温是-3℃时,卖出的热茶杯数为57.557-1.648×(-3)≈63(杯)1.利用最小二乘估计时,首先要作出数据的散点图,利用散点图观察数据是否具有线性关系2.散点图呈现线性关系时,利用最小二乘公式求出方程练习P92、第1,2题作业P94、第2,3题