如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:散点图:思考:1、两个变量成负相关关系时,散点图有什么特点?3、若两个变量散点图呈下图,它们之间是否具有相关关系?方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。方案二、在图中选取两点画直线,使得直线两侧的点的个数基本相同。方案三、在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距。上述三种方案均有一定的道理,但可靠性不强,我们回到回归直线的定义。最小二乘法的公式的探索过程如下:Σ(yi-Yi)的最小值问题归结为:a,b取什么值时Q最小,即总体和最小.先对a配方再对b配方我们可以用计算机来求回归方程。将年龄作为x代入上述回归方程,看看得出数值与真实值之间有何关系?若某人65岁,可预测他体内脂肪含量在37.1%(0.577×65-0.448=37.1%)附近的可能性比较大。但不能说他体内脂肪含量一定是37.1%。例、假设关于某设备的使用年限x(年)和所支出的维修费用y(万元),有如下的统计资料:使用年限x(年)23456维修费用y(万元)2.23.85.56.57.0若资料知y,x呈线性相关关系,试求:(1)线性回归方程Y=bx+a的回归系数a、b;(2)估计使用年限为10年时,维修费用是多少?i小结2.回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.例1:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:1、散点图3、从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式1求出回归方程的系数。Y=-2.352x+147.767