研究生统计学讲义相关与回归学习教案.ppt
上传人:王子****青蛙 上传时间:2024-09-13 格式:PPT 页数:75 大小:13MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

研究生统计学讲义相关与回归学习教案.ppt

研究生统计学讲义相关与回归学习教案.ppt

预览

免费试读已结束,剩余 65 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

会计学第一节直线(zhíxiàn)相关双变量相关分析步骤是先作原始数据的散点图,根据散点图的提示再作恰当分析,如两变量有直线趋势,则作直线相关分析。从散点图可初步看出变量分布非正态时,应考虑(kǎolǜ)作等级相关而不宜作积矩相关。并非任何有联系的两个变量都是直线联系。例如,血压很高的人和很低的人死亡率均较高,而中等血压的人死亡率较低,死亡率和血压之间有如图7-1(h)所示曲线关系,不适合作直线相关分析。和2.如果大的X值与小的Y值相联系,小的X值与大的Y值相联系,那么和二者符号相反,在公式里符号为负.于是(yúshì)我们就说这种情形里X和Y之间有负相关即r是X和Y的修正积差除以X和Y的修正平方和乘积的平方根.注意(zhùyì)r是参数ρ的估计值,参数ρ定义为:积差相关系数r只适用于双变量正态分布资料,否则应先作变量变换,使之正态化,然后用变换后的数值(shùzí)计算积差相关系数。从服从双变量正态分布的X,Y和ρ=0的总体中每次随机抽取样本含量相同的样本,r随样本的不同(bùtónꞬ)而不同(bùtónꞬ),是一个随机变量,其分布接近正态分布时,r的标准差为Sr:也可直接用r作检验统计量,用自由度df=n-2,查附表16,相关系(guānxì)数r界值表,得出r界值,若│r│>rα,(df),则P<α,可按α检验水准拒绝H0,认为x与y之间有直线相关关系(guānxì),ρ≠0.反之│r│越小,P值越大,若│r│<rα,(df),则P>α,按α检验水准不能拒绝H0,从而认为x、y之间无直线相关关系(guānxì)。H0:总体相关(xiāngguān)系数ρ=0,体重与体表面积间无直线相关(xiāngguān)关系;H1:ρ≠0。α=0.05。以r=0.9572作统计(tǒngjì)量,用自由度df=10-2=8,查附表16得界值r0.01(8)=0.765,统计(tǒngjì)量r>r0.01,P<0.01,按α=0.05水准拒绝H0,接受H1,可以认为某地三岁儿童体重(kg)与体表面积(10-1m2)呈正向直线相关。//(3)进行(jìnxíng)直线相关分析Cross-productdeviationsandcovarlances;输出结果:体重与体表面积(miànjī)的Pearson相关系数r=0.923,双侧P值=0.000,可认为直线相关有统计学意义。三、直线相关分析应注意(zhùyì)的问题0.7>│r│>0.4(中度相关)或│r│>0.7(高度相关),都有作回归分析的必要。0.4>│r│>0.2(低度相关),是否有作回归分析的必要,有不同的看法。4.相关分析中对变量的选择及统计结果的解释要结合(jiéhé)专业背景。不要把P值大小误解为相关程度,样本相关系数有统计学意义并不一定反映相关就很密切,需要考虑专业意义或进一步结合(jiéhé)决定系数来作实际意义解释。牢记:统计上显著性水平的高低,不能代表实际相关水平的高低。一、直线(zhíxiàn)回归的模型---简单线性回归二、直线(zhíxiàn)回归方程的建立与检验补充例题(lìtí):一名学生想要确定温度与中国林蛙心律之间的关系,调节温度范围从2°到18℃,纪录每个温度下的心律.数据如下表所示.图6.5温度和心律数据用●表示,这些数据接近所显示的直线,在相同温度下,如果重复(chóngfù)7次实验,数据是相似的,但是并非都一样(见空心○).在实验运行中,因为研究者控制了温度,所以这些点排列在垂线上.线性模型的假定(jiǎdìng)1.X固定且测量无误差.2.对所给的X,变量Y的期望值(或平均值)用一个线性函数来描述:E(Y)=μY|X=α+βX.3.对任何固定的X值,能够测量相应的变量Y的一些值.(例如固定一个温度,测量一些蛙的心律值)然而,我们假定对任何的Xi,Yi彼此独立而且服从正态分布,(见图10.1垂直(chuízhí)排列的数据)能够把每一个Yi值表示为1.画散点图借以发现明显存在的线性关系.2.为数据集寻找一条(yītiáo)最合适的直线.图e)显示Y和X之间有负的线性关系(即X增加时,Y减少).而数据点不一定恰好在直线上,它们给我们一个线性的印象(yìnxiàng).图10.3f)表示变量之间有很强的正线性关系(即X增加,Y增加),与直线偏差小.线性回归只适合最后两种情形a)表示在X和Y之间不存在(cúnzài)有意义的关系最佳(zuìjiā)直线拟合一旦确定适合作回归分析,就是要确定哪一条直线最能拟合数据.在下图拟合了a,b,c三条直线.很明显,c拟合数据比a和b更好.这些数据有正的倾向:随X的增加,Y也增加.而直线b完全不能够反映Y和X之间的关系,而且这条线暗指不存在关系.在图6.8里,考虑相同数据和两条直线(zhíxi