如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
第4章数据的概括性度量甲、乙两个班的统计学成绩两班成绩的对比分析学习目的和重难点提示数据分布的特征和测度4.1集中趋势的度量集中趋势指标的种类4.1.1众数众数(众数的不唯一性)众数的计算方法定类数据的众数定序数据的众数[例]单项式变量数列确定众数实例数值型分组数据的众数算例4.1.2顺序数据:中位数和分位数1.中位数me集中趋势的测度值之一排序后处于中间位置上的值不受极端值的影响主要用于定序数据,也可用数值型数据,但不能用于定类数据各变量值与中位数的离差绝对值之和最小,即计算公式例:某企业50名工人加工零件中位数计算表,计算50名工人日加工零件数的中位数2.四分位数人们经常会将数据划分为4个部分,每一个部分大约包含有1/4即25%的数据项。四分位数(位置的确定)原始数据:23213032282526排序:21232526283032位置:1234567原始数据:232130282526排序:212325262830位置:123456数值型分组数据的四分位数(计算公式)计算50名工人日加工零件数的四分位数4.1.3数值型数据:均值1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于数值型数据,不能用于定类数据和定序数据均值的种类及计算平均数计算公式简单均值(算例)(1)算术平均数的大小,不仅取决于研究对象的变量值(x),而且受各变量值重复出现的频数(f)或频率(f/∑f)大小的影响,频数或频率较大,该组数据的大小对算术平均数的影响就大,反之则小。(2)权数的表现形式问题:绝对权数与相对权数是非标志的平均数加权平均数(权数对平均数的影响)甲乙两组各有10名学生,他们的考试成绩及其分布数据如下甲组:考试成绩(X):020100人数分布(F):118乙组:考试成绩(X):020100人数分布(F):811平均数(数学性质)性质(3、4)2.调和平均数2.调和平均数[例]根据某商场职工月工资资料计算月平均工资。某商场职工月工资资料3.几何平均数(3)几何平均数的应用及特点几何平均数(算例)解答:本题需要注意的是,不能够直接对利率进行几何平均,而应该通过连本带利计算,即若借款总额为L万元,则一年之后的付款额(本息和)为:各种平均数的比较4.2离散程度的度量4.2.1分类数据:异众比率异众比率(算例)根据表中的数据,计算异众比率4.2.2顺序数据:四分位差1.离散程度的测度值之一2.也称为内距或四分间距3.上四分位数与下四分位数之差QD=QU-QL4.反映了中间50%数据的离散程度5.不受极端值的影响6.用于衡量中位数的代表性四分位差(定序数据的算例)4.2.3数值型数据:方差和标准差1.极差第一组:60,70,80,90,100第二组:78,79,80,81,82很明显,两个小组的考试成绩平均分都是80分,但是哪一组的分数比较集中呢?如果用全距指标来衡量,则有R甲=100-60=40(分)R乙=82-78=4(分)这说明第一组资料的标志变动度或离中趋势远大于第二组资料的标志变动度。2.平均差平均差(计算过程及结果)3.方差和标准差离散程度的测度值之一最常用的测度值反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差总体方差和标准差(计算公式)总体标准差(计算过程及结果)样本方差和标准差(计算公式)样本方差自由度一组数据中可以自由取值的数据的个数当样本数据的个数为n时,若样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量样本方差与标准差(算例)方差(简化计算公式)方差(数学性质)各变量值对均值的方差小于对任意值的方差设X0为不等于X的任意数,D2为对X0的方差,则是非标志的标准差4.2.4相对离散程度:离散系数1.标准差与其相应的均值之比2.消除了数据水平高低和计量单位的影响3.测度了数据的相对离散程度4.用于对不同组别数据离散程度的比较5.计算公式为离散系数(实例和计算过程)例4.144.3偏态与峰态的度量4.3.1偏态及其测度数据分布偏斜程度的测度偏态系数=0为对称分布偏态系