数据分布特征的描述实用教案.pptx
上传人:王子****青蛙 上传时间:2024-09-12 格式:PPTX 页数:82 大小:4.3MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

数据分布特征的描述实用教案.pptx

数据分布特征的描述实用教案.pptx

预览

免费试读已结束,剩余 72 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数据分布的特征(tèzhēng):数据分布的特征(tèzhēng)数据分布特征(tèzhēng)的测度3.1集中趋势(qūshì)的度量集中趋势(centraltendency)分类(fēnlèi)数据----众数注意(zhùyì):众数(不惟一性)①分类数据的众数(例题(lìtí)分析)②顺序(shùnxù)数据的众数(例题分析)③数值型数据众数(zhònɡshù)的确定方法单变量值分组资料身高(shēnɡāo)人数比重(CM)(人)(%)150-15533.61155-1601113.25160-1653440.96165-1702428.92170以上1113.25总计83100众数(zhònɡshù)的计算方法总结:例3.1某车间实行计件工资(jìjiàngōngzī),2005年10月120名工人的月工资资料如下表所示:要求:试计算月工资的众数。解:从上表中我们可以看出(kànchū),月工资变量值中最大的字数为48人,即众数组为1000-1200这一组。根据公式,可得:众数(zhònɡshù)的特点顺序(shùnxù)数据---中位数和分位数1中位数:①顺序数据的中位数(例题(lìtí)分析)②未分组数值型数据(shùjù)的中位数(奇数个数据(shùjù)的算例)未分组数值(shùzí)型数据的中位数(偶数个数据的算例)③组距分组数据(shùjù)中位数的确定方法中位数的计算方法:2、由分组资料(zīliào)确定中位数:例3.2某车间实行计件工资,2005年10月120名工人(gōngrén)的月工资资料如下表所示:要求:试计算月工资的中位数。解:2.顺序(shùnxù)数据----分位数四分(sìfēn)位数的位置例3.3两个学习小组的统计学考试成绩合并如下:要求:(1)计算前15个学生统计学考试成绩的四分位数;(2)如果增加一个(yīɡè)学生的成绩为95分,试计算16个学生统计学考试成绩的四分位数。解(1)QL的位置=N+1/4=15+1/4=4,即QL在第4个位置上,相应的变量值68分就是(jiùshì)下四分位数。Qu的位置=3(N+1)/4=3(15+1/4=12,即Qu在第12个位置上,相应的变量值85分就是(jiùshì)上四分位数。(2)QL的位置=N+1/4=16+1/4=4.25,即QLQL在第4.25个位置上,采用分割法,得:QL=X4+0.25x(X5-X4)=68+0.25x(72-68)=69(分)同理,可得Qu=85.75(分)数值(shùzí)型数据--平均数1.平均数(均值)简单(jiǎndān)算术平均数与加权算术平均数的计算(simplemean/weightedmean)未分组资料(zīliào)算术平均数的计算:身高(shēnɡāo)组中值人数比重(cm)xi(cm)fi(人)(%)150-155152.533.61155-160157.51113.25160-165162.53440.96165-170167.52428.92170以上172.51113.25总计--83100集中趋势的最常用测度值;一组数据的均衡点所在;易受极端(jíduān)值的影响;各变量值与其均值的离差之和等于零;由组距分组资料计算的均值有近似值性质;用于数值型数据,不能用于分类数据和顺序数据2.平均数的另一种(yīzhǒnɡ)表现形式:调和平均数调和平均数(例题(lìtí)分析)3.几何(jǐhé)平均数(geometricmean)几何(jǐhé)平均数(例题分析)众数(zhònɡshù)、中位数和平均数的关系均数、中位数、众数(zhònɡshù)三者关系众数(zhònɡshù)、中位数、平均数的特点和应用习题1、一家汽车(qìchē)零售店中10名员工在某个月售出的汽车(qìchē)数量按升序排列如下:2,4,10,10,12,12,14,15。计算售出汽车(qìchē)数量的(a)均值;(b)中位数;(c)众数。2、八名销售员售出的中央空调数按升序排列如下:5,8,11,11,11,14,16.计算这八名销售员销售量的四分位数。1、解:(a)均值(jūnzhí)(b)中位数(c)众数为10.2、解:3.2离中趋势(qūshì)的测度下面是两个总体关于年龄分布的数据,相对而言,那个(nàge)总体的年龄分布分散,差异大些?离中趋势;数据远离中心的趋势(分散程度))分类数据:异众比率(variationratio))顺序数据:四分位差(quartilerange)数值型数据:①极差(range)②平均差(meandeviation)③方差和标准差(Varianceandstandarddeviat