统计学基础(第三章统计数据的整理与展示).ppt
上传人:天马****23 上传时间:2024-09-14 格式:PPT 页数:104 大小:10.8MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

统计学基础(第三章统计数据的整理与展示).ppt

统计学基础(第三章统计数据的整理与展示).ppt

预览

免费试读已结束,剩余 94 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

教学目的与要求:本章阐述统计整理的理论与方法,包括统计分组、汇总和统计表的设计。学习本章,要求:1.明确统计整理在统计研究中承前启后的地位。2.掌握分组方法和汇总技术。3.认识统计分布是统计整理的重要表现形式。4.学会统计表的编制并能熟练运用第一节统计的整理整理(二)统计数据整理的程序二、统计分组统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。(二)统计分组的分类如企业按经济类型,隶属关系、规模、轻重工业分组均属于简单分组:复合分组是先按一个标志分组,在此基础上再按第二个标志分组,又再此基础上按照第三个标志分组,依次类推。按分组标志的性质二、统计分组的原则(三)、分组标志的选择恰当得选择分组标志,须注意一下问题:四、统计分组的方法2、变量分组的方法单项式分组组距式分组家庭按儿童数分组职工按月工资分组0700---8001800---9002900---10002.等距分组与不等距分组区间的距离叫组距。在组距式分组中,如果每组的组距相等,则称为等距分组;不相等则称为不等距分组应用条件:标志值变动比较均匀的情况下,采用等距分组。如产品合格率、企业按职工人数分组、职工按月工资分组等。标志值变动不均匀,变动幅度较大时,采用不等距分组。如人口普查,将人口按年龄分组为:0-14岁、15-64岁和65岁以上三个组。统计学原理(第三讲)按工资分组组中值人数300元以下25010300—40035020400—60050025600元以上70012离散变量相邻两组的上下限既可以间断,也可以重叠;连续变量相邻两组的上下限只能重叠。(一)分配数列的概念、构成要素在统计分组的基础上,总体中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形成总体单位数在各组分布的一系列数字,称为分配数列,又称次数分配或次数分布。分配数列中,分布在各个组的总体单位数叫次数,又称频数。如果将分组标志序列与各组相对应的频率按照一定的顺序排列,就形成频率分布数列。分配数列有两个组成要求:一是分组;另一个是次数或比率。它可根据分组标志的性质不同,可以分为品质数列与变量数列。2000年我国人口性别构成情况某班级统计学成绩分布表第一步,将原始资料按数值大小依次进行排列第二部确定变量的类型和分组的方法(如单项式分组或组距式分组第三步,确定组数和组距:组距=全距/组数全距=最大值-最小值第四步,确定组限以及表示方法第五步,汇总各组出现的次数,并计算频率[例]对某企业30个工人完成劳动定额的情况进行调查,某原始资料如下(%)98819584938691102100103105100104108107108106109112114117125115120119118116129113可以通过编制变量数列来反映工人的完成情况,步骤如下第三步:确定组限关于组限的确定,应注意如下几点:第一,最小组的下限(起点值)应低于最小变量值,最大组的上限(终点值)应高于最大变量值。第二,组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化。第三,为了方便计算组限应尽可能取整数,最好是5或10的整倍数。第四,由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同的。某企业30个工人劳动定额完成情况分布图表第五步:计算累计频数和累计频率为了更详细的认识变量的分布特征,还可以计算累计频数和累计频率,编制累计频数和累计频率数列。累计频数和累计频率有向上累计频数(频率)和向下累计频数(频率)两种。以变量值大小为依据,由变量值小的组向变量值大的组累计频数和频率,成为向上累计频数和向上累计频率。向上累计数的意义是:小于各组的该组上限的各组的频数或频率之和;相反,由变量值大的组向变量值小的组累计各组的频数或频率,称为向下累计频数或向下累计频数。向下累计数的意义是:大于及等于该组下限的各组的频数或频数或频率之和。根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向下累计频数(频率)分布如表3—8。表3—8某企业工人完成劳动定额累计分布表表3—8某企业工人完成劳动定额累计分布表(四)次数分布的主要类型(二)U形分布U形分布的特征是:靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,形成“两头大,中间小”的分布特征。将这种分布绘成曲线,像英文字母“U”的形状,故称U形分布例如,人口死亡率的分布,一般是婴幼儿死亡率和老年人死亡率均较高,而中年人死亡率最低,所以人口年龄分组的死亡率是呈U形分布的。另外,失业人口按年龄的分布等均