如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
医学统计学第二章原始资料杂乱无章分类资料的整理2.1频数表资料整理的必要性条理化,系统化,显示数量特征、分布规律,便于进一步统计分析数值变量资料的整理2.1.1.频数表的编制【例2.1】2011年某市120名7岁男童身高(cm)资料如下,试编制频数表。频数表的编制方法如下:(1)找出观察值中的最大值和最小值,并求出极差(2)决定组段数、组段和组距确定组段数要以充分反映数据的分布特征为原则组距=26.6/10=2.66可以参考斯特奇斯(Sturges)提出的经验公式来确定分组数(3)列表划记:计算各组段包含的观察单位个数2.1.2频数分布的图示图2.12011年某地120名7岁男童身高的频数分布1比(相对比)常用的相对离散度指标有:极差与中位数之比;若变量值全为负值,可在计算时将负号除去,算出结果后再冠以负号同一组变量值不能同时存在正、负值。均数是算术均数的简称,习惯上用希腊字母表示总体均数;频数分布可分为对称分布和偏态分布两种类型.尾部偏向数轴正侧(或右侧),称正偏态(或右偏态);常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。1比(相对比)组距=26.说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,计算公式为:尾部偏向数轴负侧(或左侧),称负偏态(或左偏态)百分位数(percentile)是一种位置指标,以表示,一个百分位数将总体或样本的全部观察值分为两个部分,理论上有X%的观察值比小,有(100-X)%观察值比大例如:新生婴儿(全人口)性别比,医护比,病床数与医护人员之比,医院的门诊人数与病床数之比,发展速度和增长速度等等。观察对象同质,时间相近,研究方法相同,以及地区、民族等客观条件一致图2.即一组数据中最大值与最小值之差。对称分布,是指观察值向中央部分集中,以中等数据居多,左右两侧分布大体对称。如:正常人身高、体重,脉搏,血红蛋白等的分布所谓偏态分布,是指观察值偏离中央尾部偏向数轴正侧(或右侧),称正偏态(或右偏态);如:食物中毒引起腹泻的潜伏期尾部偏向数轴负侧(或左侧),称负偏态(或左偏态)如:慢性病患者年龄的分布例如:新生婴儿(全人口)性别比,医护比,病床数与医护人员之比,医院的门诊人数与病床数之比,发展速度和增长速度等等。观察对象同质,时间相近,研究方法相同,以及地区、民族等客观条件一致如:正常人身高、体重,脉搏,血红蛋白等的分布4】5人的血清抗体滴度分别为1:10,1:20,1:40,1:40,1:160,求平均滴度。1】2011年某市120名7岁男童身高(cm)资料如下,试编制频数表。说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,计算公式为:9】三组同性别、同年龄儿童的体重(kg)如下,试分析其集中趋势和离散程度。尾部偏向数轴负侧(或左侧),称负偏态(或左偏态)实际应用中,如果观察例数小于20时,都不宜计算相对数。百分位数(percentile)是一种位置指标,以表示,一个百分位数将总体或样本的全部观察值分为两个部分,理论上有X%的观察值比小,有(100-X)%观察值比大1)未分组资料(原始资料)的均数的计算方法:4】5人的血清抗体滴度分别为1:10,1:20,1:40,1:40,1:160,求平均滴度。平均数反映一组观察值的集中趋势、中心位置或平均水平有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),算术均数对这类资料集中趋势的代表性就差,这时宜用几何均数反映其平均增(减)倍数。除研究因素外,其他的重要影响因素应相同或相近(2)决定组段数、组段和组距设计的周密程度,实验条件的严格控制不同时对研究对象的例数要求不同实际应用中,如果观察例数小于20时,都不宜计算相对数。2.2集中趋势的描述平均数反映一组观察值的集中趋势、中心位置或平均水平它是该组数据的代表,能对一群同类事物或现象的数量特征作出概括的说明,是统计学中应用最广泛、最重要的一个指标体系。常用的平均数有(算术)均数,几何均数和中位数2.2.1均数均数是算术均数的简称,习惯上用希腊字母表示总体均数;用表示样本均数。均数反映一组观察值在数量上的平均水平,最适合单峰对称分布资料的平均水平的描述。1)未分组资料(原始资料)的均数的计算方法:将所有的观察值直接相加,再除以总观察数n【例2.3】求表2.1中资料的均数2.2.2几何均数有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),算术均数对这类资料集中趋势的代表性就差,这时宜用几何均