如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
第01章绪论第一节概述【统计学】※(statistics):统计学是处理数据中变异性的科学与艺术,内容包括数据的收集(collection)、分析(analysis)、解释(interpretation)和表达(presentation),目的是求得可靠的结果。第四版教材中概念:是研究数据的收集、整理、分析和推断的一门科学。第二节医学统计资料的来源与分类基本概念:【变量及变量值】※:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),也称为【资料】。①定性变量分为:分类变量(无序分类变量)或名义变量包括:多分类变量、二分类变量有序变量(有序分类变量)或等效变量②定量变量分为:离散型变量(有缝隙):只能取整数值连续型变量(无缝隙):在实数轴上是连续的按变量值的性质可将资料分为:定性资料定量资料1.【定性资料】(分类资料、分类变量)定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。特点:①没有度量衡单位②多为间断性资料(通过枚举或记数得来)2.【定量资料】(计量资料、数值变量)定义:通过度量衡的方法,测量每个观察单位的某项研究指标的量的大小,得到的一系列数据资料。特点:①表现为数值大小②有度量衡单位③多为连续性资料(通过测量得到)3.【等级资料】(有序变量)定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。特点:①每一个观察单位没有确切值②各组之间有性质上的差别或程度上的不同。第三节统计学中常用的几个基本概念1.总体与样本【总体】:根据研究目的确定的同质的、所有观察单位的某种变量值的集合。【样本】:从总体中随机抽取的、具有代表性的部分研究对象,其实测值的集合。2.随机抽样为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到样本中)。3.同质与变异【同质】:研究对象具有的相同的状况或属性等共性称同质或同质性;【变异】:对于同质的各观察单位,其某变量值之间的差异,称为变异。4.误差【误差】:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差。【系统误差】:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。【随机误差】:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。【抽样误差】:由于抽样原因造成的样本指标与总体指标之间的差别。(举例)特点:有抽样发生抽样误差就不可避免。统计上可以计算并在一定范围内控制抽样误差。减少抽样误差的方法:(1)改进抽样方法,增加样本的代表性;样本量n相等的情况下:整群抽样>单纯随机抽样>系统抽样>分层抽样(2)增加样本量n;(3)选择变异程度较小的研究指标。5、频率与概率频率:样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]。频率与概率间的关系:1.样本频率总是围绕概率上下波动;2.样本含量n越大,波动幅度越小,频率越接近概率。6、参数与统计量参数:总体的统计指标,如总体均数、总体标准差,分别用希腊字母记为μ、σ。固定的常数统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为.参数附近波动的随机变量。7、统计描述与统计推断【统计描述】(descriptivestatistics):指用统计指标、统计表、统计图等方法对资料的数量特征及分布规律进行测定和描述。【统计推断】(inferentialstatistics):指如何抽样,以及如何由样本信息推断总体特征问题。第四节统计工作的基本步骤研究设计搜集资料整理资料分析资料结果表达一、研究设计设计的内容包括资料的收集、整理和分析全过程的设想和安排。分调查设计和实验设计。实验设计的三个基本原则1.随机化(randomization)2.对照(control)3.重复(replication)二、收集资料(datacollection)收集资料要遵循完整、准确、及时三个原则。三、整理资料(sortingdata)目的是将搜集到的原始资料系统化、条理化,便于进一步计算与分析。四、分析资料(dataanalysis)※运用各种统计分析方法,结合专业知识,从经过整理的资料中,计算出各种指标,进行统计描述和统计推断,反映数据的综合特征,阐明事物的内在联系与规律。1.【统计描述】(descriptivestatistics):指用统计指标、统计表、统计图等方法对资料