如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
目录0.本章提要1.试验资料的搜集与整理1.1试验资料的搜集(调查;试验)1.2试验资料的整理(检查与核对;类型;表;图)2.试验资料统计量的计算2.1平均数(算术平均数;中位数;众数;几何平均数)2.2变异数(极差;方差;标准差;变异系数)第二章试验资料的整理与统计量的计算对某种具体事物或现象的观察结果,以及来自生物学试验及调查的原始数据,都称为资料(data)。在未整理之前,这些资料一般是分散的、零星的和孤立的,是一堆无序的数字和符号。统计分析过程就是对这些资料进行整理、分类、计算,再以图、表、特征值(统计量)、方程等反映结果。1.试验资料的搜集与整理1.1试验资料的搜集样本资料的搜集(collection)是统计分析的第一步,也是全部统计工作的基础。资料的来源一般有两个:一是调查,二是试验。无论是调查还是试验,统计学对原始资料都要求完整和准确。1.1.1调查资料的调查(survey)有两种方法:一种是普查,另一种是抽样调查。普查(census)就是全面调查(completesurvey),是对研究对象的每个个体都进行观察、测量或度量,比如人口普查、土壤普查等。普查的主要目的是摸清研究对象的基本情况。普查在生物学研究中应用较少。抽样调查(samplingsurvey)是一种非全面调查,是根据一定的原则抽取研究对象的一部分个体组成样本,对样本进行观察、测量或度量、统计分析,再利用样本统计量对总体进行推断。例如,某地生物资源调查、棉田某病害发病率调查等,都需执行抽样调查。要通过样本无偏差地估计总体,既要增大样本容量,又要采用科学的抽样方法抽取有代表性的样本,取得完整而准确的资料。与相应的统计分析方法相结合,正确的抽样方法不仅能节约人力、物力和财力,而且能为做出比较准确的总体估计和推断奠定基础。生物学研究中,由于研究的目的和性质不同,所采取的抽样方法也各不相同。以概率论和数理统计学原理为依据,用来推断总体的样本必须是随机样本(randomsample),即以随机抽样(randomsampling)法获得的样本,因为只有这样才能正确估算抽样误差、准确地推断总体。随机抽样必须满足两个条件:①总体中每个个体被抽中的机会是均等的;②总体中任意一个个体是否被抽中是相互独立的,不受其他个体存在的影响(这一条特别适合于无限总体)。但是,生物学研究遇到的某些总体属于有限总体,有时难以完全符合随机样本的理论要求。1.1.2试验对于生物学研究中的某些理论性无限总体,人们一般需要通过执行各种试验(experiment)来获取样本资料。对这些试验要遵循随机、重复和局部控制三项基本原则予以设计。常见的试验设计方法有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计等。1.2试验资料的整理1.2.1原始资料的检查与核对通过调查或试验取得原始资料(rawdata),及时对全部数据进行检查与核对,然后才能进行整理(collation)。检查与核对,就是查验取样是否有差错、数据本身是否有错误、以及订正不合理的数据,具体涉及到对原始资料的测量和记载有无差错、原始资料有无遗失、有无重记或非法合并现象、有无特大或特小的异常值。对个别缺失的数据应进行及时补救,对重复、错误和异常值应予以删除或订正并注明原因,必要时进行复查或重新试验。数据的检查与核对,在统计分析中是非常重要的步骤。只有经过检查与核实的资料,在数据完整、真实、可靠方面获得保证,才能进入统计分析的后续过程。1.2.2.1数量性状资料数量性状资料(dataofquantitativecharacter),一般是由计数和测量得到的。由计数法得到的数据称为计数资料(enumerationdata),也称为非连续变量资料(dataofdiscontinuousvariable),以正整数出现。例如,鱼尾数、玉米果穗籽粒行数、种群内个体数、白血细胞数等,只可能是1,2,…,n。由测量所得的数据称为计量资料(measurementdata),也称为连续变量资料(dataofcontinuousvariable)。计量数据通常以长度、重量、体积等单位表示,可以带小数;其数值可以精确至十分、百分、千分位等,依试验要求和测量仪器或工具的精度而定。例如,人体身高、玉米果穗重量、仔猪体重、奶牛产奶量等。1.2.2.2质量性状资料质量性状资料(dataofqualitativecharacter),或属性资料(attributedata),是指对某种现象实施定性描述的资料。例如,水稻花药、籽粒、颖壳的颜色,小麦芒的有无,茸毛的有无;果蝇的长翅与残翅;人血型的A、B、AB、O型;动物的雌、雄;疾病疗效的痊愈、好转、无效等。为了便于统计分析,必须把质量