数据的统计描述及其分析.pptx
上传人:王子****青蛙 上传时间:2024-09-12 格式:PPTX 页数:85 大小:3.6MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

数据的统计描述及其分析.pptx

数据的统计描述及其分析.pptx

预览

免费试读已结束,剩余 75 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数据的统计描述和分析一个有趣的现象统计的基本概念一、统计量3/6/2025二、分布函数的近似求法3/6/20253/6/2025F分布F(10,50)的密度函数曲线参数估计一、点估计的求法(二)极大似然估计法二、区间估计的求法1、已知DX,求EX的置信区间Matlab统计工具箱的使用之一二、常见概率分布的函数如对均值为mu、标准差为sigma的正态分布,举例如下:3/6/20252、概率分布(分布函数):P=normcdf(x,mu,sigma)3、逆概率分布:x=norminv(P,mu,sigma).即求出x,使得P{X<x}=P.此命令可用来求分位数(下侧)求p=0.999的tf分布(自由度n=10)的分位数y=tinv(0.999,10),得y=4.14374、均值与方差:5、随机数生成:normrnd(mu,sigma,m,n).产生mn阶的正态分布随机数矩阵.二、参数估计例如:有一批糖果,从中随机的取16袋,称得重量如下:506508499503504510497512514505493496506502509496,假设糖果的重量近似服从正态分布,求总体均值、标准差的估计值和置信水平为0.95的置信区间。x=[506508499503504510497512514505493496506502509496];[mu,sigma,muci,sigmaci]=normfit(x,0.05)2.常见的几种分布数据的点估计和区间估计的matlab命令格式4.泊松分布:[lambdahat,lambdaci]=poissfit(x,alpha)在显著性水平alpha下,求正态分布的数据X的均值的点估计及其区间估计.5.二项分布:[phat,pci]=binofit(x,n,alpha)在显著性水平alpha下,求正态分布的数据X的均值的点估计及其区间估计.其中x是样本数组,alpha是显著性水平,输出有关参数的点估计和区间估计。例如假设下面的数据近似服从泊松分布,请求出分布的参数及0.95的置信区间。106533105357386575855x=[6106533105357386575855];[muhat,muci]=poissfit(x,0.05)练习:某校60名学生的一次考试成绩如下:9375839391858482777677959489918886839681799778756769688483817566857094848382807874737670867690897166867380947978776353551.参数检验:如果观测的分布函数类型已知,这时构造出的统计量依赖于总体的分布函数,这种检验称为参数检验.参数检验的目的往往是对总体的参数及其有关性质作出明确的判断.假设检验的一般步骤是:(一)单个正态总体均值检验3/6/2025(二)单个正态总体方差检验(三)两个正态总体均值检验(四)两个正态总体方差检验二、非参数检验此种方法主要是通过各组试验数据频数与理论频数差异性的大小来推断经验分布是否服从任何一个预先给定的理论分布。其理论依据就是用各组试验数据频数与理论频数的差异构造一个服从分布的统计量,并用次统计量来进行假设检验。使用此法时要求样本容量较大,并且在进行分组时,每组的理论频数不小于5。具体的内容请参见有关概率论与数理统计教材概率纸是一种判断总体分布的简便工具.使用它们,可以很快地判断总体分布的类型.概率纸的种类很多,以正态概率纸最为常见。正态概率纸的横坐标是均匀刻度,纵坐标是按正态分布律刻度,表示概率。一、数据的录入、保存和调用1、年份数据以1为增量,用产生向量的方法输入。命令格式:x=a:h:bt=78:871、输入矩阵:data=[78,79,80,81,82,83,84,85,86,87;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]二、基本统计量三、常见概率分布的函数在Matlab中输入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)3/6/2025x=-6:0.01:6;y=normpdf(x);z=normpdf(x,1,2);plot(x,y,x,z)ToMATLAB(liti3)ToMATLAB(liti5)1、给出数组data的频数表的命令为:[N,X]=hist(data,k)此命令将区间[min(data),max(data)]分为k个小区间(缺省为10),返回数组