如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
时间序列分析简明攻略中国疾病预防控制中心公共卫生监测与信息服务中心(100050)陶庄金水高[提要]目的面向医疗卫生领域的一线工作者,使读者在阅读本文后,即可将时间序列分析应用于实践。方法利用SAS6.12软件包拟合时间序列模型。结果通过两步拟合,可得到较佳的时间序列模型。结论短序列应仅进行确定型时间序列分析;长序列应在确定型时间序列分析基础上结合随机时间序列分析,可得到较佳的时间序列模型。[关键词]时间序列分析攻略ARMA模型TheConciseStrategyofTimeSeriesAnalysisTaoZhuang,JinShuigao,ChineseCenterforDiseaseControlandPrevention[Abstract]ObjectiveToprovideaconcisestrategyoftimeseriesanalysisforthecommonpublichealthworkers.MethodsToworkoutthetimeseriesmodelbySASsoftware.ResultsThebettermodelcanbedrawnbytwo-stepwork.ConclusionThefixedmodelappliestoashortseries,butforalongseries,therandommodel,forexampletheARMAmodel,shouldbeincorporated.[Keywords]timeseriesanalysisstrategyARMAmodel前言统计学的一个重要任务就是从不定的数据中找出事物的内在本质和运动规律,并最终进行预测和控制。由于现实中各种因素错综复杂,运用多元回归等静态因果结构型模型进行分析预测,往往比较困难,而根据事物自身变动情况建立动态模型——时间序列分析,则是一种行之有效的方法[6]。近些年来,时间序列分析已广泛应用于包括医疗卫生等各个领域。“攻略”一词始见于上世纪九十年代末,其意本为电脑游戏中,玩家所使用的通关策略及技巧。与“方法”不同的是,“攻略”只关心“如何完成任务”,而并不关心“怎样完成任务的理论基础”。本文试图提供一个简明的时间序列分析方法的策略,使广大一线工作者能较迅速、准确地将时间序列分析应用于实际工作。预备知识时间序列是按时间顺序排列的观测值的集合。如观测在时间上是连续的,则称该序列为连续型时间序列;如观测只在一些规定的时刻进行,则称该序列为[2]离散的。观测的间隔可以是相等的,也可以是不等的,本文只讨论前者。时间序列分析是将时间序列分解为确定因素和不规则因素,即:Xt=µt+etµt表示确定因素,包括长期趋势,季节变化和其它周期性变化。它常常表现为多项式或一些特定的函数。而et表示的不规则因素,由许多偶然因素造成,也并非杂乱无章,而具有一定规律性。人们通常对µt的研究称为确定型时间序[6]列分析,而把对et的研究称为随机时间序列分析。这里我们认为et是平稳的,而Xt由于包含了确定因素µt,则被称为不平稳的。建模步骤时间序列分析方法很多,大致可分为数据图法,指标法和模型法三种。前两种方法获得信息简单、肤浅,主观的成分较重。而模型法利用现代数理方法,拟合最优模型,有其明显优越性[6]。特别是电子计算机的飞速发展,广泛应用,使其占据了时间序列分析中的主导地位。1、建立时间序列Xt,清理数据,并保证观测间隔相等。2、使用该序列Xt作线图,观察有无异常点,并粗略观察有无趋势和周期性变化。3、如从线图中能看出较明显的趋势,应比照相近的函数进行确定项µt的提[3][6]取。主要的函数类型有以下几种:(1)线性趋势:µt=a+btt()指数趋势:Kjt2µt=∑Atej=1(3)周期趋势:µt=f(t)+Acos(ωt+ϕ)t(4)呈S形的Gompertz曲线:lnµt=K+ab(0<b<1)−1t(5)呈S形的Logistic曲线:µt=K+ab(0<b<1)显然,实际工作中不会这么简单,几种趋势可能会联合起作用。经曲线拟合,使原始序列的残差变得最小,此时所得模型即为µt。4、如果原始序列Xt没有明显趋势,或已经提取了趋势项µt,即可进行不规则因素et的拟合。我们把et也分解为两部分,即:n()1()1et=∑ϕiet−i+ati=1这就是n阶自回归模型(AutoRegressivemodel),简记为AR(n)。另一部分受以前时刻的扰动a影响,即:m()2et=∑θiat−ii=0这就是m阶移动平均