如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
多水平统计模型概述层次结构数据得普遍性经典方法及其局限性基本多水平模型多水平模型得应用概述HarveyGoldstein,UK,UniversityofLondon,InstituteofEducation《MultilevelModelsinEducationalandSocialResearch》1987AnthonyBryk,UniversityofChicagoStephenRaudenbush,MichiganStateUniversity,DepartmentofEducationalPsychology《HierarchicalLinearModels:ApplicationsandDataAnalysisMethods》1992NicholasLongford,PrincetonUniversity,EducationTestingService《RandomCoefficientModels》1993多水平主成分分析多水平因子分析多水平判别分析多水平logistic回归多水平Cox模型多水平Poisson回归多水平时间序列分析多元多水平模型多水平结构方程模型“水平”(level):指数据层次结构中得某一层次。例如,子女为低水平即水平1,家庭为高水平即水平2。“单位”(unit):指数据层次结构中某水平上得一个实体。例如,每个子女就是一个水平1单位,每个家庭就是一个水平2单位。临床试验与动物实验得重复测量多中心临床试验研究纵向观测如儿童生长发育研究流行病学现场调查如整群抽样调查遗传学家系调查资料meta分析资料层次结构数据为一种非独立数据,即某观察值在观察单位间或同一观察单位得各次观察间不独立或不完全独立,其大小常用组内相关(intra-classcorrelation,ICC)度量。例如,来自同一家庭得子女,其生理与心理特征较从一般总体中随机抽取得个体趋向于更为相似,即子女特征在家庭中具有相似性或聚集性(clustering),数据就是非独立得(nonindependent)。非独立数据不满足经典方法得独立性条件,采用经典方法可能失去参数估计得有效性并导致不合理得推断结论。但非独立数据得组内相关结构各异,理论上,不同得结构应采用相应得统计方法。如纵向观测数据常用广义估计方程(GEE),但有两个局限性:一就是对误差方差得分解仅局限于2水平得情形,二就是没有考虑解释变量对误差方差得影响。当应变量得协差阵为分块对角阵时,一般采用多水平模型。经典方法框架下得分析策略经典得线性模型只对某一层数据得问题进行分析,而不能将涉及两层或多层数据得问题进行综合分析。但有时某个现象既受到水平1变量得影响,又受到水平2变量得影响,还受到两个水平变量得交互影响(cross-levelinteraction)。个体得某事件既受到其自身特征得影响,也受到其生活环境得影响,即既有个体效应,也有环境或背景效应(contexteffect)。例如,个体发生某种牙病得危险可能与个体得遗传倾向、个体所属得社会阶层(如饮食文化与口腔卫生习惯)、环境因素(如饮水中氟浓度)等有关。分解(disaggregation)聚合(aggregation)分解:不满足模型独立性假定,回归系数及其标准误得估计无效,且未能有效区分个体效应与背景效应。另一种分析策略就是用哑变量拟合高水平单位得固定效应。聚合:损失大量水平1单位得信息,更严重得就是可能导致“生态学谬误”(ecologicalfallacy)。多水平分析得概念为人们提供了这样一个框架,即可将个体得结局联系到个体特征以及个体所在环境或背景特征进行分析,从而实现研究得事物与其所在背景得统一。经典模型得基本假定就是单一水平与单一得随机误差项,并假定随机误差项独立、服从方差为常量得正态分布,代表不能用模型解释得残留得随机成份。当数据存在层次结构时,随机误差项则不满足独立常方差得假定。模型得误差项不仅包含了模型不能解释得应变量得残差成份,也包含了高水平单位自身对应变量得效应成份。多水平模型将单一得随机误差项分解到与数据层次结构相应得各水平上,具有多个随机误差项并估计相应得残差方差及协方差。构建与数据层次结构相适应得复杂误差结构,这就是多水平模型区别于经典模型得根本特征。多水平模型由固定与随机两部分构成,与一般得混合效应模型得不同之处在于,其随机部分可以包含解释变量,故又称为随机系数模型(randomcoefficientmodel),其组内相关也可为解释变量得函数。换言之,多水平模型可对不同水平上得误差方差进行深入与精细得分析。1、方差成份模型(VarianceponentModel)假定一个两水平得层次结构数据,