您好,欢迎访问三七文档
分层线性模型HierarchicalLinearModels(HLM)案例一对73个学校1905名学生进行调查考察其上高中时的入学成绩与3年后高考成绩之间的关系如何做回归?做法一:采用OLS在学生水平上进行分析得出入学成绩对高考成绩之间的一条回归直线(如图)如图所示,传统分析并没有考虑不同学校之间的差异。做法二:将数据进行简单合并用每个学校学生的平均成绩代替这个学校的成绩直接在学校水平上估计入学成绩对高考成绩的影响,得出一条回归直线如图所示,这种回归方法忽略了不同学生之间的差异一概念分层线性回归模型:hierarchicallinearmodels(HLM)分层模型是由不同层次的自变量解释同一变量的一体化模型。当数据存在于不同层级时,先以第一层及的变量建立回归方程,然后把该方程中的截距和斜率作为因变量,使用第二层数据中的变量作为自变量,再建立两个新的方程。通过这种处理,可以探索不同层面变量对因变量的影响。-包含了不通层次的测量变量-在高层次模型中,第一层次的回归系数可被第二层次的解释变量所解释。(学生成绩不仅受学生个体特征的影响,也受到学校环境条件因素的影响)二核心思想1、功能:多层线性模型主要用来处理具有层次结构特点的数据。它能够考虑不同层次的随机误差和变量信息,提供正确的标准误差估计;得到更有效的区间估计与更精确的假设检验,以及回归方程中截距和斜率之间的相关关系;可以分析重复测量的数据,探讨以往关于同一问题的不同研究结论是否具有一致性。2、和传统线性回归的区别:我们在运用传统的线性回归模型分析和解决问题时,必须保证所需的数据符合四个基本假设:变量间存在直线关系,变量总体上服从正态分布,方差齐性,个体间随机误差相互独立。只有在这些条件下,传统的回归系数的估计才是有效估计,检验才是精确检验。但当数据带有层次特征时,不再满足基本假设的后两条,即方差齐性,个体间随机误差相互独立。例如:不同工厂的工人可以假设相互独立,但是同一工厂的工人由于受相同工厂变量的影响,很难保证相互独立。此时随机误差有两部分构成,一部分是工人个体间差异,另一部分是工厂之间的差异。由此可见传统的回归分析方法不再适用。为了满足四条基本假设,必须将带有层次特征的数据分开在每一层上分析讨论。分层以后,第一水平个体间的测量误差相互独立,第二水平工厂带来的误差在不同工厂之间相互独立。这也就是多层线性模型的核心思想。通过在不同数据层次上分别设立模型,高层变量通过对低层方程的截距和变量施加影响,从而达到相互联系的目的。从这个意义上讲,也有人将其称为“回归的回归”,但它与普通的“回归的回归”在参数估计和验证方法上有很大的区别3、多层线性模型使用的参数估计方法:多层线性模型使用的参数估计方法主要有迭代广义最小二乘法(IGLS)、限制性的广义最小二乘估计(RIGLS)和马尔科夫链蒙特卡罗法。除此之外还有期望最小二乘法(EGLS),广义估计方程法(GEE),经验贝叶斯估计等(MCMC)。这些方法在正态性假设成立,样本容量较大时,得到参数的一致有效的估计。而大多数线性分析依靠的是普通最小二乘估计。三原理一个简单的HLM模型:重写成i表示个体,j表示上层群体单位。(i表示学生个体,j就表示学校)该模型意味着按学校j对学生i进行回归四应用很多社会研究都涉及分层数据结构,例如:经济学家探求在多个国家中经济政策是如何影响居民的消费行为,研究采集的观测数据不仅包括以国家为层次的经济指标,还包括以家庭为单位的信息,因此整个观测的数据结构是分层的。此时,同属一个层次的个体之间的相关性会大于来自不同层次的个体之间的相关性,整个观测样本就不再具有独立同分布性质,如果继续使用经典的线性回归模型,就会得到有偏的参数估计和错误的统计推断结果。五论文范例谢谢聆听Madeby:72013-11-5
本文标题:分层线性模型
链接地址:https://www.777doc.com/doc-1716056 .html