您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > HLM多层线性模型教程
HLM多层线性模型教程:[1]认识多层线性模型|浏览:111|更新:2014-03-0109:431.在社会科学研究进行取样时,样本往往来自于不同的层级和单位,由此得到的数据带来了很多跨级(多层)。多层线性模型又叫做“多层分析(multilevelanalysis)”或者是“分层线性模型(hierarchicallinermodeling)”。2.在社会科学中,多层线性的结构非常具有普遍性,如下图列出四种常见的情况3.拿两层举例子,假如说现在我们考察学生自我效能感对学生成绩的影响,在204.所学校中抽取了1000名学生,那么很有可能的情况就是有些学校学生的自我效能感平均值较高,而这就有可能是因为学校为贵族学校,学生的经济水平很高。而也可能有民工学校,经济水平较低,自我效能感普遍较低。那么这就存在一种情况就是学生的成绩受到学生个体的自我效能感影响,而每个学校的自我效能感可能与整个学校的整体经济水平有关。那么这就是学生嵌套在学校之间的例子。5.多层线性模型的基本公式6.拿上面的例子我们可以写出对于这个案例的多层线性模型。第一层:学生成绩=β0+β1*学生自我效能感+r第二层:β0=γ00+γ01*学校社会经济生活水平+μ1β1=γ10+γ11*学校社会经济生活水平+μ27.那么对于这样一类的多层线性的数据,我们该如何进行数据处理呢,小编将持续为大家呈现与讲解。原作者:delta数据工作室HLM多层线性模型教程:[3]认识HLM6.0界面|浏览:186|更新:2014-03-0409:441234567分步阅读采用HLM6.0分析多层线性模型能够非常直观的建立方程式,每层变量清晰明了,使用界面友好简洁。下面我将为大家介绍HLM6.0的主界面,并告诉大家各界面的主要功能。工具/原料HLM6.0方法/步骤1.我们打开HLM的主界面,最上面的工具栏就是我们用到的主要菜单,首先file下面我们可以创建新的hlm/mdtm文件(hlm中最重要的文件),如下图,假如我们已经建立好了HLM的MDM文件,那么我们在下次打开的时候需要选择makenewmdmfromoldmdmfiles,HLM不能直接打开之前的文件,可以从之前的MDM文件中运行。我们需要新建立一个HLM处理,点击如下图,一般如果数据是存在SPSS或者STATA,SAS中的选择statapackageinput2.然后我们会看到如下界面,我们一般用的就是2层,假如数据位3层结构,选择HLM3,假如因变量为多个,可以选择下面的MULTIVARIABLE。3.建立文件的界面主要如下图,区域1和区域2是MDM文件的名称与保存,两个名称可以不一样,但是不能空着。区域3是数据类型的选择,假如数据位人嵌套在组中,选择第一个,假如是追踪数据的多个时间点测量,选择第二个。区域4是水平1的界定,区域5是水平2的界定。选择已经在SPSS中编辑好的数据,然后界定第一层的变量和第二层的变量(详见下篇经验)。最后先makemdm然后我们可以检查MDM,出来一些描述性的结果,如下图2,然后我们点击DONE4.点击之后出现下面的界面,水平1的数据下包括右下方的所有变量。然后我们点击因变量,将其设定为产出变量,假如本数据中score为因变量,左击score,选择outcomevariable。5.然后左击自变量,有三种方式,一种是没有中心化的,一种是组中心化的,一组是总体中心化的数据,根据数据类型进行选择,一般假如是原始数据的话选择没有中心化的。6.再者,我们有时候需要将第二层的某些方程中的随机效应改为固定效应,这个时候在HLM6.0中的操作非常简单,只需要将你所需要固定的随机变量点击变为灰色即可,如下图7.然后继续设置第二层的变量,如上一样,注意设置哪个方程首先需要点击一下该方程。8.然后我们就可以运行该程序了。我们也可以先保存再运行,运行之后的结果默认会以hlm2为文件名的txt文档保存在MDM文件所放置的文件夹中。END原作者:delta数据工作室HLM多层线性模型教程:[4]数据输入(spss)|浏览:226|更新:2014-03-0410:0312345分步阅读上一篇我们讲到了如何设置MDM文件,现在我们看看如何建立可以放入HLM中的数据库,以及在HLM的设置界面上如何进行设置。工具/原料HLM6.0SPSS22.0方法/步骤1.首先我们呈现给大家上篇中所采用的数据输入的结果,水平1和水平的spss文件如下图所示。2.我们可以看到水平1的ID和水平2的ID变量名是一样的,然后水平1的ID中为1的有很多个数据,这就是嵌套的结构,水平1嵌套在水平2中,这个一定要一一对应起来。水平2中可以不包含因变量,但是水平1中必须有因变量。3.然后我们回到上一篇所讲到了页面的设置,如下图,水平1的数据文件选择之后,然后我们点击右边的选择变量4.然后我们可以看到下图弹出,选择ID和变量,ID也就是两个文件关联的东西,因此最开始在spss中进行数据输入的时候两个水平用同一个变量名会非常方便,我们这里选择ID变量为ID号,其他的四个变量进入水平15.然后我们继续设置水平2,选择水平2的变量如下图,也将ID变量设置为ID号,其他的三个变量进入水平2.6.6这样我们的输入输入就算完成了。当然HLM还支持其他类型的数据,比如stataSAS等。有兴趣的同学可以继续钻研,因为我们平时处理数据用的最多的是SPSS所以在此只介绍SPSS的数据在HLM中的输入END原作者:delta数据HLM多层线性模型教程:[5]结果解释1|浏览:178|更新:2014-03-0214:2612345分步阅读那么采用HLM软件如何看输出的结果呢?HLM迄今没有中文版本,因此输出结果全部以英文显示。但是其中很多内容是没有什么实质作用,因此我们也很容易对其进行解读。下面来看一个我最近帮别人处理的数据输出结果。工具/原料HLM6.0软件方法/步骤1.在输出的最开始部分说明所用软件的名称、作者和发行公司、技术支持的联系EMail地址、公司的网址和本次运行的时间等。2.以上显示有关文件的存放位置,模型各个层面上的单元个数,程序默认的最大迭代次数被预定为100,如果程序运行了100次迭代后发现模型不能收敛,就会自动询问使用者是否继续运行程序,这个时候,我们只需要输入“yes”即可。模型所用的参数估计方法为限制性极大似然估计(restrictedmaximumlikehood).3.下面是对变量的加权情况描述,本次运算没有对参与计算的变量值进行加权处理。同时表示模型中的因变量名为score。4.下图描述模型中的固定部分,本例中第一层的固定部分由4个参数:截距BO和斜率B1,B2,B3;第二层的固定部分有16个系数。5.然后如下图为模型表达式6.由于篇幅原因,后面的结果请参照下一篇经验。END原作者:delta数据工作室HLM多层线性模型教程:[6]结果分析2|浏览:153|更新:2014-03-0214:47123456分步阅读上一篇我们介绍了结果的前几个部分,这些部分都不是很重要,接下来我将为大家解读后面输出的更重要的部分。工具/原料HLM6.0软件方法/步骤1.下图呈现的是对模型随机部分的信息描述,当前模型中第一层上的随机变异为sigmasquare,第二层的变异包括第一层截距和各个学率系数在第二城上的变异。分别为协方差矩阵和相关矩阵。2.下图为对水平1的截距和斜率信度估计的值,注意后面英文有提示,本次信度估计仅仅是基于16个单元中的14个,因为需要足够的信息进行计算,而固定部分的结果是基于所有的数据。3.下图是最重要的,是固定部分最后的估计。有两个,一个是带有稳健的标准误估计(withroubasterror),一个没有。在本文中由于数据的原因不能进行文件的标准误估计,因此没有呈现出来。4.下图是第一层和第二层各个随机效应的参数估计结果。5.最后给出的是反应当前模型整体你和程度的似然统计结果和模型中估计的参数个数,供未来把该模型和其他模型进行比较时用。END原作者:delta数据工作室分层线性模型(hierarchicallinearmodelHLM)的原理及应用一、概念:分层线性模型(hierarchicallinearmodelHLM)又名多层线性模型(MultilevelLinearModelMLM)、层次线性模型(HierarchLinearMode1)、多层分析(MultilevelAnalysis/Model)。相对于传统的两种统计方法:一般线性模型(generallinearmodelGLM)和广义线性模型(generalizedlinearmodelsGLMs),它们又有所不同,HLM中的线性模型指的是线性回归,不过它与一般的分层线性回归(HierarchicalRegression)又是不同的,具体的不同见下面数学模型部分。HLM又被通俗的称为“回归的回归”。Wikipedia:“一般线性回归和多重线性回归都是发生在单一层面,HLM相对于更适用于嵌套数据(nestdata)。”在理解HLM之前应了解有关回归分析和嵌套设计(分层设计)的基本知识。二、模型:1、假设:由于个体行为不仅受个体自身特征的影响,也受到其所处环境(群体/层次)的影响。相对于不同层次的数据,传统的线性模型在进行变异分解时,对群组效应分离不出,而增大模型的误差项。而且不同群体的变异来源也可能分布不同,可能满足不了传统回归的方差齐性假设。在模型应用方面,不同群体(层次)的数据,也不能应用同一模型。鉴于传统方法的局限性,分层技术则解决了这些生态谬误(EcologicalFallacy)。它包含了两个层面的假设:a、个体层面:这个与普通的回归分析相同,只考虑自变量X对因变量Y的影响。b、群组层面:群组因素W分别对个体层面中回归系数和截距的影响。2、数学模型:a、个体层面:Yij=Β0j+Β1jXij+eijb、群组层面:Β0j=γ00+γ01Wj+U0jΒ1j=γ10+γ11Wj+U1j涉及到多个群组层次的时候原理与之类似,可以把较低级层次的群组,如不同的乡镇层面与不同的县市层面,可以这样理解,乡镇即是一个个体,群组即是不同的县市。更多层次的可以这样理解,一直是下一层对上一层回归系数和截距的回归。与普通的“回归的回归”不同的是,整个计算过程通过迭代过程完成。3、因变量:此处数学模型仅适用于连续的单因变量。非连续因变量、多因变量、潜变量以及非典型的嵌套设计,多层线性模型也可以进行处理,但对模型的设定会更复杂。4、与分层回归的区别:a、向前回归、向后回归和逐步回归:向前回归:根据自变量对因变量的贡献率,首先选择一个贡献率最大的自变量进入,一次只加入一个进入模型。然后,再选择另一个最好的加入模型,直至选择所有符合标准者全部进入回归。向后回归:将自变量一次纳入回归,然后根据标准删除一个最不显著者,再做一次回归判断其余变量的取舍,直至保留者都达到要求。逐步回归是向前回归法和向后回归法的结合。首先按自变量对因变量的贡献率进行排序,按照从大到小的顺序选择进入模型的变量。每将一个变量加入模型,就要对模型中的每个变量进行检验,剔除不显著的变量,然后再对留在模型中的变量进行检验。直到没有变量可以纳入,也没有变量可以剔除为止。向前回归、向后回归和逐步回归都要按照一定判断标准执行。即在将自变量加入或删除模型时,要进行偏F检验。b、分层回归与前三者的区别与联系:在理解分层回归与以上三者的区别时,应理解以下三个概念。总体变异:预测变量X和结果变量Y之间相关的平方,它包括该X和Y之间的所有关系。共同变异:在每个X互相独立的理想情况下,共同变异为0。它指的是X对Y的影响的重叠部分。独特变异:在控制了其他变量以后,特定X对Y的影响。它表示了Y中由特定X所单独解释的变异。假如X之间存在重叠,那么它们共有的变异就会削弱独特变异。X的独特效应指的是去除重叠效应后该X与Y的偏相关的平方。可以看出,X的独特
本文标题:HLM多层线性模型教程
链接地址:https://www.777doc.com/doc-1385709 .html