您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 投融资/租赁 > HLM简易快速入门(第一版)
1HLM简易快速入门(第一版)节约篇幅,前言就写在同页。前言:我尽量不废话。不知道以后会不会更新,暂定为第一版。以张伟豪的HLM课程为基础,做了一些微调。大致按照页面顺序看就OK了,比较容易看得懂。本文档像素较好,建议放大了看。2018.11.092目录HLM简介.........................................................................................................................................1HLM所需的数据档制作.................................................................................................................3HLM的MDM建档.........................................................................................................................5HLM训练案例1..............................................................................................................................7报表制作和结果解读:.........................................................................................................12HLM论文操作流程.......................................................................................................................13HLM计算模式的解读1................................................................................................................15HLM计算模式的解读2................................................................................................................16Rwg(j)..............................................................................................................................................20HLM训练案例2(看完rwg(j)再看本章).................................................................................23HLM训练案例3(重复测量数据的处理)................................................................................26HLM训练案例4(3层数据的处理).........................................................................................28附....................................................................................................................................................29HLM的几大模型...................................................................................................................29各种标准的文献来源.............................................................................................................29后语................................................................................................................................................301HLM简介符号表示①β=B②γ=r=G(output中的写法,来源于γ的读音)③μ=u=U重要概念概念内容两个值平均值(固定效果)方差(随机效果)两种变异组内变异/方差(withinvariance)组间变异/方差(betweenvariance)两个参数截距(平均数)(ANOVA)斜率(干扰(调节)效果分析)两张表格EstimationofFixEffectEstimationofVarianceComponents两个重要指标ICC(1)(内部相关系数IntraCorrelationCoefficient)Rwg(j)(评分者一致性Interrateragreement)Meancenter的两个时机0表示无意义的时候(例如身高为0)Level1时,发现后面需要做交互作用的时候Meancenter的两种方法Level1做Groupmeancenter(组)Level2做Grandmeancenter(总)内生变量(Y)方差的分解可解释变异(R2)(Level1andLevel2)(截距的方差和斜率的方差)不可解释变异(残差)两种解释指标f2=(原组内方差–加入自变量后的组内方差)/原组内方差R2=(因变量方差–组内方差/组间的残差)/因变量方差注:①方差=组内方差+组间方差;②组内方差=组间方差的残差;由于HLM重在分析“层”,所以我们目标在于组间效果,组间效果解释不了的方差被认为是残差;③使用R2公式即可算出标准化解释率(目前学界没人这样做);④在传统回归中,重在于可解释方差的增加,即R2,以此判断解释能力;HLM中,重在于不可解释方差的减小,以及减小的幅度,即f2。⑤交乘项要做meancenter是为了避免变量间的共线性。一般来说,HLM适合的变量数量:Level13个就挺多了(可以放好几个控制变量)Level22个也差不多了(有的人会在这一层放控制变量)Level31个就差不多了Ps:控制变量是没有假设的,一般来说要有文献支撑;另外,如果控制变量不显著,说明这个思路错了。对样本量的要求:250群的时候,收敛就会在7.3%左右,至于每群5个人还是10个人差别都不大。真正有差异的在于第二层的组样本量,但是第二层无论是30还是50人,组内方差都够大。所以,真正需要的样本量,只要50组*5人=250个人就够了。(难在于需要有50个组)文献来源:SufficientSampleSizesforMultilevelModelingHLM分析流程:1.空模型(null或anovamodel)2.仅含Level1自变量的模型(随机ancovamodel或随机系数模型)3.截距模型:仅含Level2的自变量(为类别变量时,是固定效果模型;为连续变量时,是随机回归模型)4.完整模型:level1和Level2同时包含自变量Ps:有的人会在“3”中,既有Level1的自变量,又有Level2的自变量,他们可能是根据Hox的方法来做的,文献来源:MultilevelAnalysisTechniquesandApplications,(2ndEdition),p11-14.3HLM所需的数据档制作我们手上有一批数据,而且有一个假设(如下图),任务就开始了:Ps1:虽然在模型图上,一共有五条回归线,但是处于层2的变量“学校ID”和“教师经验(教龄)”几乎等同(每个学校只调查一位教师),所以在我们的正式假设中,并没有“学校ID→popular”的假设,也因此,图上该假设为蓝色线条。所以我们的正式假设一共四个:①r01;②r10;③r20;④r21。(作为最高等级的分类变量是一个连接一二三层的变脸,不做假设)1.现有变量变量名变量说明学生ID对个案的编号,不计入分析变量内学校ID分类变量,2层自变量,一共100所学校popular连续变量,因变量——Ysex二分变量,1层自变量teachexp连续变量,2层自变量teachpop连续变量,1层自变量2.整合第一层变量,做出第二层分析所需要的数据文档数据→汇总,以学校为分类变量(如果二层有多个变量,则需要将这些变量均选择作为分界变量),将teachexp和teachpop作为目标合成变量。4变量合成说明:1.圆形图标为不需要分析的变量。2.每所学校只调查一位教师,教师教龄是固定的,所以学校ID变量和老师教龄其实是固定组合,处于第二层。3.每位老师教许多学生,每位学生性别(sex)不一样,且每位学生为老师打分不一样(teachpoop),所以这两个变量处于第一层。4.学生受欢迎程度(popular)为因变量。5.由于不同学校的教师可能有相同教龄,所以在进行数据汇总时,需要以学校ID为分界依据,将二层变量(teachexp)和一层变量(teachpop)取组平均值(教龄取平均和未取平均一样),由于第一层的性别(sex)变量为分类(二分)变量,取平均无意义,所以不进行处理。6.完成数据合成。5HLM的MDM建档1.由于我们使用统计数据建档,所以选择该项。2.由于我们的训练文档为二层数据,所以选择HLM2。6数据建档过程说明:临时Ps:界面操作过程中,不要对小黑框有任何操作(例如关掉它)!①为起始位置,首先选择Level1的数据文档。②选择变量时,以学校作为连接性变量(高Level的变量作为连接变量),所以ID栏选择学校ID。一层自变量和因变量均需要在一层文档中选择。③学校作为连接性变量,仍然需要在ID栏选定,并选择二层变量。④以“mdm”为文件后缀名。⑤本线不是操作步骤线,但是建立MDM文件夹时,与该处同名会方便以后的文档寻找。⑥文档中出现了缺失值,而我们在建档时并未选择存在缺失值,因此无法建档。(只有一层档可以选择是否存在缺失值,因为二层档开始,都是取组均值,缺失值对其无法造成影响)并且,由于我们已经选择过保存,所以无法再进行缺失值存在与否的直接修改。⑦找到关键字“missing”后,将后面的“n”改成“y”并保存,则主界面的“MissingData”会自动变成“Yes”(如右图)。(如果直接更改“No”和“Yes”的按钮,并进行建档,将无法建成,只能用此方法进入存档文件进行修改。)PS:如果保存过程中出现如下方框:则是数据未排序,回到SPSS中对SCHID进行升序排序。数据建完后需要按“CheckStats”再按“Done”。7HLM训练案例11.数据建档后,直接进入操作界面,此时将因变量选入:2.直接运行空模型(随机ANOVA模型),并进行结果查看。3.计算出ICC(1)>0.059,和ICC(2)>0.7,本数据适合进行HLM分析。84.加入性别作为自变量,进行运算(随机ANCOVA模型),查看结果:性别作为类别变量,不需要中心化。(如果此处加入的是连续变量,后续又要进行干扰效应验证,则需要选择groupcentered)性别作为类
本文标题:HLM简易快速入门(第一版)
链接地址:https://www.777doc.com/doc-7239564 .html