您好,欢迎访问三七文档
三、结构方程模型的基本观念(一)结构方程模型是什么结构方程模型可以说,就是「路径分析(pathanalysis)」和「因子分析(factoranalysis)」的结合体。它的用途,与大家所熟悉的多元回归分析十分相似,但是不同的地方在于,结构方程模型是一种更为强大的统计方法,在构造模型和估计参数的过程里,可以直接处理多组方程间的互动干扰、非线性关系、不独立(相关)的自变量、残差相关、衡量误差、以及将多组相依的衡量模型共冶于一个单一模型当中。事实上,我们可以将结构方程模型视为「广义线性模型(generallinearmodel:GLM)」的延伸,它的强大功能,绝对可以用来取代我们惯用的回归分析、路径分析、因子分析、时间序列分析、甚至共变量分析。不过限于篇幅,本书将聚焦于结构方程模型在因子分析、潜变量路径分析、和一般路径分析上的应用。相对于多元回归分析,结构方程模型在应用上的限制也较少,关键的亮点包括在进行「路径分析」的时候,即使自变量间存在明显的共线性(multi-collinearity),结构方程模型依然可以照单全收,丝毫不影响其解释上的有效性。利用结构方程模型来进行「验证性因子分析」,更可以通过将多个可观测变量指定给单一潜变量,从而可以在根源处直接降低衡量误差。尤其在残差的处理上,很少有统计方法可以这么方便地直接检查每一个可观测变量的残差,甚至操弄这些残差之间的相关。结构方程模型在路径系数的处理上也高人一等,不仅可以同时估计多个自变量对多组因变量的关系,还能够进行多样本多模型之间的系数比较。最重要的优势是,结构方程模型不仅仅可以估计单一参数的系数,还能够直接估计整体模型的拟合度,这是许多传统统计方法所望尘莫及的。如前所述,结构方程模型的主要用途,其实是用来验证研究者心中对于他所想象世界的猜想,而不是用来探索一个新的世界。换言之,在应用结构方程模型的一开始,大多数的研究者在他的心中,早已存在某些定见了。这些定见的存在形式,大抵上可以分成两种:(1)研究者想要检验他的某个想法是否正确,于是构造了一个结构方程模型,在代入真实数据对模型进行估计后,研究者可以根据拟合指标的好坏,来判断真实世界里的数据,和他所构造的模型之间是否一致,从而明白他原先的想法是否可以接受。(2)研究者根据不同理论,得出两种或两种以上可以用来描述这个世界的不同看法,然后针对这些不同看法,分别构造出不同的结构方程模型来,在代入真实数据分别对这些模型进行估计后,研究者可以根据拟合指标的好坏,来判断究竟哪种看法,更加切合实际。尽管如此,我们还是可以在文献中看到有些研究者,利用结构方程模型来进行模型探索,而不是正确使用结构方程模型,来验证心中事先设定的模型猜想。例如有些研究者在验证原先设定好的结构模型时,发现拟合指标很差,于是通过「修正指标(modificationindex)」的暗示,「为数字而数字」地对模型任意调整改动,直到拟合指标达到及格标准为止。当然这样的作法并不可取,因为通过这种过程而勉强予以接受的结构模型,可能只是刚好反映了这组特定样本的特征,而不是因为模型本身可以放诸四海而皆准,换句话说,是因为这组特定样本造就了一个事先想象不到、缺乏理论依据的模型,而不是通过真实数据,验证了一个具有理论深度的模型。这样的模型即使拟合指标合格了,可能还是缺乏外部效度,我们很难接受这样的模型会是能够代表事实真理的模型。对于这种情形下所构造出来的结构方程模型,研究者有必要使用多组不同的样本,对相同模型进行多次验证,也就是「强韧度测试(robusttests)」,如果多组样本都证实了相同结构模型的「拟合指标」都是及格的,那么我们才能够正式接受这个结构方程模型。(二)结构方程模型的前提假定如前所述,结构方程模型在应用上的限制相对已经较少了,但是它和其他的多变量分析技术一样,在实际应用的时候,仍然有其特定的前提假定必须遵守。(1)结构方程模型里面的「可观测变量」必须服从正态分布。(2)结构方程模型里面作为「因变量」的「潜变量」必须服从正态分布。(3)线性关系的假定(4)潜变量的假定(5)多元的可观测变量(6)不存在多重共线性的假定(7)残差独立的假定(8)不存在接近零的协方差矩阵(covariancematrix)(9)适当的样本大小(1)结构方程模型里面的「可观测变量」必须服从正态分布。由于在估计结构方程模型的拟合指标时,我们所采用的最基本工具是卡方检定(chi-squaretest),卡方检定对于变量的正态性(normality)十分敏感,即使轻微的违背这个要求,都可能导致卡方检定结果发生很大的偏差。同时,大多数结构方程模型在估计参数时所采用的方法都是「极大似然估计法」,这方法在应用时的基本前提也是变量的正态性,尤其对于模型中「内生变量(endogenousvariables)」的正态性更是严格要求,因此「可观测变量」服从正态分布,是进行结构方程模型时不可回避的必要条件。这里补充说明一下,如果「可观测变量」不服从正态分布,但是其残差却:(a)服从正态分布,(b)所有残差的方差都很接近(代表残差同质),(c)残差间彼此独立(也就是不相关),这时卡方的估计结果还是不偏的。不过这三个条件看来比要求「可观测变量」服从正态分布还要困难。在实务上,避免违背这个条件的简易方法,首先就是尽可能不去使用「顺序尺度(ordinalscale)」或是「名目尺度(nominalscale)」这种「类别的」,或是「离散的」变量衡量方法。其次,在万不得已必须使用类别型变量衡量的时候,还可以选用一些「转换(transformation)」技术,来「正态化(normalize)」那些有问题的变量。所谓「转换」,就是根据变量的分布特征,通过数学代换,将原本不属于正态分布的变量,设法将之转变成具有正态分布性质的变量。常见的转换技术包括:取平方根(squareroot)、取自然对数(logarithmic)、或是函数1/x反转(inverse)等等,其中函数反转优于取自然对数,自然对数又优于取平方根。例如,对于服从「卜瓦松(Poisson)」分布的变量,我们通常直接对它取平方根,即可赋予变量正态分布的特征;对于百分比形式的变量,「反正弦(arcsine)」处理也许是个好方法;对于二项式分布的变量,通常使用的方法是通过「胜率(Odds)」转换成概率后,再利用自然对数函数log(p/(1-p))进行转换;对于「韦布(Weibull)」型「极值分布(extremevaluedistribution)」形式的变量,则使用反转函数log(-log(1-x))进行转换。无论如何,这些变量转换必须有根有据,确实依据数学原理让变量获得正态分布的性质,否则再怎么奇巧转换也是无益的。最后,当然还需要利用一些统计方法,来验证模型中所使用的「可观测变量」的正态性。这些方法包括QQ-plot,Shapiro-WilkStatistic,或是Kolmogorov-SmirnovStatistic等等,兹不赘叙。(2)结构方程模型里面作为「因变量」的「潜变量」必须服从正态分布。所以结构模型里面,所有的「因变量」都不可以被设计成类别型变量的形式。如果万不得已必须使用类别衡量的变量作为因变量,那么必须改用「类别型潜变量分析(latentclassanalysis:LCA)」方法处理,一般的结构方程模型软件并不能处理这种问题。坊间存在若干特殊的统计软件是专门用来处理这种类别型潜变量问题的,例如StatisticalInnovations公司的LatentGOLD软件(商业软件),或是JeroenVermunt博士的LEM(自由软件)。(3)线性关系的假定结构方程模型预设了所有的「可观测变量」和它们所属的「潜变量」之间,以及「潜变量」和「潜变量」之间的关系,都必须是线性的。不过这倒不至于构成太严重的限制,因为就和一般的回归分析一样,对于我们所假定的变量间的非线性关系,我们仍然可以针对变量进行函数转换,来适应这个变量间必须是线性的要求。(4)潜变量的假定在结构方程模型里面,我们基本上假定所有的路径关系,都只能采用非直接衡量的方式加以处理,也就是只存在「潜变量路径分析」。(5)多元的可观测变量在结构方程模型中,所有的「潜变量」都必需由至少三个以上的「可观测变量」来加以描述,如果只有一个「可观测变量」在解释着某个特定的「潜变量」,那么这就不是结构方程模型,而是回归分析。如果只有两个「可观测变量」在解释着某个特定的「潜变量」,那么在模型中,这两个「可观测变量」必须被正式地表述(specify)为相关,通过对这个相关的估计(等于新增一个可观测变量),才能够避免因为「可观测变量」不足所导致的「识别不足(underidentification)」问题,如果「识别不足」,则模型将受制于自由度不足而无法求解,连带的,当然也无法估计模型的「拟合指标」。一个衡量模型至少必须满足「恰好识别(justidentification)」的条件才可能求解。「恰好识别」的模型又称为「饱和模型(saturatedmodel)」,也就是模型所构造的协方差矩阵(港台称为共变异矩阵,covariancematrix)中的元素数量,刚好和所需要估计的参数数量相等,这时在估计参数的时候,刚好用尽了所有的自由度,所以参数虽然可以被估计出来,但是却也因此而无法估计「拟合指标」,因为没有自由度的估计,其实就等于是真实的计算,也就是百分之一百的拟合,或者这么说,其实根本就没有拟合的概念可言。在这样的情形下,用来估计结构方程模型的软件,不论是Lisrel还是AMOS,都将会报告自由度为0,卡方值为0,同时无法计算显著水平。研究者真正想要的其实是「过度识别(overidentification)」,「过度识别」代表已知变量间的协方差数量,大于未知的待估计参数的数量,所以这时模型的自由度将会是正的数值,我们才能够应用结构方程模型的软件来估计参数,同时计算出模型的各种「拟合指标」来。事实上由信度的立场来看这个问题,越多的「可观测变量」通常其结构信度也较佳,这可由Cronbach'salpha信赖系数的计算即可清晰观察出来,在同一个构念中,当我们放入的近似的衡量题项愈多,Cronbach'salpha的值很容易就可以升高。所以在构造衡量题项的时候,最好尽可能从多维度多视角的多元观点来广泛采纳「可观测变量」,不要吝惜于「可观测变量」被纳入研究工具中的数量。毕竟在研究工具接受前测中效度信度检查的时候,就可能开始删减题项了,再加上田野调查之后,根据大规模数据进行衡量模型的效度信度检查时,还可能继续删减题项,如果原始题项不足,在最后的结构模型分析阶段,就很可能发生「识别不足」或是「恰好识别」的问题,为研究过程带来无谓的麻烦。(6)不存在多重共线性的假定和多元回归分析一样,结构方程模型假定了模型中的变量之间,不存在共线性的问题。但是由于结构方程模型的优势之一,就是可以在模型中直接将共线性清晰地予以表述(specify)出来,所以,本质上,结构方程模型还是可以处理多重共线性的问题。不过,如果这多重共线性十分严重,在最极端的情形下称之为完全共线,那么就会导致模型中出现「奇异(singular)矩阵」,由于「奇异矩阵」是无法进行某些矩阵代数运算的,例如就不能进行转置(inverse)运算,结果就会使得结构方程模型无法求解。(7)残差独立的假定和多元回归分析一样,结构方程模型也假定了模型中可观测变量的残差之间是不存在相关的。但是由于结构方程模型中,我们一样可以将这些相关的残差,直接在模型中清晰地表述出来,所以结构方程模型还是可以处理残差相关的问题。只是要在模型中定义某些残差的相关,并不是随心所欲想要相关就相关的,更不应该只是单纯为了改善模型拟合指标,才让某些残差在模型中表述为相关,设计模型的要点就是要掌握理论依据,实事求是,必须能够合理解释某对残差间为何必然存在相关,这才可以在模型中表述为相关。(8)不存在接近零的协方差矩阵(covariancematrix)结构模型本身必须真有意义,而不是潜变量的瞎拼瞎凑。如果结
本文标题:结构方程模型
链接地址:https://www.777doc.com/doc-7325450 .html