您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 招聘面试 > 第五讲第三部分-定序回归
量化研究与SPSS实现QUANTITATIVEANALYSIS&SPSS王存同中央财经大学第五讲定序logit模型第1章SPSS简介SPSS初中级培训实用教程定序变量在社会科学研究的分类变量或离散变量中,一些变量在测量层次上被分为相对次序(或有自然的排序)的不同类别,但并不连续,这类变量称之为定序变量(ordinalvariable),其对应的数据称之为排序数据(ordereddata)。如职业声望、阶层高低、政治态度、满意度(很满意、满意、不满意、很不满意)等。通过这类变量,我们可以知道不同类别之间有相对的大小或高低程度,但是无法从经验信息中获得不同类别之间明确而连续的距离。范例问题:你觉得自己幸福吗?选项:1.很不幸福2.不太幸福3.还过得去4.有点幸福5.非常幸福问题:你的英语程度如何?选项:1.不知道2.会一点3.好4.非常好若对上述定序变量继续使用MNL,将无视数据内在的排序,会导致排序信息的缺失,从而使统计结果会因为遗漏掉排序信息而丧失统计效率;若使用OLS,则是将定序变量视为连续变量处理,会导致人为的信息膨胀。同时,使用不当回归,回归偏倚问题及一致性问题无法解决。因此,针对定序因变量(ordinaldependentvariable)需采用对应的模型,即定序logit/probit模型(orderedlogit/probitmodel,OLM)。反之,若针对定类(nominal)变量采用定序回归,则意味着对不同类别强加了不适当的顺序,并假设其斜率彼此平行,此时的统计结果会存在偏误或出现无意义的估计值。不过,从本质上而言,定序logit/probit模型也是二分类logit/probit模型的一种自然延伸运用,该种模型也被称为累积(cumulative)logit/probit模型。若假设随机扰动项符合logistic分布,则采用logit模型;若假设随机扰动项符合正态分布,则采用probit模型。定序(累积)Logit模型cumulativelogitmodel,CLM图定序因变量多元logit分布图定序因变量的切割点(cutpoints)SPSS操作选项说明数据文件:data14-8.sav实例1:药物疗效数据文件:data14-8.sav该项只选多分类与定序变量,二分类连续变量直接选入协变量。注:笔者SPSS16不能执行,遂改用SPSS18.0运行。输出结果与解释已经(1)回归系数解释与模型筛选与都与二分类logit模型相同。即回归系数(1,2,,)kkp 表示在控制其它变量的条件下,某一自变量kX改变一个单位,logit(())ijpYj或对数风险比的平均改变量。k反映了自变量kX对因变量类别Yj的效应大小。当0k时,表示kX与因变量Y独立,即kX对于Y的贡献没有统计学意义;当0k时,表示随kX的增加,Y更有可能落在定序因变量分类值较大的一端;当0k时,表示随kX的增加,Y更有可能落在定序因变量分类值较小的一端。(2)回归结果中之所以未包含截距项,是由于为了保证参数可识别性的需要、SPSS对其参数进行标准化的后果。(3)结果中Threshold1、Threshold2、Threshold3为三个切点(123)的参数值(因该定序因变量含4个次序)。作为辅助参数(ancillaryparameters),切点参数值可以解释为:当y估计值*1.219(Threshold1)1yy时,;当*1.2191.329(Threshold2)2yy时,;当*1.3294.404(Threshold3)3yy时,;当*4.4044yy时,。值得注意的是,这种对切点参数的解释对定序因变量的各种回归模型都适用。此前实例2:幸福感SPSS18.0提示:将年份转化为虚拟变量。协变量中既可为二分变量也可为连续变量,不可为多分类或定序变量。因子中须为多分类或定序变量。输出主要结果及解释全局性检验,p0.05说明模型有统计学意义。两个拟合优度检验结果都为p0.05,说明模型拟合较差。这张表是输出结果的核心部分,学员试解释之。(1)回归系数解释与模型筛选与都与二分类logit模型相同。即回归系数(1,2,,)kkp 表示在控制其它变量的条件下,某一自变量kX改变一个单位,logit(())ijpYj或对数风险比的平均改变量。k反映了自变量kX对因变量类别Yj的效应大小。当0k时,表示kX与因变量Y独立,即kX对于Y的贡献没有统计学意义;当0k时,表示随kX的增加,Y更有可能落在定序因变量分类值较大的一端;当0k时,表示随kX的增加,Y更有可能落在定序因变量分类值较小的一端。(2)回归结果中之所以未包含截距项,是由于为了保证参数可识别性的需要、SPSS对其参数进行标准化的后果。(3)结果中Threshold1、Threshold2为2个切点(12)的参数值(因该定序因变量含3个次序)。作为辅助参数(ancillaryparameters),切点参数值可以解释为:当y估计值*1.492(Threshold1)1yy时,;当*1.4921.468(Threshold2)2yy时,;当*1.4683yy时,。值得注意的是,这种对切点参数的解释对定序因变量的各种回归模型都适用。图比例优势模型假定条件的检验结果解释:在OLM中,有比例优势平行的假定,但这里p0.001,说明该假定成立,提示用OLM不太适当,可采用MNL或Loglinear模型等。Seeyou...
本文标题:第五讲第三部分-定序回归
链接地址:https://www.777doc.com/doc-7352138 .html