您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > Logistic回归的初步应用.
1、Logistic回归的初步应用汇报人:吴迪2015-5-13哑变量相关结果的解释三Logistic回归概述一SPSS中哑变量的设置二一、Logistic回归概述(一)应用背景•Logistic回归模型是一种概率模型•适合于病例—对照研究、随访研究和横断研究•结局变量取值必须是二分类或多项分类变量一、Logistic回归概述(二)与多重线性回归的区别与联系联系:用于分析多个自变量与一个因变量的关系目的是矫正混杂因素、筛选自变量和更精确地对因变量作预测等。一、Logistic回归概述(二)与多重线性回归的区别与联系区别:线性模型:因变量为连续性随机变量,且要求呈正态分布Logistic回归:因变量的取值仅有两个,不满足正态分布一、Logistic回归概述)110exp(111pXpXp)exp(1)exp(110110ppppXXXXp(三)Logistic回归模型令:y=1发病(阳性、死亡、治愈等)y=0未发病(阴性、生存、未治愈等)将发病的概率记为P,它与自变量x1,x2,…,xp之间的Logistic回归。
2、模型为:可知,不发病的概率为:一、Logistic回归概述(三)Logistic回归模型经数学变换得:定义:为Logistic变换,即:ppXXpp110)]1/(ln[)]1/(ln[)(logpppitppXXpLogit110)(一、Logistic回归概述(四)Logistic回归分析的步骤变量的编码哑变量的设置和引入变量的筛选输出结果的解释二、SPSS中哑变量的设置(一)哑变量的定义和目的定义:哑变量又称虚设变量、虚拟变量或名义变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。目的:将不能够定量处理的变量量化。二、SPSS中哑变量的设置(二)哑变量的优势比–哑变量的个数为n-1(n为取值个数);–哑变量的优势比表示自变量的某个取值与对照取值的优势比;–等级变量转换为哑变量后,还可以分析多个等级之间的优势比,公式为exp(bi-bj)。二、SPSS中哑变量的设置案例:某研究人员在探讨影响肾细胞癌是否转移的有关临床病理因素的研究中,收集了一批根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料进行Lo。
3、gistic回归分析。二、SPSS中哑变量的设置x1x2x3x4x5y1.59.02.043.42.01.00.02.36.01.057.21.01.00.03.61.02.0190.02.01.00.04.58.03.0128.04.03.01.05.55.03.080.03.04.01.06.61.01.094.42.01.00.07.38.01.076.01.01.00.08.42.01.0240.03.02.00.09.50.01.074.01.01.00.010.58.03.068.62.02.00.011.68.03.0132.84.02.00.012.25.02.094.64.03.01.013.52.01.056.01.01.00.014.31.01.047.82.01.00.015.36.03.031.63.01.01.016.42.01.066.22.01.00.017.14.03.0138.63.03.01.018.32.01.0114.02.03.00.019.35.01.040.22.01.00.020.70.03.0177.24.03.01.021.65.0。
4、2.051.64.04.01.022.45.02.0124.02.04.00.023.68.03.0127.23.03.01.024.31.02.0124.82.03.00.025.58.01.0128.04.03.00.026.60.03.0149.84.03.01.0二、SPSS中哑变量的设置•因变量–Y:肾细胞癌转移情况(有转移y=1;无转移y=0)•自变量(临床病理因素)–X1:确诊时患者的年龄(岁)–X2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级(1-3)–X3:肾细胞癌组织内微血管数(MVC)–X4:肾癌组织核组织学分级,由低到高共4级(1-4)–X5:肾细胞癌分期,由低到高共4期(1-4)二、SPSS中哑变量的设置•在菜单上选择–Analyze==》Regression==》BinaryLogistic...,–系统弹出Logistic回归对话框如下:二、SPSS中哑变量的设置二、SPSS中哑变量的设置Block:选入自变量分组。Covariates:选入自变量。“﹥a*b﹥”:选入交互作用项。Method框:Enter,Forward,。
5、Backward,Conditional,LR,WaldSelectionvariable框:限制进入回归分析的条件。二、SPSS中哑变量的设置Categorical子对话框:用于设置全哑变量模型中各哑变量的取值方式的。Covariates框:列出所有数值型自变量,它们均可被指定为分类变量。ChangeContrast框组:用于设置每个变量的哑变量组中的具体取值和对照组。二、SPSS中哑变量的设置Contrast列表:用于选择哑变量取值情况:Indicator:为系统默认值。也是最常用的比较方法。Simple:反映的是三分类的平均效应。Difference:除第一类外,各分类与前各分类的平均效应相比较。Helmert:与Difference相反,除最后一类外,各分类与其后各分类的平均效应相比较。Repeated:除第一分类外,各分类与其前一分类相比较。二、SPSS中哑变量的设置三、哑变量相关结果的解释上表为记录处理情况汇总,即有多少例记录被纳入了下面的分析,可见此处因不存在缺失值,26条记录均纳入了分析。三、哑变量相关结果的解释应变量分类情况列表应变量:Y=1,有转移;Y=0,无转移。
6、图示:无转移→0;有转移→1三、哑变量相关结果的解释哑变量编码(例x5)1=0,0,02=1,0,03=0,1,04=0,0,1分类变量的编码三、哑变量相关结果的解释偏回归系数(B);标准误(SE);Wals卡方值;自由度(df);P值(sig);OR值;OR值的95%可信区间(CI)。方程中的变量三、哑变量相关结果的解释这个表格为方程的似然值改变情况的检验。此处应以似然比检验为准,因为它是全局性的检验。三、哑变量相关结果的解释X2、X4应该在方程中。肾细胞癌血管内皮生长因子(X2)、肾癌组织核组织学分级(X4)是影响肾细胞癌是否转移的临床病理因素。。
本文标题:Logistic回归的初步应用.
链接地址:https://www.777doc.com/doc-2885412 .html