您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > 第20章 Logistic回归2
Logistic回归的正确应用流行病与卫生统计学教研室姚雪梅非条件Logistic回归模型(二分类)条件Logistic回归模型(二分类)有序分类Logistic模型无序多分类Logistic模型一、非条件Logistic回归模型Logistic回归模型的一般形式单因素Logistic回归多因素Logistic回归Logistic回归模型的一般形式以Y表示二分类应变量,Y的量化取值为:Y=1表示患病、阳性、死亡Y=0表示未患病、阴性、生存令P(Y=1)=π;P(Y=0)=1-π单因素Logistic回归例:为探讨超重和肥胖对高血压病的影响,2004年,某研究者采用整群抽样的方法,对某地35岁以上常住人口进行高血压普查,同时收集了身高、体重等信息。BMI≥25为“超重”,BMI25为“正常”;收缩压≥140mmHg或舒张压≥90mmHg为“高血压”。结果见表不同体质指数高血压患病率BMI(X)调查人数患病(y=1)未患病(y=0)患病率(%)正常(x=0)67921331546119.60超重(x=1)41481656249239.92合计109402987795327.30Logistic回归模型为:模型中回归系数的解释:X=1时(超重):X=0时(正常):优势(比值)odds出现某种结果的概率与不出现某种结果的概率之比。即odds=π/(1-π)优势比(比值比)oddsratioOROR1危险因素OR=1对疾病无作用OR1保护因素OR值的解释与自变量编码的关系1.当自变量为二分类变量时,编码为0-1或1-2注意:对应变量Y=1的影响大的自变量的水平,编码也大。2.当自变量为连续型变量时,不需编码表示自变量X每增加一个单位得到的比值比的自然对数例如:前列腺癌患者淋巴组织有无转移与年龄(X)回归模型实际工作中,常把连续型变量→等级资料来解释。3.当自变量为有序分类变量时,一般按等级对疾病影响的顺序由大到小编码。(各等级对应变量的影响是线性变化的)例:淋巴结有无转移与某恶性肿瘤分级Ⅰ、Ⅱ、Ⅲ、Ⅳ的回归模型,表示肿瘤分级每增加一个等级,淋巴结转移危险性增加1.69倍。4.当自变量为无序分类变量时,常用哑变量(假变量)编码;无序分类变量的水平数(分类数)为n,需产生n-1个哑变量。例:白血病发病与血型的关系:Y=1患白血病;Y=0表示未患白血病多因素Logistic结果的解释参照单因素涉及到自变量筛选问题例:为研究内源性儿茶酚胺水平(CAT)与冠心病(CHD)发病的关系,分别随访CAT高和低两组人群7年期间冠心病发病数。在分析时考虑年龄(AGE55和≥55)和心电图异常(EGC有=1,无=0)的混杂作用。得到下表:二、条件Logistic回归1:1配对设计的Logistic回归模型例:1:1配对病例-对照研究。某市调查三种生活因素与胃癌发病的关系,设计时采用配对病例-对照形式,按每一个病例的性别、年龄和居住地选取一个健康对照。共调查50对病例与对照。资料见表三种生活因素的取值变量名取值范围不良饮食习惯x10—4,(0表示无,4表示很多)喜欢吃卤食和盐渍食物x20—4,(0表示不吃,4表示非常喜欢吃)精神状况x30表示差,1表示好50例胃癌病例与对照三种生活因素调查结果NO病例对照X1X2X3X1X2X3124031022010313121001…………………50210000建立模型:P(一对中只有一人得病)=P(A得病)P(B不得病)+P(A不得病)P(B得病)在病例和对照中只有1人得病的条件下恰好是A得病的条件概率为P(A得病|一对中只有一人得病)=P(A得病)P(B不得病)P(A得病)P(B不得病)+P(A不得病)P(B得病)有序多分类Logistic模型最常用的是累积Logistic回归模型用c-1个方程描述自变量与因变量的关系例研究性别和两种治疗方法对某病疗效的影响。疗效的评价分为3个有序等级:显效、有效、无效,分析疗效与性别和治疗方案的关系。设某女性病人,接受了新疗法,则得:显效的概率为0.61,有效的概率0.18,无效的概率0.21无序多分类Logistic模型例:研究不同细胞分化程度(X1)和细胞染色(X2)与恶性肿瘤组织类型(Y)的关系,得到资料如表,分析细胞分化程度和细胞染色与组织类型的关系。得到两个回归方程:以大细胞癌水平3为基准,分别用两个回归进行水平1与水平3、水平2与水平3的比较。X1的系数均为正值,说明分化程度高,鳞癌和腺癌的危险高于大细胞癌的危险X2的系数均为负值,说明细胞染色阳性,鳞癌和腺癌的危险高于大细胞癌的危险小结应用可分以下几点:1.危险因素的筛选2.校正混杂因素3.预测和判别注意事项多变量Logistic回归可以对自变量进行筛选,但不要完全依赖计算机,分析者可根据经验选入部分自变量Logistic回归模型的自变量可以是无序分类变量、有序分类变量和数值变量多数情况下,常数项没有多大意义,因此不需要对其进行解释
本文标题:第20章 Logistic回归2
链接地址:https://www.777doc.com/doc-3271581 .html