您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第5章 广义与一般线性模型及R使用(王斌会)
多元统计分析及R语言建模第5章广义与一般线性模型及R使用王斌会教授多元统计分析及R语言建模多元统计分析及R语言建模数据的分类与模型选择、广义线性模型概述、Logistic回归模型、对数线性模型、一般线性模型的计算。要求学生针对因变量和解释变量的取值性质,了解统计模型的类型。掌握数据的分类与模型选择方法,并对广义线性模型和一般线性模型有初步的了解。内容与要求5广义与一般线性模型及R使用1.变量的取值类型:因变量y∈连续变量“0−1”变量或称二分类变量有序变量等级变量多分类变量连续伴有删失变量解释变量x∈连续变量分类变量等级变量5广义与一般线性模型及R使用2.模型选择方式:基本公式yX连续变量0-1变量有序变量多分类变量连续伴有删失连续变量线性回归方程logistic回归模型累积比数模型对数线性模型对数线性模型多分类logistic回归模型cox比例风险模型分类变量实验设计模型(方差分析模型)连续变量分类变量协方差分析模型2()0,cov()YXeEeeI5广义与一般线性模型及R使用表5.1广义线性模型中的常用分布族5广义与一般线性模型及R使用5广义与一般线性模型及R使用说明与举例2、Logistic模型:函数形式其中参数估计采用极大似然估计。对45名驾驶员的调查结果,其中四个变量的含义为:x1:表示视力状况,它是一个分类变量,1表示好,0表示有问题;x2:年龄,数值型;x3:驾车教育,它也是一个分类变量,1表示参加过驾车教育,0表示没有;y:分类变量(去年是否出过事故,1表示出过事故,0表示没有)。5广义与一般线性模型及R使用d5.1=read.table(clipboard,header=T)#读取例5.1数据logit.glm-glm(y~x1+x2+x3,family=binomial,data=d5.1)#Logistic回归模型summary(logit.glm)#Logistic回归模型结果得到初步的logistic回归模型:(1)建立全变量logistic回归模型:程序与结果5广义与一般线性模型及R使用logit.step-step(logit.glm,direction=both)#逐步筛选法变量选择由此得到新的logistic回归模型:(2)逐步筛选变量logistic回归模型:summary(logit.step)#逐步筛选法变量选择结果程序与结果5广义与一般线性模型及R使用pre1-predict(logit.step,data.frame(x1=1))#预测视力正常司机Logistic回归结果p1-exp(pre1)/(1+exp(pre1))#预测视力正常司机发生事故概率pre2-predict(logit.step,data.frame(x1=0))#预测视力有问题的司机Logistic回归结果p2-exp(pre2)/(1+exp(pre2))#预测视力有问题的司机发生事故概率c(p1,p2)#结果显示(3):预测发生交通事故的概率程序与结果5广义与一般线性模型及R使用说明与举例3、对数线性模型:函数形式式2含有交叉效应某企业想了解顾客对其产品是否满意,同时还想了解不同收入的人群对其产品的满意程度是否相同。满意不满意合计高533891中434108542低11148159合计598194792在R语言中,数据需变形为:用y表示频数,x1表示收入人群,x2表示满意程度5广义与一般线性模型及R使用程序与结果(1)建立Poisson对数线性模型:从检验结果可看出,p1=0.00310.01,p20.01,说明收入和满意程度对产品有重要影响5广义与一般线性模型及R使用说明与举例1、完全随机设计模型:函数形式其中𝜇表示观察结果𝑦𝑖𝑗的总体均值,𝛼𝑖是哑变量的系数,称为A因素各水平的主效应,𝑒𝑖𝑗是误差项。设有3台机器,用来生产规格相同的铝合金薄板。现从3台机器生产出的薄板中各随机抽取5块,测出厚度值,见下表,试分析各机器生产的薄板厚度有无显著差异?机器12.362.382.482.452.472.43机器22.572.532.552.542.562.61机器32.582.642.592.672.662.625广义与一般线性模型及R使用d5.3=read.table(clipboard,header=T)#读取例5.3数据anova(lm(Y~factor(A),data=d5.3))#完全随机设计模型方差分析P0.05,说明各机器生产的薄板厚度有显著差异。(1)数据格式为:程序与结果5广义与一般线性模型及R使用说明与举例2、随机单位组设计模型:函数形式其中为总均数,i为处理因素A的第i个水平的效应;j为第j个单位组的效应,eij为误差项。使用4种燃料,3种推进器作火箭射程试验,每一种组合情况做一次试验,则得火箭射程列在下表中,试分析各种燃料A与各种推进器B对火箭射程有无显著影响?BAA1A2A3A4B1582491601758B2562541709582B36535163924875广义与一般线性模型及R使用d5.4=read.table(clipboard,header=T)#读取例5.4数据anova(lm(Y~factor(A)+factor(B),data=d5.4))#随机单位组设计模型方差分析PA0.05,说明各种燃料A对火箭射程有无显著影响,PB0.05,说明各种推进器B对火箭射程也无显著影响。(1)数据格式为:程序与结果5广义与一般线性模型及R使用关于40个不同年龄(age,定量变量)和性别(sex,定性变量,用0和1代表女和男)的人对某项服务产品的观点(y,二水平定性变量,用1和0代表认可与不认可)的数据。一、数据管理二、R语言操作拟合的模型为:Case4=read.table(clipboard,header=T);Case4fm=glm(y~sex+age,family=binomial,data=Case4)fmsummary(fm)attach(Case4)Pr=predict(fm,data.frame(list(sex,age)))#模型预测p=exp(Pr)/(1+exp(Pr))cbind(sex,age,y,p)plot(age,Pr)detach(Case4)谢谢!
本文标题:第5章 广义与一般线性模型及R使用(王斌会)
链接地址:https://www.777doc.com/doc-4419979 .html