您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 应用商务统计-线性回归
首都经济贸易大学统计学院线性回归案例介绍背景、目标、变量和分析案例背景目前中国的资本市场逐渐成熟,投资于股市成为众多企业乃至个人的重要理财方式。因此利用上市公司当年的公开的财务指标对起来年盈利状况予以预测就成为投资人最重要的决策依据。本案例随机抽取深市和沪市2002年和2003年各500个样本,对上市公司的净资产收益率(returnonequity,ROE)进行预测。案例目标与变量目标:盈利预测因变量:下一年的净资产收益率(ROE)自变量:当年的财务信息样本容量:2002年500;2003年500自变量ROEt:当年净资产收益率ATO:资产周转率(assetturnoverratio)LEV:债务资本比率(debttoassetratio)反映公司基本债务状况PB:市倍率(pricetobookratio)反映公司预期未来成长率ARR:应收账款/主营业务收入(accountreceivableovertotalincome)反映公司的收入质量自变量PM:主营业务利润/主营业务收入(profitmargin)反映公司利润状况GROWTH:主营业务增长率(salesgrowthrate)反映公司已实现的当年增长率INV:存货/资产总计(inventorytoassetratio)反映公司的存货状况ASSET:(对数)资产总计(log-transformedasset)反映公司的规模对模型的进一步分析哪个自变量在预测方面最有用?哪个自变量是最重要的?如何使用模型进行预测?描述分析获得对数据的整体性认识读取数据在SPSS中打开数据文件roe.sav在R环境下将数据读入系统并显示,使用如下语句:数据的概括性度量SPSS:AnalyzeDescriptiveStatisticsExploreR语句:变量间相关性分析SPSS:AnalyzeCorrelateBivariateR语句:SPSS:GraphScatterR语句:plot(a1$ROEt,a1$ROE)模型的建立模型、假设和参数估计模型形式及假设线性回归模型模型假设独立性假设同方差假设正态性假设iippiiixxxy22110参数估计模型:最小二乘估计量:方差估计量:iippiiixxxy22110222110ˆˆˆˆippiiixxxyRSS1ˆ2pnRSS拟合优度总平方和残差平方和R-Square2yySSTi2ˆiiyySSESSTSSER12参数估计的软件实现SPSS:AnalyzeRegressionLinearR语句:lm1=lm(ROE~ROEt+ATO+PM+LEV+GROWTH+PB+ARR+INV+ASSET,data=a1)summary(lm1)显著性检验F检验假设检验统计量拒绝域iHvsiHii0:0:10,1/~/1pnpSSTSSEpFFSSEnp,1,1pnpFFT检验假设检验统计量拒绝域0:0:10iiHvsH1ˆ~ˆinpTtvx2/1,1pntT显著性检验的结论从F检验的结果看,模型的线性关系是显著的。从T检验的结果看,ROEt和LEV两个变量通过了检验,GROWTH变量在显著性水平降至0.1时也可以通过检验,因此这三个变量与因变量的线性关系较为显著。注意,这不说明应该删除其它变量!模型的诊断异方差性、非正态性、异常值同方差性检验同方差性检验同方差性检验同方差性检验正态性检验若,并且则有),(~2NtqPtqPt正态性检验,zq.zq进一步可以得到以及所以在正态性假设下,残差与应该成线性关系。zt正态性检验Q-Q图残差:将残差排序:Y:X:n,,,21n21n,,,21nnnnzzz//2/1,,,将上面的方法应用于本案例目标1:检验模型是否符合三个假设目标2:找出异常值SPSS实现方法:以预测值为X轴,残差为Y轴画散点图;画Q-Q图R语句:par(mfrow=c(2,2))#设置画图为2x2的格式plot(lm1,which=c(1:4))#画出lm1中对应于模型检验的4张图,包括残差图、QQ图和Cook距离图检验发现47号数据为异常值,需要将其消除语句:a1=a1(-47)多重共线性含义及检验什么是多重共线性?如果存在如下回归方程能不能把它变成下面这样如果对这个方程进行回归会发生什么事?bxayxbxbay21第一个例子假如有两个变量x1和x2,用最小二乘法得到如下参数估计量。第二个例子假如有三个变量x1、x2和x3,用最小二乘法得到如下参数估计量。方差膨胀因子定义下面的回归形式为辅助回归令为辅助回归的判定系数则方差膨胀因子为:它反映了在多大程度上第i个自变量所包含的信息被其他自变量覆盖2iRexbaxijjji211iiRVIF方差膨胀因子R语句:所有的VIF值都小于10且接近1,所以没有多重共线性问题。变量的选择AIC和BICAIC方法比较保守,其中p为自变量个数,与RSS成反比。使AIC达到最小的模型是最优的BIC相对不那么保守,因此保留的变量可能会比较少。log1log22RSSAICnpnlog1log2logRSSBICnnpn预测预测值与置信区间ppxxxy002201100ˆˆˆˆˆ10100ˆˆ1()npxtxXXxP.I.:10100ˆˆ()npxtxXXxC.I.:数据准备以2003年数据为检验数据,可以用如下方法对数据进行准备预测
本文标题:应用商务统计-线性回归
链接地址:https://www.777doc.com/doc-4222085 .html