您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 回归分析SPSS习题答案
回归分析习题1通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内(通常为一年)的营业额与经营面积的比值。对单位面积营业额的影响因素的指标有单位小时车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分。这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得到的。而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分是通过随机采访顾客而得到的平均值数据。(数据集wyzl4_2中存放了从某市随机抽取的20个商业中心有关指标的数据,利用该数据完成下列工作(1)研究变量间的相关程度。(其余6个变量与“单位面积年营业额”间的相关程度,其余6个变量之间的相关程度);(2)由(1)的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线性回归方程;(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。表20个商业中心有关指标的数据商业中心编号单位面积年营业额(万元/平方米)Y每小时机动车流量(万辆)x1日人流量(万人)x2居民年消费额(万元)x3对商场环境满意度x4对商场设施满意度x5对商场商品丰富程度满意度x612.50.513.901.9479623.20.264.242.8674632.50.724.541.6388743.41.236.981.926101051.80.694.210.7184760.90.362.910.62565……………………152.61.045.531.301079162.71.185.981.28879171.40.611.271.48671183.21.055.772.167109192.91.065.711.74699202.50.584.111.857962.我国从1982~2001年间的20年的财政收入(Y)和国内生产总值(X)的数据存放在数据集wyz4_4_7.中。试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。1.解:(1)变量间的相关性分析利用SPSS软件构造所有变量的散点图矩阵和相关矩阵,结果见图1和表1从散点图矩阵直观可以看出Y“单位面积年营业额”与x2“日人流量(万人)”和x3“居民年消费额(万元)”线性关系较密切。x2“日人流量(万人)”与x6“对商场商品丰富程度满意度”线性关系较密切从表1得)3,(xy=0.795**,)2,(xy=0.790**,)6,(xy=.0.697**,说明Y“单位面积年营业额”与x3“居民年消费额(万元)”,x2“日人流量(万人)”,x6“对商场商品丰富程度满意度”及x5“对商场设施满意度”在0.01水平(双侧)上显著相关线性关。可以考虑采用多元线性回归模型来建立“单位面积年营业额”的预测公式。图1散点图矩阵表1相关矩阵单位面积年营业额(万元/m2)每小时机动车流量(万辆)日人流量(万人)居民年消费额(万元)对商场环境满意度对商场设施满意度对商场商品丰富程度满意度单位面积年营业额(万元/m2)Pearson相关性1.413.790**.795**.341.450*.697**显著性(双侧).071.000.000.141.046.001N20202020202020每小时机动车流量(万辆)Pearson相关性.4131.751**-.129.664**.424.774**显著性(双侧).071.000.588.001.062.000N20202020202020日人流量(万人)Pearson相关性.790**.751**1.273.594**.279.983**显著性(双侧).000.000.245.006.233.000N20202020202020居民年消费额(万元)Pearson相关性.795**-.129.2731-.112.426.144显著性(双侧).000.588.245.639.061.545N20202020202020对商场环境满意度Pearson相关性.341.664**.594**-.1121.042.643**显著性(双侧).141.001.006.639.862.002N20202020202020对商场设施满意度Pearson相关性.450*.424.279.426.0421.243显著性(双侧).046.062.233.061.862.302N20202020202020对商场商品丰富程度满意度Pearson相关性.697**.774**.983**.144.643**.2431显著性(双侧).001.000.000.545.002.302N20202020202020**.在.01水平(双侧)上显著相关。(2)建立Y“单位面积年营业额”与“居民年消费额”的一元线性回归方程设),0(~2310Nxy利用SPSS软件的线性回归分析的模块进行分析,结果见表2~表6和图2~图3由最小二乘估计得到一元线性回归方程(见表4)Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)由回归方程的显著性检验的p值Sig.=.000,知回归方程在α=0.01的水平上通过检验,即Y与x3的线性关系是显著的(见表3方差分析表)由常量0的t检验的p值Sig.=0.0050.01知回归方程的常数项不为零。拟合有常数项的回归方程是合适的(见表4系数表)由方程的拟合优度(可决系数)R2=0.631,知方程的拟合优度(可决系数)还不够高,即方程有改进的余地,还可以引入有关的变量。(见表1)对残差作Shapiro-Wilk正态性检验,p值Sig.=0.5380.05(见表5)知随机误差项i服从正态分布的假定满足。作回归标准化残差的标准P-P图(见图2),进一步验证了随机误差项i服从正态分布的假定满足对残差序列作D-W检验,检验统计量Durbin-Watson=2.125知n,,,21之间存在一定的负自相关:n,,,21相互独立的假定不一定满足(见表2)以标准化的残差et为纵坐标,而以标准化的预测值yi为横坐标做残差的散点图(见图3)。图中显示散点随机地分布在–2到+2的带子里,可以认为线性回归模型的等方差假定成立。结论:(1)一元线性回归方程Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)在α=0.01的水平上通过检验,拟合优度为0.631,方程有改进的余地,还可以引入有关的变量。(2)误差项正态分布的假设和和误差项的等方差假设均成立,但误差项的独立性假设不满足。表2模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.795a.631.611.513412.125a.预测变量:(常量),居民年消费额(万元)。b.因变量:单位面积年营业额(万元/m2)表3方差分析表Anovab模型平方和df均方FSig.1回归8.12518.12530.824.000a残差4.74518.264总计12.87019a.预测变量:(常量),居民年消费额(万元)。b.因变量:单位面积年营业额(万元/m2)表4系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量).928.2883.220.005居民年消费额(万元).887.160.7955.552.000a.因变量:单位面积年营业额(万元/m2)表5残差的正态性检验TestsofNormalityKolmogorov-SmirnovaShapiro-WilkStatisticdfSig.StatisticdfSig.StandardizedResidual.09020.200*.96020.538a.LillieforsSignificanceCorrection*.Thisisalowerboundofthetruesignificance.图2回归标准化残差的标准P-P图图3标准化残差图表6残差统计量a极小值极大值均值标准偏差N预测值1.42444.00492.3950.6539320残差-.89496.76957.00000.4997220标准预测值-1.4842.462.0001.00020标准残差-1.7431.499.000.97320a.因变量:单位面积年营业额(万元/m2)(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。解设y与x1,x2,…,x8满足),0(~288110Nεxxy规定:进入方程的变量的显著性水平为0.05,从方程中剔出变量的显著性水平为0.10,(见表7)逐步回归的步骤:(见表10)第一步引入变量x3居民年消费额(万元)得到一元线性回归方程Y(单位面积年营业额)=0.928+0.877x3(居民年消费额),第二步引入变量x2日人流量(万人)得到线性回归方程Y(单位面积年营业额)=-0.117+0.698x3(居民年消费额)+0.317x2(日人流量(万人)),第三步引入变量x4对商场环境满意度,所得线性回归方程为:Y(单位面积年营业额)=-.297+0.723x3(居民年消费额)+0.291x2(日人流量(万人))+0.037x4(对商场环境满意度)以上3方程在显著性水平为0.05上均通过检验(见表9)。第3个方程的回归系数(包括常数项)t检验的p值0.010,0.000,0.000,0.034,在显著性水平为0.05上均通过检验(见表10)。三个方程的修正R方值逐步增大0.611<0.985<.988,故第3个方程为最优的(见表8)对第3个方程的自变量作共线性诊断(见表10):回归方程第i个回归系数的方差膨胀因子VIF分别1.235、1.885、1.767,说明方程中的3个回归变量不存在共线性,对残差序列作D-W检验,检验统计量Durbin-Watson=2.5742知n,,,21之间存在一定的负自相关:n,,,21相互独立的假定不一定满足(见表8)对残差作Shapiro-Wilk正态性检验,p值Sig.==00.01(见表15)知随机误差项i不服从正态分布。作回归标准化残差的标准P-P图(见图3),进一步验证了随机误差项i不服从正态分布。以标准化的残差et为纵坐标,而以标准化的预测值yi为横坐标做残差的散点图(见图5)。图中显示散点随机地分布在–2到+2的带子里(除一个点),可以认为线性回归模型的等方差假定成立。结论:(1)“单位面积年营业额”的预测公式为:Y(单位面积年营业额)=-.297+0.723x3(居民年消费额)+0.291x2(日人流量(万人))+0.037x4(对商场环境满意度)方程在显著性水平为0.05上通过检验,调整的R方值=0.988,(2)模型的假定误差项的正态性和不相关性存在问题,估计方法有待改进。表7输入/移去的变量a模型输入的变量移去的变量方法1居民年消费额(万元).步进(准则:F-to-enter的概率=.050,F-to-remove的概率=.100)。2日人流量(万人).步进(准则:F-to-enter的概率=.050,F-to-remove的概率=.100)。3对商场环境满意度.步进(准则:F-to-enter的概率=.050,F-to-remove的概率=.100)。a.因变量:单位面积年营业额(万元/m2)表8模型汇总d模型RR方调整R方标准估计的误差Durbin-Watson1.795a.631.611.513412.993b.987.985.099303.995c.990.988.088612.574a.预测变量:(常量),居民年消费额(万元)。b.预测变量:(常量),居民年消费额(万元),日人流量(万人)。c.预测变量:(常量),居民年消费额(万元),日人流量(万人),对商场环境满意度。d.因变量:单位面积年营业额(万元/m2)表9Anovad模型平方和df均方FSig.1回归8.12518.12530.824.000a残差4.74518.264总计12.870192回归12.70226.3516
本文标题:回归分析SPSS习题答案
链接地址:https://www.777doc.com/doc-6838976 .html