您好,欢迎访问三七文档
第1页共19页广东金融学院实验报告课程名称:实验编号及实验名称SPSS实验报告二系别工商管理系姓名学号班级市场营销2班实验地点实验楼403实验日期2013/12/21实验时数指导教师何志峰同组其他成员无成绩一、实验目的及要求掌握方差分析、相关分析和回归分析的基本操作;掌握其中相关的问题检验;读懂输出结果并进行合理分析。二、实验环境及相关情况(包含使用软件、实验设备、主要仪器及材料等)(一)使用软件:SPSS软件(二)实验设备、主要仪器及材料:兼容SPSS软件的电脑一台,老师发的数据素材三、实验内容及步骤(包含简要的实验步骤流程)第一题(1)独立样本t检验:分析→比较均值→独立样本T检验→检验变量选择(年龄)→分组变量选择(目前从事行业)→定义组→使用指定值→组1(1):1、组2(2):3→继续→确定(2)多因素方差分析:分析→一般线性模型→单变量→因变量选择(家庭花费(已婚)[V2_2c])→固定因子选择(教育程度、月收入)→确定(3)建立非饱和模型和利用多重比较比较(snk)各因素:分析→一般线性模型→单变量→因变量选择(家庭花费(已婚)[V2_2c])→固定因子选择(教育程度、月收入)→模型→设定→选择(V1_3、V2_1)→继续→两两比较→选择(V1_3、V2_1)→假定方差齐性→勾S-N-K→继续→确定第2页共19页第二题(1).①画散点图:图形→旧对话框→散点/点状→选择(矩阵分布)→定义→选择变量到矩阵变量框中(工业企业用地,金属制造业用地,运输、批发企业用地,零售业用地,宾馆、餐饮业用地,固体垃圾排放量)→确定②用Enter建立模型:分析→回归→线性→选择因变量(固体垃圾排放量)→选择自变量(工业企业用地,金属制造业用地,运输、批发企业用地,零售业用地,宾馆、餐饮业用地,固体垃圾排放量)→方法选择(进入)→统计量→勾共线性诊断→继续→确定(2).用Stepwise建立模型:分析→回归→线性→选择因变量(固体垃圾排放量)→选择自变量(工业企业用地,金属制造业用地,运输、批发企业用地,零售业用地,宾馆、餐饮业用地,固体垃圾排放量)→方法选择(逐步)→统计量→Durbin-Watson→继续→绘制→选择Y轴(ZRESID)→选择X轴(ZPRED)→勾正态分布图→继续→保存→勾标准化预测值→继续→确定选做.①求出库克距离:分析→回归→线性→选择因变量(固体垃圾排放量)→选择自变量(工业企业用地,金属制造业用地,运输、批发企业用地,零售业用地,宾馆、餐饮业用地,固体垃圾排放量)→方法选择(逐步)→保存→勾cook距离→继续→确定②除去库克距离大于1的异常点:数据→选择个案→如果条件满足→如果→选择(Cook’sDistance)输出(COO_1=1)→继续→确定③用Stepwise建立模型:分析→回归→线性→选择因变量(固体垃圾排放量)→选择自变量(工业企业用地,金属制造业用地,运输、批发企业用地,零售业用地,宾馆、餐饮业用地,固体垃圾排放量)→方法选择(逐步)→统计量→勾共线性诊断→勾Durbin-Watson→继续→绘制→选择Y轴(ZRESID)→选择X轴(ZPRED)→勾正态分布图→继续→保存→勾标准化预测值→勾cook距离→继续→确定第三题(1).①散点图:图形→旧对话框→散点/点状→简单分布→定义→y轴选择(在外就餐)→x轴选择(年份)→确定(2).①曲线估计:分析→回归→曲线估计→因变量选择(在外就餐)→自变量选择(年份)→勾复合、立方、指数分布→确定②预测值:分析→回归→曲线估计→因变量选择(在外就餐)→自变量选择(时间)→保存→勾预测值→预测值范围的观察值填写(27)→继续→确定第四题(1).①筛选:数据→选择个案→如果条件满足→如果→选择(总收入[A15])→输出(A151000)→继续→确定(2).②使用K-means聚类:分析→分类→k-均值聚类→变量选择(工资性收入[A151]、经营性收入[A152]、财产性收入[A153]、转移性收入[A154])→聚类数填(4)→迭代→最大迭代次数填(100)→继续→保存→勾聚类成员→继续→选项→勾每个个案的聚类信息→继续→确定第3页共19页(3).②使用系统聚类:分析→分类→系统聚类→变量选择(工资性收入[A151]、经营性收入[A152]、财产性收入[A153]、转移性收入[A154])→统计量→选择(单一方案)→聚类数填(4)→继续→绘制→树状图→继续→方法→区间选择(Euclidean距离)→继续→保存→单一方案的聚类数填写(4)→继续→确定四、实验结果(包括程序或图表、结论陈述、数据记录及分析等,可附页)第一题(1)组统计量目前从事行业N均值标准差均值的标准误年龄制造业16930.378.366.644服务业9727.917.236.735由组统计量表可知:目前从事行业是制造业和是服务业的外来工的样本平均值有轻微的差距独立样本检验方差方程的Levene检验均值方程的t检验FSig.tdfSig.(双侧)均值差值标准误差值差分的95%置信区间下限上限年龄假设方差相等3.516.0622.427264.0162.4661.016.4664.466假设方差不相等2.524224.367.0122.466.977.5414.390由独立样本检验表可知:F统计量的观察值为3.516,对应的sig=0.0620.05,所以接受原解释,认为(目前从事行业中)制造业和服务业的总体平均年龄没有显著差异。(另外,t统计量的观察值为2.427,对应的sig=0.016,如果在显著性水平为0.01,因为sig=0.0160.01,依然应该接受原假设)(2)主体间因子值标签N教育程度1初中及以下542中专或高中1453大学及以上59月收入1800元以下72801-12006931201-20008742001-30005153000元以上44第4页共19页主体间效应的检验因变量:家庭花费(已婚)源III型平方和df均方FSig.校正模型1.936E81314892481.62814.832.000截距4.670E814.670E8465.061.000V1_312124741.61826062370.8096.038.003V2_161115389.230415278847.30815.217.000V1_3*V2_13027942.3317432563.190.431.882误差2.450E82441004083.817总计1.608E9258校正的总计4.386E8257a.R方=.441(调整R方=.412)由主体间效应的检验表可知:因为教育程度(V1_3)的sig=0.0030.05,所以拒绝原假设,认为教育程度对家庭花费(V2_2c)存在显著差异;因为月收入(V2_1)的sig=4.019974E-110.05,所以拒绝原假设,认为月收入也对家庭花费(V2_2c)存在显著差异;因为教育程度*月收入(V1_3*V2_1)的sig=0.8820.05,所以不应拒绝原假设,认为不同教育程度*月收入(V1_3*V2_1)没有对家庭花费(V2_2c)产生显著的交互作用。(3)家庭花费(已婚)1Student-Newman-Keulsa,b,c教育程度N子集123初中及以下541528.30中专或高中1451969.88大学及以上593071.51Sig.1.0001.0001.000已显示同类子集中的组均值。基于观测到的均值。误差项为均值方(错误)=988144.995。a.使用调和均值样本大小=70.814。b.组大小不相等。将使用组大小的调和均值。不保证I型误差级别。c.Alpha=0.05。由家庭花费(已婚)1表可知:根据S-N-K分析得,三种教育程度对家庭花费的影响显著不同,其中教育程度为“大学及以上”的影响程度最大,“中专或高中”次之,影响程度最小的是“初中及以下”。总体来说,教育程度越高,家庭花费越大。第5页共19页家庭花费(已婚)2Student-Newman-Keulsa,b,c月收入N子集123800元以下71232.14801-1200691421.421201-2000871776.542001-3000512362.333000元以上443809.95Sig..1451.0001.000已显示同类子集中的组均值。基于观测到的均值。误差项为均值方(错误)=988144.995。a.使用调和均值样本大小=23.677。b.组大小不相等。将使用组大小的调和均值。不保证I型误差级别。c.Alpha=0.05。由下表家庭花费(已婚)2表可知:根据S-N-K分析得,月收入为“800元以下”、“801—1200”和“1200—2000”为第一个子集;“2001—3000”为第二个子集,“3000元以上”为第三个子集,这三个子集对家庭花费的影响显著不同。其中第三个子集对家庭花费的影响最大,第二个子集次之,影响最小的是第一个子集。总体来说,月收入越高,家庭花费越大。第二题(1)上图为各变量的散点图。大致可以看出除了金属制作业用地之外,其它都有较强或较弱的线性相关。第6页共19页输入/移去的变量b模型输入的变量移去的变量方法1宾馆、餐饮业用地,金属制造业用地,工业企业用地,运输、批发企业用地,零售业用地.输入a.已输入所有请求的变量b.因变量:固体垃圾排放量模型汇总模型RR方调整R方标准估计的误差1.921a.849.827.15046a.预测变量:(常量),宾馆、餐饮业用地,金属制造业用地,工业地,运输、批企业用发企业用地,零售业用地。Anovab模型平方和df均方FSig.1回归4.3265.86538.214.000a残差.77034.023总计5.09539由Anovab表得出F检验:因为sig=5.171338941466828E-130.05,所以拒接原假设,认为回归方程的线性显著,可以构建线性模型。系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量).122.0323.838.001工业企业用地-5.249E-5.000-.232-2.930.006.7061.416金属制造业用地4.345E-5.000.045.283.779.1785.626运输、批发企业用地.000.000.4912.827.008.1476.787零售业用地-.001.000-.439-2.284.029.1208.311宾馆、餐饮业用地.013.0021.0835.853.000.1307.712a.因变量:固体垃圾排放量由系数a表得出T检验:因为除了“金属制造业用地”的sig=0.7790.05,所以接受原假设,认为它的回归系数线性关系不显著,其余变量的sig0.05,认为它的回归系数线性线性关系显著。并且,因为各变量的VIF10,所以各变量的多重共线性不明显。由系数a表可知,它的回归方程为:Y=0.122—5.249E-5*X1+4.345E-5*X2+2.5032415891665675E-4*X3—0.001*X4+0.013*X5第7页共19页共线性诊断a模型维数特征值条件索引方差比例(常量)工业企业用地金属制造业用地运输、批发企业用地零售业用地宾馆、餐饮业用地113.6061.000.02.02.01.01.00.0021.1111.801.05.07.04.02.01.013.6602.338.07.63.02.02.01.004.5102.660.74.12.01.00.02.015.0727.080.05.00.92.90.00.036.0429.310.07.16.00.05.96.93a.因变量:固体垃圾排放量由共线性诊断表可知:因为各个变量的条件索引10,所以再次证明各变量的多重共线性不明显。(2)输入/移去的变量a模型输入的变量移去的变量方法1宾馆、餐饮业用地.步进(准则:F-to-enter的概率=.050,F-to-remove的概率=.100)。2运输、批发企业用地.步进
本文标题:spss实验报告二
链接地址:https://www.777doc.com/doc-5059504 .html