您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 聚类分析和判别分析实验报告
1聚类分析实验报告一、实验数据2013年,在国内外形势错综复杂的情况下,我国经济实现了平稳较快发展。全年国内生产总值568845亿元,比上年增长7.7%。其中第三产业增加值262204亿元,增长8.3%,其在国内生产总值中的占比达到了46.1%,首次超过第二产业。经济的快速发展也带来了就业的持续增加,年末全国就业人员76977万人,其中城镇就业人员38240万人,全年城镇新增就业1310万人。随着我国城镇化进程的不断加快,加之农业用地量的不断衰减,工业不断的转型升级,使得劳动力就业压力的缓解需要更多的依靠服务业的发展。(一)指标选择根据指标选择的可行性、针对性、科学性等原则,分别从服务业的发展规模、发展结构、发展效益以及发展潜力等方面选择14个指标来衡量服务业的发展水平,指标体系如表1所示:表1服务业发展水平指标体系一级指标二级指标单位计算方法代码服务业发展规模指标服务业增加值亿元∑服务业各企事业单位增加值X1服务业就业人数万人服务业吸纳劳动力数量X2服务业发展结构指标服务业产值比重%服务业增加值/GDPX3服务业就业比重%服务业就业人数/总就业人数X4服务业发展效益指标人均服务产品占有量元/人服务业增加值/地区总人口数X5服务密度元/万平方公里服务业增加值/地区面积X6服务综合生产率亿元/万人服务业增加值/服务业就业人数X7服务产品外贸进出口总额万美元服务产品的进口额+出口额X8服务业发展潜力指标服务业贡献率%服务增加值/总人口X9人均GDP元国内生产总值/总人口X10服务业增长速度%(报告期不变价服务业增加值/基期不变价服务业增加值-1)*100%X11工业化水平%工业增加值/国内生产总值X12城市化水平%城镇人口/总人口X13服务业全社会固定资产投资额亿元∑服务业各行业固定资产投资额X142(二)指标数据本次实验采用的数据是我国31个省(市、自治区)2012年的数据,原数据均来自《2013中国统计年鉴》以及2013年各省(市、自治区)统计年鉴,不能直接获得的指标数据是通过对相关原始数据的换算求得。原始数据如表2所示:表22012年各地区服务业发展水平统计数据表地区X1X2X3X4X5X6X7北京13669.93837.400.760.766.618329.9716.32天津6058.46401.000.470.504.295071.1715.11河北9384.781258.000.350.311.29497.087.46山西4682.95653.100.390.361.30298.857.17内蒙古5630.50485.400.350.372.2647.6011.60辽宁9460.121078.000.380.442.16639.208.78吉林4150.36515.800.350.381.51221.478.05黑龙江5540.31662.590.400.331.45117.138.36上海12199.15629.840.600.565.1219240.0419.37江苏23517.981737.230.440.372.972292.2013.54浙江15681.131288.310.450.352.861540.3912.17安徽5628.481568.300.330.370.94402.033.59福建7737.13929.950.390.362.06623.968.32江西4486.06922.710.350.361.00268.794.86山东19995.812141.100.400.332.061272.819.34河南9157.571740.180.310.280.97548.365.26湖北8208.581266.500.370.341.42441.566.48湖南8643.601401.540.390.351.30408.106.17广东26519.692037.880.460.342.501474.9513.01广西4615.30809.000.350.280.99194.995.70海南1339.53193.910.470.401.51378.406.91重庆4494.41617.820.390.381.53545.427.27四川8242.311573.830.350.331.02169.945.24贵州3282.75398.680.480.220.94186.348.23云南4235.72856.680.410.300.91108.614.94西藏377.8081.360.540.401.233.084.64陕西5009.65457.600.350.221.33243.4210.95甘肃2269.61356.640.400.240.8850.026.36青海624.29121.300.330.391.098.675.15宁夏982.52120.500.420.351.52148.878.15新疆2703.18360.370.360.361.2116.287.503表2(续)地区X8X9X10X11X12X13X14北京0.8087475.005.060.180.865341.7040810731.90天津0.5393173.004.440.470.824884.6011563427.20河北0.4436584.002.950.350.479469.905056305.50山西0.8233628.004.500.390.514335.201504310.90内蒙古0.4063886.006.440.350.585215.201125898.20辽宁0.5056649.002.800.380.6611812.6010408999.70吉林0.3443415.003.650.350.543970.502456300.90黑龙江0.8935711.002.970.400.574619.003759029.10上海1.0785373.003.030.600.893861.1043658695.30江苏0.5468347.004.150.440.6314804.9054796148.90浙江0.6463374.003.210.450.6311326.7031240135.80安徽0.3428792.002.860.330.478090.903928454.30福建0.4052763.002.780.390.607597.2015593795.70江西0.4528800.003.300.350.484401.403341382.90山东0.5651768.003.650.400.5215875.7024554432.40河南0.4431499.003.060.310.429582.305173880.60湖北0.3738572.003.060.370.548069.903196375.10湖南0.4433480.003.410.390.477931.402194873.20广东0.6354095.004.080.460.6712348.0098402046.00广西0.4727952.003.290.350.445386.702948446.00海南0.5732377.003.930.470.521710.201432209.60重庆0.6238914.003.800.390.575503.005320358.20四川0.4329608.003.000.350.4410489.005914359.80贵州0.4419710.005.860.480.364074.60663155.80云南0.3822195.003.740.410.395082.602101373.20西藏0.5822936.002.940.540.23429.00342414.30陕西0.3438564.004.300.350.507215.701479903.20甘肃0.4921978.003.930.400.392236.10890075.20青海0.3833181.002.910.330.47921.70115747.00宁夏0.5036394.007.130.420.51987.90221670.60新疆0.5133796.004.050.360.442685.902517005.90二、实验步骤本次实验是在SPSS中分别利用系统聚类法和K均值法进行聚类分析,具体步骤如下:(一)系统聚类法⒈在SPSS窗口中选择Analyze—Classify—HierachicalCluster,调出系统聚类分析主界面,将变量X1-X14移入Variables框中。在Cluster栏中选择4Cases单选按钮,即对样品进行聚类(若选择Variables,则对变量进行聚类)。在Display栏中选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。⒉点击Statistics按钮,设置在结果输出窗口中给出的聚类分析统计量。这里选择系统默认值,点击Continue按钮,返回主界面。⒊点击Plots按钮,设置结果输出窗口中给出的聚类分析统计图。选中Dendrogram复选框和Icicle栏中的None单选按钮,即只给出聚类树形图,而不给出冰柱图。单击Continue按钮,返回主界面。⒋点击Method按钮,设置系统聚类的方法选项。ClusterMethod下拉列表用于指定聚类的方法,这里选用Ward’smethod,Measure中的Interval中选择SquaredEuclideandistance,在TransformValues中的Standardize中选择Zscores,表示对原始数据进行标准化,其他选择默认选项。单击Continue按钮,返回主界面。⒌点击Save按钮,指定保存在数据文件中的用于表明聚类结果的新变量。这里选用Rangeofsolutions,并在后面的两个矩形框中分别输入3和4,即生产三个新的分类变量,分别表示将样品分为3类、4类和5类时的聚类结果。点击Continue,返回主界面。(二)K均值法1.在SPSS窗口中选择Analyze—DescriptiveStatistics—Descriptives…,调出Descriptives主界面,将变量X1-X14移入Variables框中,选中Savestandardizedvaluesasvariables复选框,然后点击OK,即对原始数据进行标准化,以消除量纲的影响。2.在SPSS窗口中选择Analyze—Classify—K-MeansCluster,调出K均值聚类分析主界面,将变量X1-X14移入Variables框中。将标志变量Region移入LabelCaseby框中,在Method框中选择Iterateclassify,即使用K-means算法不断计算新的类中心,并替换旧的类中心。在NumberofCluster后面的矩形框中输入想要把样品聚成的类数,这里输入4,即将31个省、市、自治区分为4类,其他按钮均为系统默认。⒊点击Iterate按钮,对迭代参数进行设置,这里采用系统默认的标准。单5击Continue,返回主界面。⒋点击Save按钮,设置保存在数据文件中的表明聚类结果的新变量,选中Clustermembership(建立一个代表聚类结果的变量,默认变量名为qcl_1)和Distancefromclustercenter(建立一个新变量,代表各观测变量与其所属类中心的欧几里得距离),单击Continue按钮返回主界面。⒌点击Options按钮,指定要计算的统计量,选中Initialclustercenters和Clusterinformationforeachcase复选框,这样在输出窗口中将给出聚类的初始类中心和每个观测量的分类信息,包括分配到哪一类和该观测量距所属类中心的距离,单击Continue按钮返回主界面。6.点击OK,进行K均值聚类分析程序。三、实验结果(一)系统聚类法结果在结果输出窗口
本文标题:聚类分析和判别分析实验报告
链接地址:https://www.777doc.com/doc-5266728 .html