您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 64多元统计分析论文
1多元统计分析论文题目:我国31个省、市、自治区根据农林牧副渔业产值大小的聚类分析摘要农业属于第一产业,农业提供之城国民经济建设与发展的基础产品,因此农业的发展是我国经济发展的重要组成部分,研究农业在我国各省、市、自治区的分布结构有利于了解我国的资源利用情况,更好的了解我国各省、市、自治区的农业发展现状。本文运用2012年我国31个省、市、自治区的农林牧副渔业各产值共155个样本横截面数据,采用聚类分析的方法对我国31个省、市、自治区就农林牧副渔业各产值进行分类。聚类分析的结果显示山东省、河南省、江苏省的农业总产值相对较高,西藏自治区、青海省、宁夏回族自治区、北京市、上海市、天津市属于农业总产值较低的一类。关键词:农林牧副渔业产值聚类分析农业发展2一、引言农业为通过培育动植物生产食品及工业原料的产业。农业属于第一产业,广义的农业是指包括种植业、林业、畜牧业、渔业、副业五种产业形式的产业。其中种植业主要包括粮食作物、经济作物、饲料作物和绿肥等的生产,种植业在农业生产中占有较大比重,副业是指种植业、林业、畜牧业、渔业以外的其他生产事业,主要指农业服务性产业。农业是支撑国民经济建设与发展的基础产品,是人类衣食之源、生存之本,是一切生产的首要条件。它为国民经济其他部门提供粮食、副食品、工业原料、资金和出口物资。同时农业受自然条件影响较大,有明显的区域性和季节性。我国土地面积辽阔,气候具有多样性,导致农业的生产也出现了多样性。由于自然条件的影响,以及3其他产业的发展,导致了我国各省、市、自治区的农业发展具有较大的差异,比如宁夏回族自治区虽然面积较小,但是位于黄河中上游,农业资源条件优越,水资源得引黄河水灌溉之利,而且土地资源充裕,畜牧业发展较快,而青海省的面积较大,但自然条件则相对残酷,生态环境脆弱,自然灾害频繁,导致农业产值较低。二、聚类分析方法简介聚类分析是建立一种分类方法,将一批样本和变量,按照他们在性质上的亲疏、相似程度进行分类的一种多元统计分析方法。聚类分析的内容十分丰富,按其聚类的方法可以分为:系统聚类法、动态聚类法、最优分割法、模糊聚类法、图论聚类法和聚类预报法。另外,按照分类对象不同可以分为R型聚类和Q型聚类,R型是对变量进行聚类,Q型是对样本进行分类。聚类分析依据的基本原则是:直接比较样本中各事物之间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。也就是说,同类事物之间的性质差异小,类与类之间的事物性质相差较大。描述样品间的亲属程度最常用的是距离,其中欧式距离在聚类分析中用得最广,它的表达式如下:mtjtitijxxd12其中itx表示第i个样品的第k个指标的观测值,jtx表示第j个样品的第k个指标的观测值,ijd为第i个样品与第j个样品之间的欧4氏距离。若ijd越小,那么第i与j两个样品之间的性质就越接近。性质接近的样品就可以划为一类。当确定了样品之间的距离之后,就要对样品进行分类。分类的方法很多,其中系统聚类法是应用最广泛的一种方法,系统聚类法的思想:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其他类的距离或相似性程度,这一过程一直继续直到所有对象归为一类为止。分类结果可以画成一张直观的聚类谱系图。系统聚类又有许多分析方法,包括:最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、离差平方和法等。这些方法是由于类间距离不同的定义的而产生的。三、实证分析1.数据准备本文以2012年中国31个省、市、自治区农林牧副渔业各产值的统计数据,运用聚类分析方法对我国各省、市、自治区进行分类。数据来源是《中国统计年鉴》。针对研究目的要求,选择如下指标:X1:农业总产值(亿元)X2:林业总产值(亿元)X3:牧业总产值(亿元)X4:渔业总产值(亿元)X5:副业(农林牧渔服务业总产值)总产值(亿元)5地区x1x2x3x4x5北京市166.2954.83154.1612.987.45天津市195.992.79105.0161.6610.17河北省3095.2977.881747.66177.74241.54山西省847.4179.07298.838.4270.53内蒙古自治区1171.9797.761118.8626.0835.26辽宁省1539.65128.681621.23618.74154.13吉林省1166.5898.11130.3634.1472.84黑龙江省2315.64134.51350.6877.9273.57上海市171.489.5572.5957.4510.66江苏省2966.7299.751226.181235.4280.76浙江省1229.36142.14549.04687.0551.07安徽省1867.64209.51119.73384.43147福建省1263.71256.45481.28903.36102.6江西省1003.21752.68333.06228.9181.4山东省3960.62107.012285.921267.07325.14河南省3958.95140.852255.6186.4237.23湖北省2488.06100.051334.04626.23183.74湖南省2651.69259.971488.58279.94223.92广东省2229.27222.741134.14914.04156.66广西壮族自治区1724245.261072.77311.74136.95海南省460.72137.85214.14236.2733.176重庆市841.8143.48453.944.9917.85四川省2764.9151.52269.86163.7783.09贵州省864.8654.19421.5528.2167.8云南省1398.18225.83912.9763.180.14西藏自治区53.392.5659.020.223.14陕西省1526.2858.44598.7214.61105.15甘肃省984.2420.07231.721.8120.33青海省117.094.57137.080.564.56宁夏回族自治区240.469.77105.7213.3615.84新疆维吾尔自治区167543.04485.3715.26572.R软件聚类分析结果首先利用R软件计算出样本之间的欧氏距离,然后利用系统聚类中离差平方和法进行聚类分析,得到谱系图如图1所示:7图1然后考虑将样本分为3类,结果如图2所示:8图2由谱系图结果可以将我国31个省、市、自治区根据农林牧副渔产值作如下分类:第一类:山东省、河南省、河北省、四川省、黑龙江省、湖北省、湖南省、江苏省、广东省;第二类:海南省、宁夏回族自治区、天津市、上海市、西藏自治区、北京市、青海省;第三类:辽宁省、安徽省、广西壮族自治区、陕西省、新疆维吾尔自治区、云南省、内蒙古自治区、吉林省、重庆市、贵州省、山西省、甘肃省、江西省、浙江省、福建省。9四、结论及建议本文运用2012年我国31个省、市、自治区的农林牧副渔业产值共155个样本横截面数据,采用聚类分析的方法对我国31个省、市、自治区就农林牧副渔业各产值进行分类。将我国31个省、市、自治区分为三大类,第一类由山东省、河南省、河北省、四川省、黑龙江省、湖北省、湖南省、江苏省、广东省组成,代表着2012年农业产值较高,农业发展较好的省份,尤其是山东省,农业总产值居首位;第二类由海南省、宁夏回族自治区、天津市、上海市、西藏自治区、北京市、青海省组成,属于农业产值比较低的地区;第三类由辽宁省、安徽省、广西壮族自治区、陕西省、新疆维吾尔自治区、云南省、内蒙古自治区、吉林省、重庆市、贵州省、山西省、甘肃省、江西省、浙江省、福建省等地区组成,属于我国农业产值中等的地区。从分类结果可以看出,农业产值受自然条件及教育科技发展等方面的影响,上海市、天津市、北京市是我国政治、经济文化发展较快的地区,主要以第三产业为主,第一产业产值较低,而西藏自治区、青海省由于自然条件恶劣,生态环境脆弱,导致农业产值较低。在农业产值较高的省份,如山东省、河南省、河北省、四川省等除了自然条件因素较好外,教育与农业技术的发展也为农业的发展创造了较好的条件。农业作为第一产业,是支撑国民经济建设与发展的基础产品,所以提高生产力,促进农业的改革至关重要,对于我国农业产值处于我国中等水平的地区如云南省、内蒙古自治区、贵州省等,应当提高教育水平,提高农业生产水平,推进农业标准化生产。10参考文献1.国家统计局《中国统计年鉴-2012年农林牧渔业产值》2.高惠璇编著,《应用多元统计分析》,北京大学出版社,2005.1
本文标题:64多元统计分析论文
链接地址:https://www.777doc.com/doc-6204173 .html