您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 基于粗糙集理论的山西省城镇化影响因素分析
基于粗糙集理论的山西省城镇化影响因素分析摘要:通过在2014年山西省统计年鉴中选取若干因素,利用粗糙集理论相关计算方法,得出山西省城镇化影响因素的权重,从而为山西省城镇化的有效推进提供相关参考。关键词:山西省;粗糙集;城镇化引言选题背景及其意义国内外研究动态1粗糙集理论1.1“知识”的定义:使用等价关系集R对离散表示的空间U进行划分,知识就是R对U划分的结果。“知识库”的形式化定义:等价关系集R中所有可能的关系对U的划分表示为:K=(U,R)1.2“信息系统”的形式化定义S={U,A,V,f},U:对象的有限集A:属性的有限集,A=CD,C是条件属性子集,D是决策属性子集V:V=pApV,pV是属性P的域f:U×A→V总函数,使得对每个iX,qA,有f(xi,q)Vq一个关系数据库可看作一个信息系统,其“列”为“属性”,“行”为“对象”。在信息系统S={U,A,V,f}中,设XU是个体全域上的子集,PA,则X的下和上近似集及边界区域分别为:PX={YU|P:YX}PX={YU|P:YXO}PBND)(X=PX-PX1.3属性约简(AttributeReduction):在一个信息系统S中,设是S上的一个分类,经约简后的最小属性子集具有同原始属性集相同的分类质量,即存在RPQ,使得R()=P(),称之为属性集P的约简,记作REDU(P)。所有约简的交集称为-核,即CORE(P)=REDU(P),核是信息系统中一系列最重要的属性之一。1.4粗糙集理论可以利用指标的相对重要性来度量指标权重。指标ia的重要程度:ai=|RPOS|RPOS||RPOS|Rai-R)()()(R,aiR,RA对ai做归一化处理后可以得到指标ai的权重,具体的处理如下列公式:t1iaiaiai(t=1,2,...,t)上式ai中说明了从指标子集R中去掉指标ai后对(R)POSR的影响,由此来衡量指标a在指标子集R中的相对重要性。2山西省城镇化影响因素分析2.1原始数据的选取选取第一产业产值、人口自然增长率、农村居民消费价格指数、公路通车里程、图书总印数等5个影响因素作为条件属性,城镇化率作为决策属性。数据来源于2014年山西省年统计年鉴(表1),根据粗糙集理论的要求对各个属性的增长率数值进行离散化(表2),得到初始决策表(表3)表2属性值离散化标准Va1a2a31[-0.05,0.237)[-0.195,-0.055)[0.009,0.054)2[0.237,0.523][-0.055,0.084][0.054,0.117]Va4a5d表12004-2013年山西省城镇化影响因素原始数据U第一产业产值(万元)人口自然增长率(‰)农村居民消费价格总指数(1978年=100)公路通车里程(公里)图书总印数(万册)城镇化率(%)2004年21519007.61354.61072271326424.322005年27630007.48391.61099271109826.542006年26242006.02437.41112271008130.122007年27677005.75448.3112930933731.032008年31197005.33473.911986911764322009年31358005.31510.41247731053532.352010年47759004.895151273301118732.82011年55448005.3529.41316441318332.022012年64142004.865581348081388732.352013年69832004.87572.61377711478932.461[0.0118,0.0366)[-0.1632,0.048)[-0.0237,0.055)2[0.0366,0.0614][0.048,0.2599][0.055,0.1348]2.2决策表的属性约简表3初始决策表Ua1a2a3a4a5dX1122112X2122112X3112112X4121111X5112221X6122211X7211121X8121121X9112121X10121121U/A={{1,2}{3}{4}{5}{6}{7}{8,10}{9}}U/A-{a1}={{1,2}{3}{4}{5}{6}{7}{8,10}{9}}U/A-{a2}={{1,2,3}{4}{5}{6}{7}{8,10}{9}}U/A-{a3}={{1,2}{3}{4}{5}{6}{7}{8,10}{9}}U/A-{a4}={{1,2}{3}{4}{5,9}{6}{7}{8,10}}U/A-{a5}={{1,2}{3}{4,8}{5}{6}{7}{9}{10}}2.3权重的确定a2=|RPOS|RPOS||RPOS|Rai-R)()()(R=107-10=1034a=|RPOS|RPOS||RPOS|Rai-R)()()(R=102108-105a=|RPOS|RPOS||RPOS|Rai-R)()()(R=103107-10归一化后得到a2、a4、a5的权重分别为:375.0832a,25.0824a,375.0835a3结论在山西省城镇化的影响因素中,第一产业产值与农村居民消费价格总指数是属性约简项,可以忽略不计。而人口自然增长率的权重为0.375,图书总印数的权重为0.375,公路通车里程的权重为0.25,是其中的关键影响因素。参考文:[1]舒有锋等.基于粗糙集的权重确定方法在我国喜马拉雅山地区典型冰碛湖溃决危险性评价中的应用.水土保持通报,2010年10月[2]尹宗成.运用粗糙集理论对我国粮食产量的预测.统计与决策,2008年第6期[3]李国成,肖庆宪.基于粗糙集的城镇化质量评价研究-以安徽省为例.科技与管理,2014年3月
本文标题:基于粗糙集理论的山西省城镇化影响因素分析
链接地址:https://www.777doc.com/doc-2576217 .html