您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > 聚类分析在数学建模中的应用
聚类分析在数学建模中的应用hjyahead@gmail.com2011大学生数学建模夏令营B题•水资源短缺风险,泛指在特定的时空环境条件下,由于来水和用水两方面存在不确定性,使区域水资源系统发生供水短缺的可能性以及由此产生的损失。•北京是世界上水资源严重缺乏的大都市之一,其人均水资源占有量不足300m3,为全国人均的1/8,世界人均的1/30,属重度缺水地区,附表中所列的数据给出了1979年至2000年北京市水资源短缺的状况。北京市水资源短缺已经成为影响和制约首都社会和经济发展的主要因素。如何对水资源风险的主要因子进行识别,对风险造成的危害等级进行划分,对不同风险因子采取相应的有效措施规避风险或减少其造成的危害,这对社会经济的稳定、可持续发展战略的实施具有重要的意义。2011大学生数学建模夏令营B题•考虑以下问题:•1评价判定北京市水资源短缺风险的主要风险因子;•2建立一个数学模型对北京市水资源短缺风险进行综合评价,作出风险等级划分并陈述理由。•3对北京市未来两年水资源的短缺风险进行预测,并提出应对措施。•4以北京市水行政主管部门为报告对象,写一份建议报告。年份缺水量(x亿立方米)19794.69198024.54198124.11198210.62198312.8619840.741985-6.2919869.521987-7.7119883.25198923.0919905.261991-0.26199223.99199325.5519940.45199514.541996-5.86199718.0719982.73199927.49200023.54200119.7200218.5200317.4200413.2200511.320069.820071120080.9•定义模糊集合–u表示风险程度–x表示缺水量•构造隶属函数–将1979-2008年的缺水量换算成对应的风险程度用0到1区间的数字表示;•表示缺水量的最小值,•表示缺水量的最大值0()1Wux0,0(),1,apaabbabxwxwuwxawbw年份缺水量(x亿立方米)风险程度(u(x))19794.690.1241198024.540.8394198124.110.8172198210.620.2712198312.860.3415……………….200317.40.5089200413.20.3529200511.30.291720069.80.24742007110.282520080.90.0598•通过以上两图的比较可以说明隶属度真正反映了30年缺水的状况,很好的反应了风险的模糊性。•通过对北京30年间风险程度的不同进行分类采用系统聚类的方法–开始时每个对象自成一类,–然后每次将最相似的两类合并,合并后重新计算新类与其他类的距离或相似度,–这一过程一直继续,一直到所有对象归为一类为止,并类的过程用一张普类系谱图表示。层次(系统)聚类法(HierarchicalClustering)——计算步骤•①计算n个样本两两间的距离{dij},记D•②构造n个类,每个类只包含一个样本;•③合并距离最近的两类为一新类;•④计算新类与当前各类的距离;若类的个数等于1,转到5);否则回3);•⑤画聚类图;•⑥决定类的个数和类;由spss软件求对北京30年风险的分类树状图•对于这30年的数据共可分为30组、5组、4组、2组、1组。•根据系统聚类的结果,然后采用模糊聚类的方法分别分出5组、4组、2组•鉴于30组和1组情况太过极端对风险的分类太过分散和统一•舍去这两种情况,分别采用模糊聚类的方法对风险分成5组、4组和2组模糊聚类的步骤•第一步:建立数据观测矩阵sample;–sample=[4.6924.5424.1110.6212.860.74-6.299.52-7.713.2523.095.26-0.2623.9925.550.4514.54-5.8618.072.7327.4923.5419.718.517.413.211.39.8110.9];•第二步:标定模糊相似矩阵data=(rij),矩阵元素rij表示向量xi和xj的相似程度,由隶属函数W可求得data;–data=[0.12410.83940.81720.27120.34150.05760.00160.239600.09690.76560.13580.04480.81100.89280.05370.39960.00280.53640.08801.00000.78820.60640.55440.50890.35290.29170.24740.28250.0598]模糊聚类的步骤•第三步:在Matlab中编程实现聚类分析,找出中心点center;分成两组的情况•对30年的等级划分并不明显,不能起到警示和对水资源短缺风险程度的正确描述,因此这种划分标准方法并不可行。风险等级类中心风险描述Ⅰ级低度风险0.1529可忽略的风险Ⅱ级高度风险0.7571无法承受的风险分成五组的情况•五级的划分在较低风险时过于密集•在风险程度为0.5以下时,在实际情况下,造成的危害并不是很大•没有必要对0.5以下的风险划分三个级别。风险等级类中心风险描述Ⅰ风险等级0.0538可忽略的风险Ⅱ风险等级0.2621低度风险Ⅲ风险等级0.3624中度风险Ⅳ风险等级0.5531较高风险Ⅴ风险等级0.8399高度风险分成四组的情况•划分四级对于三十年的数据具有较好的划分•落于每个等级的年份与实际情况也相符。风险等级类中心风险描述Ⅳ风险等级0.8410高风险Ⅲ风险等级0.5473中度风险Ⅱ风险等级0.2933低风险Ⅰ风险等级0.0571可忽略的风险
本文标题:聚类分析在数学建模中的应用
链接地址:https://www.777doc.com/doc-2113556 .html