您好,欢迎访问三七文档
中国人口预测模型摘要本文对人口预测的数学模型进行了研究。首先,建立一次线性回归模型,灰色序列预测模型和逻辑斯蒂模型。考虑到三种模型均具有各自的局限性,又用加权法建立了熵权组合模型,并给出了使预测误差最小的三个预测模型的加权系数,用该模型对人口数量进行预测,得到的结果如下:单位:(万人)年份20062007200820092010预测值其中加权系数为:,,。其次,建立Leslie人口模型,充分反映了生育率、死亡率、年龄结构、男女比例等影响人口增长的因素,并利用以1年为分组长度方式和以5年为分组长度方式预测短期和长期人口增长,得如下数据:年份2006200720082009201020112012人数(万)130990131230131430131620131800132000132220然后对Leslie人口模型进行了改进,构建了反映生育率和死亡率变化率负指数函数,并给出了反映城乡人口迁移的人口转移向量。最后我们BP神经网络模型检验以上模型的正确性关键字:一次线性回归灰色序列预测逻辑斯蒂模型Leslie人口模型BP神经网络年份2016-20202021-20252026-20302031-20352036-20402041-20452046-2050人数(万)144000148000150000150000151000150000149000一、问题重述1.背景人口增长预测是随着社会经济发展而提出来的。由于人类社会生产力水平低,生产发展缓慢,人口变动和增长也不明显,生产自给自足或进行简单的以货易货,因而对未来人口发展变化的研究并不重要,根本不用进行人口增长预测。而当今社会,经济发展迅速,生产力达到空前水平,这时的生产不仅为了满足个人需求,还要面向社会的需求,所以必须了解供求关系的未来趋势。而人口增长预测是对未来进行预测的各环节中的一个重要方面。准确地预测未来人口的发展趋势,制定合理的人口规划和人口布局方案具有重大的理论意义和实用意义。2.问题人口增长预测有短期、中期、长期预测之分,而各个国家和地区要根据实际情况进行短期、中期、长期的人口预测。例如,中国人口预期寿命约为70岁左右,因此,长期人口预测最好预测到70年以后,中期40—50年,短期可以是5年、10年或20年。根据2007年初发布的《国家人口发展战略研究报告》(附录一)及《中国人口年鉴》收集的数据(附录二),再结合中国的国情特点,如老龄化进程加速,人口性别比升高,乡村人口城镇化等因素,建立合理的关于中国人口增长的数学模型,并利用此模型对中国人口增长的中短期和长期趋势做出预测,同时指出此模型的合理性和局限性。二、问题的基本假设及符号说明问题假设1.假设本问题所使用的数据均真实有效,具有统计分析价值。2.假设本问题所研究的是一个封闭系统,也就是说不考虑我国与其它国家的人口迁移问题。3.不考虑战争瘟疫等突发事件的影响4.在对人口进行分段处理时,假设同一年龄段的人死亡率相同,同一年龄段的育龄妇女生育率相同。5.假设各年龄段的育龄妇女生育率呈正态分布6.人类的生育观念不发生太大改变,如没有集体不愿生小孩的想法。7.中国各地各民族的人口政策相同。符号说明()iat--------------------第t时间区间内第i个年龄段人口总数()ict--------------------第t时间区间内第i个年龄段人口总数占总人口的比例()kict--------------------第t时间区间内第i个年龄段中第k年龄值人口总数占总人口的比例()At--------------------第t时间区间内各年龄段人口总数的向量()Pt--------------------第t时间区间各年龄段人口总数向量转移矩阵()ibt-------------------第t时间区间内第i个年龄段人的生育率()idt-------------------第t时间区间内第i个年龄段人的死亡率()kidt-----------------第t时间区间内第i个年龄段中第k年龄值的死亡率()ist-------------------第t时间区间内第i个年龄段人的存活率()ht---------------------第t时间区间男性人数与女性人数的比值()iet---------------------第t时间区间内第i个年龄段育龄妇女的生育率m---------------------------每个年龄段上年龄值的数目三问题分析本问题是一个关于人口预测的问题,与以往不同,本问题需要根据中国特殊的国情去研究,我们根据对问题的分析并结合实际情况认为对人口产生主要影响的因素有以下四个:生育率、死亡率、年龄结构、男女比例。在这里需要说明的是对于人口产生影响的一些因素,如经济发展状况,生态环境情况、已婚夫妇对生育所持的态度、医疗技术的发展等,我们认为它们对人口的增长是通过作用于以上四个指标而间接发挥作用的。而对于诸如战争爆发、疾病流行等突发因素,由于其不可预测性,我们不考虑1.生育率生育率代表育龄妇女生育人口的能力,从一定意义上讲生育率的高低控制着人口增长率高低,通常来说生育率越高人口增长率越高,所以说生育率是人口增长的源头。生育率的影响因素很多,首先是年龄因素,不同年龄段的育龄妇女的生育率不同,通常20岁至30岁的育龄妇女的生育率最强;此外是地域因素,受政策因素、观念认识、周边环境等影响乡村育龄妇女的生育率高于城市育龄妇女的生育率;还有其它因素的影响,比如大规模疾病会降低育龄妇女的生育率。2.死亡率死亡率表示一定时期内一个人口群体中死亡的人数占该人口群体的比值,和生育率一样死亡率的高低同样控制着人口增长率高低,如果说生育率是人口增长的源头,则死亡率是人口增长的汇点。同样影响死亡率的因素很多,首先不同年龄段的死亡率不同,通常老年人和刚出生的婴儿的死亡率较高;从长远来看,随着医疗水平的提高,整个人口群体的死亡率将会成下降趋势;此外一些突发事件,如战争、疾病等,将会使使那一段的人口死亡率大幅度提高。3.年龄结构年龄结构反映了总体人口在各年龄段分布情况,年龄结构蕴涵的信息量很大,从其中我们可以实现对很多问题的分析,比如从年龄结构我们可以分析出社会的老年化程度,此外从年龄结构我们可以判断出不同时间段人口出生的情况,比如年龄结构不仅反映了总体人口在各年龄段分布情况,而且考虑到不同年龄段人口生育率、死亡率不同等情况,我们可以在年龄结构中有效反映这些差异4.男女比例男女比例反映了总体人口中男性与女性人数的比较关系,男女比例值能反映出体人口中男性与女性人数是否协调,男女比例主要受男女出生比和男女死亡率的影响,男女出生比正常范围在103-107,也就是说出生100个女儿的同时会有103—107个男儿出生,但是在现实社会中,女性死亡率低于男性,所以男性与女性人数大致相等,社会维持在一个稳定状态。但目前我国男女出生比超过110,这不仅将导致男女比例失调,还会对人口的预测产生影响,所以在人口预测时必须将男女比例问题考虑进去。考虑到人口预测分为中短期预测和长期预测,两类预测因为涉及的时间长短不同,所以考虑的因素不同,采用的方法不同。对于中短期预测,我们假设生育率、死亡率、年龄结构、男女比例均维持在同一稳定水平,这样我们采用方法有很多,。对于长期预测,我们需要考虑生育率、死亡率、年龄结构、男女比例等因素随时间变化,此外城乡人口迁移对城乡人口结构产生影响,尽管以上因素短期内积累效应较小,但在长期中必须考虑。在预测方法上我们选用了基于以往人口数据的一次线性回归,灰色、时间序列预测,逻辑斯蒂模型和基于年龄结构并生育率、死亡率随时间Leslie人口模型四数学模型.熵权组合模型出生率年龄结构按影响增长因素建立模型型男女比例Leslie人口模型死亡率中国人口预测模型按人口统计量建立模型一次线型回归逻辑斯蒂灰色预测熵权法组合模型中短期长期BP神经网络模型有关于人口增长预测的模型很多,比如灰色GM(1,1),移动平均数法,指数平滑法,一元线型回归,马尔萨斯人口模型,宋健人口模型等等,但是每种预测方法的精度往往也不同。组合模型和单个模型比起来,具有较高的预测精度,组合预测的关键就在于确定各个预测方法的权重。本文将从一个新的角度进行研究,即从信息论的观点出发,根据各个体预测方法误差指标的信息熵,确定组合预测模型的权重,进行人口组合预测模型。本文选用了一元线性回归法,逻辑斯蒂模型法,灰色GM(1,1)模型法对中国人口增长进行预测。而1978至2005年的数据见本文表一。.4..灰色预测模型1.模型建立灰色系统是指部分信息已知,部分信息未知的系统。灰色系统的理论实质是将无规律的原始数据进行累加生成数列,再重新建模。由于生成的模型得到的数据通过累加生成的逆运算――累减生成得到还原模型,再有还原模型作为预测模型。预测模型,是拟合参数模型,通过原始数据累加生成,得到规律性较强的序列,用函数曲线去拟合得到预测值。灰色预测模型建立过程如下:1)设原始数据序列0X有n个观察值,nXXXX0000,...,2,1,通过累加生成新序列nXXXX1111,...,2,1,利用新生成的序列1X去拟和函数曲线。2)利用拟合出来的函数,求出新生序列1X的预测值序列(1)X3)利用(0)(1)(1)()()(1)XkXkXk累减还原:得到灰色预测值序列:00001,2,...,XXXXnm(共n+m个,m个为未来的预测值)。将序列0X分为0Y和0Z,其中0Y反映0X的确定性增长趋势,0Z反映0X的平稳周期变化趋势。利用灰色GM(1,1)模型对0X序列的确定增长趋势进行预测2模型求解根据2006全国统计年鉴数据整理得到全国历年年度人口统计表如表1.表1:全国历年年底的人口统计年份1978年1980年1985年1989年1990年1991年1992年总人口/万人9625998705105851112704114333115823117171年份1993年1994年1995年1996年1997年1998年1999年总人口/万人11857119850121121122389123626124761125743年份2000年2001年2002年2003年20042005年总人口/万人126743127627128453129227129988130756根据上述数据,建立含有20个观察值原始数据序列0X:09625998705105851112704127627128453129988130756X利用Matlab软件对原是数列0X进行一次累加,得到新数列为1X,如表2:表2:新数列1X误差和误差率1X12X13X14X15X16X17X18X拟核值108504109773111056112354113668114997116343误差误差/﹪1X19X110X111X112X113X114X115X拟核值117702119079120471121879121879123304124746误差误差/﹪1X116X117X118X119X120X121X拟核值126204127680129173130683132211133757误差误差/﹪1、利用表2,拟合函数,如下:0.011624(1)92800439183784txte2、精度检验值c=(很好)P=(好)3、得到未来20年的预测值:表3:全国历年年底的人口统计未来20年预测值年份2006年2007年2007年2008年2009年2010年2011年总人口/万人年份2012年2013年2014年2015年2016年2017年2018年总人口/万人年份2019年2020年2021年2022年2023总人口
本文标题:人口预测模型经典
链接地址:https://www.777doc.com/doc-6693274 .html