您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 概率论与数理统计在数学建模中的应用
概率论与数理统计在数学建模中的应用——国冰。第一节概率模型一、初等概率模型初等概率模型主要介绍了可靠性模型、传染病流行估计、常染色体遗传模型等三类问题:1、复合系统工作的可靠性问题的数学模型设某种机器的工作系统由N个部件组成,各部件之间是串联的,即只要有一个部件失灵,整个系统就不能正常工作.为了提高系统的可靠性,在每个部件上都装有主要元件的备用件及自动投入装置(即当所使用元件损坏时,备用元件可自动替代之而开始工作)明显地,备用件越多,整个系统正常工作的可靠性就越大.但是,备用件过多势必导至整个系统的成本、重量和体积相应增大,工作精度也会降低.因此,配置的最优化问题便被提出来了:在某些限制性条件之下,如何确定各部件的备用件数量,使整个系统的工作可靠性最大?这是一个整体系统的可靠性问题.我们假设第i个部件上装有ix个备用件(1,2,,)iN,此时该部件正常工作的概率为()ipx,那么整个系统正常工作的可靠度便可用1()niippx(9.1)来表示.又设第i个部件上的每个备用件的费用为iC,重量为iW,并要求总费用不超过C,总重量不超过W,则问题的数学模型便写成为1max()niippx(9.2)11..,1,2,NiiiNiiiicxcstwxcxNiN问题的目标函数为非线性的,决策变量取整数,属于非线性整数规划问题。2、传染病流行估计的数学模型问题分析和模型假设本世纪初,瘟疫还经常在世界的某些地方流行。被传染的人数与哪些因素有关?如何预报传染病高潮的到来?为什么同一地区一种传染病每次流行时,被传染的人数大致不变?科学家们建立了数学模型来描述传染病的蔓延过程,以便对这些问题做出回答。这里不是从医学角度探讨每一种瘟疫的传染机理,而是利用概率论的知识讨论传染病的蔓延过程。假定人群中有病人或更确切地说是带菌者,也有健康人,即可能感染者,任何两人之间的接触是随机的,当健康人与病人接触时健康人是否被感染也是随机的.问题在于一旦掌握了随机规律,那么如何去估计平均每天有多少健康人被感染,这种估计的准确性有多大?给出以下假设(1)设人群只分病人和健康人两类,病人数和健康人数分别记为i和s,总数n不变,即isn(9.3)(2)人群中任何二人的接触是相互独立的,具有相同概率p,每人每天平均与m人接触;(3)当健康人与一病人接触时,健康人被感染的概率为。模型建立求解由假设(2)知道一个健康人每天接触的人数服从(1,)bnp,且平均值是m,则(1)mnp于是(1)mpn(9.4)又设一健康人被一名指定病人接触并感染的概率为1p,则由假设3及(9.4)式得11mppn(9.5)那么一健康人每天被感染的概率2p为211(1)1(1)1iimppn(9.6)由于健康人被感染的人数服从2(,)bsp,其平均值为22()spnip(9.7)标准差为2222(1)()(1)sppnipp(9.8)注意,通常,1nmn,取(9.6)式右端展开式的前两项,有21(1)mimipnn(9.9)最后得到()minin(9.10)221()()pnminipmini(9.11)(9.10)式给出了健康人每天平均被感染的人数与n、i、m、的关系,(9.11)式为变异系数,可看作对平均值的相对误差的度量。二、随机性决策模型所谓行为决策理论,就是用行为科学的观点和方法,对决策活动进行描述,解释和预测的一种理论。它以人的决策行为作为基本要素,以自然科学的实证方法作为主要手段,归纳出一套建立在经验证据基础上的理论观点,拓展了决策论的研究范围。合理的决策必须具备三个条件:(1)目标合理;(2)决策结果满足预定目标的要求;(3)决策本身符合效率、满意、有限合理、经济性的原则。所谓风险型决策是指在作出决策时,往往有某些随机性的因素影响,而决策者对于这些因素的了解不足,但是对各种因素发生的概率已知或者可估算出来,因此这种决策存在一定的风险.①风险决策模型的基本要素决策者——进行决策的个人、委员会或某个组织.在问题比较重大和严肃时,通常应以后者形式出现.方案或策略——参谋人员为决策者提供的各种可行计划和谋略.如渔民要决定出海打鱼与否便是两个方案或称两个策略.准则——衡量所选方案正确性的标准.作为风险型决策,采用的比较多的准则是期望效益值准则,也即根据每个方案的数学期望值作出判断.对收益讲,期望效益值越大的方案越好;反之对于损失来讲,期望效益值越小的方案越好.事件或状态——不为决策者可控制的客观存在的且将发生的自然状态称为状态(事件),如下小雨,下大雨和下暴雨即为三个事件或称三种状态,均为人所不可控因素.结果——某事件(状态)发生带来的收益或损失值.②风险决策方法利用树形图法表示决策过程具有直观简便的特点,将其称为决策树的方法.充分利用灵敏度分析(即优化后分析)方法对决策结果作进一步的推广和分析.决策树一般都是自上而下的来生成的。选择分割的方法有好几种,但是目的都是一致的:对目标类尝试进行最佳的分割。从根到叶子节点都有一条路径,这条路径就是一条“规则”。决策树可以是二叉的,也可以是多叉的。对每个节点的衡量:1)通过该节点的记录数2)如果是叶子节点的话,分类的路径3)对叶子节点正确分类的比例。有些规则的效果可以比其他的一些规则要好。决策树对于常规统计方法的优点。构造好的决策树的关键在于如何选择好的逻辑判断或属性。对于同样一组例子,可以有很多决策树能符合这组例子。人们研究出,一般情况下或具有较大概率地说,树越小则树的预测能力越强。要构造尽可能小的决策树,关键在于选择恰当的逻辑判断或属性。由于构造最小的树是NP-难问题,因此只能采取用启发式策略选择好的逻辑判断或属性。下面我们利用一个例题来说明如何来建立风险决策模型。例1、天龙服装厂设计了一款新式女装准备推向全国。如果直接大批量生产与销售,主观估计成功与失败的概率各为0.5,其分别的获利为1200万元与-500万元,如取消生产销售计划,则损失设计与准备费用40万元。为稳妥起见,可先小批量生产试销,试销的投入需45万元。据历史资料与专家估计,试销成功与失败的概率分别为0.6与0.4,又据过去情况,大批生产销售为成功的例子中,试销成功的占84%,大批生产销售失败的事例中,试销成功的占36%。试根据以上数据,通过建立决策树模型按期望值准则确定最优决策。解答:本题显然是要考核风险性决策模型的建立能力。按照这类模型的建立思路,我们有:问题分析与模型假设1.问题涉及直接大批量生产与销售、取消生产销售计划和小批量试销售这样三个决策方案的取舍,在每种方案下又分为成功或失败两种结果;2.决策目标在表面上看是获利大小,实际上是要决定试销与否;3.尚需注意后面几句话:“大批生产销售为成功的例子中,试销成功的占84%,大批生产销售失败的事例中,试销成功的占36%”,这意味着要计算两个概率,其一是当试销成功时,大批量销售成功与失败的概率;其二是试销失败情况下,大批量销售成功与失败的概率,这意味着要利用贝叶斯概率公式;4.设定以下变量A--试销成功,则A--试销失败;B--大量销售成功,则B--大量销售失败。模型建立求解1.先来计算两个概率,注意到,36.0)/(,6.0)(,84.0)/(BAPBPBAP代入贝叶斯概率公式)()/()()/()()/()/(BPBAPBPBAPBPBAPABP,78.04.036.06.084.06.084.0从而.22.0)/(ABP即当试销成功时,大批量销售成功与失败的概率分别为0.78和0.22.同理可以算出在试销失败情况下,大批量销售成功与失败的概率分别为0.22和0.78.2.以试销与否作为决策思路,先画一方块“囗”称为决策结点,由决策结点向右引出若干条直线表示不同的策略(方案)称为策略分枝,策略分枝的右端画一个圆圈“○”称为状态结点,由它引出表示不同状态及其发生的概率的分枝称为概率分枝,最后在概率分枝的终点画“△”符号表示这一分枝的最终结果的效益值(期望值),正值表收益,负值表示损失.本例对应的决策树如图(见图-2):试销-45万成功0.6失败0.4不试销大量销售大量销售大量销售取消销售取消销售取消销售成功0.78成功0.22成功0.5失败0.78失败0.22失败0.51200万-500万-40万1200万-500万-40万1200万-500万-40万图--2这棵树即为所求的数学模型。我们继续将模型求解出来。根据期望利润值最大准则对决策树进行计算,值得指出的是,画决策树是从左向右画出,画的过程中将各种已知数据标于相应的位置上.但在决策树上进行决策计算却是从右向左进行的:先计算最右端每个状态结点的期望值。一级决策问题,只需利用结果点效益值计算各状态结点的期望效益值即可.当有两级以上决策时则需从右向左逐级计算.结果如图-3决策树的优缺点:优点:1)可以生成可以理解的规则。2)计算量相对来说不是很大。3)可以处理连续和种类字段。4)决策树可以清晰的显示哪些字段比较重要缺点:1)对连续性的字段比较难预测。2)对有时间顺序的数据,需要很多预处理的工作。3)当类别太多时,错误可能就会增加的比较快。4)一般的算法分类的时候,只是根据一个字段来分类试销-45万成功0.6失败0.4不试销大量销售大量销售大量销售取消销售取消销售取消销售成功0.78成功0.22成功0.5失败0.78失败0.22失败0.51200万-500万-40万1200万-500万-40万1200万-500万-40万图--3350350-40-126479.6434.6826826三、随机性存储模型问题分析与模型假设工厂为了稳定的生产,需要贮存一定的原料或零部件;商店为了满足顾客的需要,要有足够的库存商品;银行为了进行正常的营业,需要一定的货币进行周转;医院为了手术的急需,血库必备充足血液.总之库存问题是普遍存在的.早在1915年,哈里斯(Harris)对商业中的库存问题建立了一个简单模型,并求得了最优解,但未被人们注意.1918年威尔逊(Wilson)重新得出了哈里斯的公式,并将其发展.他们的模型都是确定性的,二次大战后,带有随机性因素的库存模型得到研究。目前,库存问题的兴趣已转到了多物品、多个库存点的理论。在随机性需求的情况下,要制订最优的存储策略必须知道一个时间段(如一天、一周、一个月等)内需求量的概率分布,以及订货费、存储费、缺货费(在随机需求的情况下,缺货几乎是不可避免的)。这里有两个可以考虑的问题,第一个问题是:决策者在每个时间段初,应该根据已有的存储量确定应订购多少货物使存储量达到最大,记这个最大的存储量为S。第二个问题是:已有的存储量不低于什么数值时,本时间段就可以不再订购,记这个决定不再订购的那个存储量的最低值为s。整个这种随机存储策略称为(,)sS存储策略。给出以下假设:(1)只考虑一种物品,其需求是随机的,需求量X是非负连续的随机变量,密度函数为()x,分布函数为()x;(2)只考虑一个库存周期,即在库存周期开始时,做一次决策,决定进货量;(3)瞬时供货;(4)决策前原有库存量为I,进货量为Q,决策后的库存量为yIQ;(5)费用包括订货费、存贮费和缺货费.每次的订购手续费为K,货物单价为p;存贮费在周期末结算,它与期末的库存量成正比,比例系数为h(单位存贮费),缺货费与缺货量成正比,比例系数为g(单位缺货损失);(6)决策的准则是期望总费用最小.模型的建立与求解库存问题有补充—库存—需求三个环节.在这一系统中,若一次进货量多,进货的次数就少,进货的费用就少,但库存量大,库存费用就大,造成需求缺货就可能少,缺货损失就会少;若一次进货量少,进货的次数就多,进货费用就大,但库存量小,库存费用就小,造成需求缺货就可能多,缺货损失就会大.如何协调这些矛盾,使该系统在某种准则下运行最佳.即如何确定进货量,使其总费用最小.进货费用为1()()0KpyIyIc
本文标题:概率论与数理统计在数学建模中的应用
链接地址:https://www.777doc.com/doc-6741339 .html