您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 第4章模拟结果的统计分析
4.1引言4.2模拟结果统计分析面临的问题4.3终态模拟的输出分析4.4稳态模拟的输出分析4.5多方案模拟输出的比较第4章模拟结果的统计分析什么是输出分析?为什么要进行输出分析?输出分析的两种状态系统(结构数量是确定的)(结构参数是随机的)输入(参数是随机的)输出?确定的输入激励一个确定的系统,得到的输出就是一个确定的输出。通过一次确定的模拟便可得出解。随机的输入激励一个随机的系统,得到的输出是……?输出的表达形式如何?需要经过多少次的模拟才能说明输出结果?输出分析的目的在于预测一个系统的性能,或比较两个或多个不同系统设计的性能。估计系统的性能参数,以及性能参数估计的有效范围。用模拟统计得到的‘作为观察值的估计量。统计得到的方差S2就是估计量的偏差范围。或确定出达到给定精度所需的观察次数。在离散事件模拟中,大多数模拟输出数据呈现出自相关的特征,即:前面的输出往往会影响到后面的输出数据。如:库存系统中的初期库存、生产系统中的初始状态、排队系统中初始排队状态和初始服务状态等。4.1引言4.1引言-输出状态终态模拟就是指在某个持续时间TE之内系统的模拟,这里E是停止模拟的一个指定的事件,这样被模拟系统在指定初始条件下于时刻0“打开”,并在停止时刻TE“闭合”。终态系统常被用来研究系统的固有特性,研究系统在初始条件作用下的响应。非终态系统是指系统在持续循环运行时间内,前一时间结束的模拟结果影响到后一时间的模拟条件。非终态系统是连续运行的系统,至少在很长一段时期内运行。稳态系统模拟常被用来研究系统对外界条件变化的响应能力。通常稳态系统的响应与系统的初始状态无关。暂态(终态)稳态(非终态)4.1引言-例题选择终态/稳态模拟例如,考虑对企业中一条流水线进行模拟如果我们的模拟目的是为了了解该流水线从完好状态开始到第一次出现故障的间隔时间的分布,那么我们就应采用终态模拟方式;如果我们希望了解的是由该流水线生产的产品的合格率,则应该采用非终态模拟方式。4.1引言-过渡状态与稳定状态在模拟模型的上述两种运行方式下,模拟系统都可能经历两种不同的状态,即过渡状态(TransientState)和稳定状态(SteadyState)在对模拟模型的输出进行统计分析时,应该分清采样数据是在当模拟系统处于过渡状态时采集的,还是在稳定状态时采集的。对于一个离散事件模拟系统,假设s(t)是t时刻系统所处的状态,Ps(t)是在时刻t系统处于状态s的概率。如果有t0满足:则我们称当t≥t0时系统处于稳定状态,而在tt0系统处于过渡状态。当系统处于稳定状态时,系统处于某一个状态的概率是不变的,但系统仍然可以从一个状态变到另一个状态ttdPtdts00min{|(),tt}4.2面临的问题由于在离散事件模拟模型中往往有许多随机变量,从而模拟的输出亦是随机变量,因此直接使用模拟模型的输出结果就有可能对实际系统作出错误的结论。例:现考虑一个M/M/1排队系统,此时顾客的到达间隔时间与服务员的服务时间均服从指数分布,假设到顾客达间隔时间的均值为6分钟,服务员服务时间的均值为4分钟。从排队论的理论分析,该排队系统的平均排队时间应为Wq=8分钟。下表给出的是10次模拟的结果(每次模拟时间为10天,即14400分钟)模拟次数12345678910平均值到达顾客数25012334234224542315239124022312236623672378.4平均排队时间9.895.937.398.115.557.618.178.1710.404.227.74相对误差%23.63-25.87-7.631.38-30.63-4.882.132.1330.00-22.25-3.25如果我们简单地接受一次模拟运行的结果,那么得出的结论与实际情况就会有很大的偏差。4.2面临的问题对从一个随机系统中获得的样本进行统计分析时,最常用的方法是点估计和区间估计。假设系统中获得的样本为{x1,x2,…,xn},样本均值的点估计与样本方差的点估计s2分别定义为:可以证明当xi为独立同分布随机变量时,和s2分别是和2的无偏估计,而且样本量n越大,对估计的精度就越高xxnxiin11snxxiin22111()4.2面临的问题在实际应用中,人们还希望知道和之间的差异程度,这种差异程度一般采用区间估计的方法来表示。区间估计给出了以为中心的一个区间,而该区间以概率(或置信度)1-包含,称之为显著水平(01)区间估计的建立方法按样本方差2是否已知而不同在进行点估计和区间估计时,对样本都有一定的要求,至少样本应满足独立同分布,特别当真实的样本方差2未知时,对样本母体均值作区间估计还要求母体是正态分布。xx4.2面临的问题从系统模拟过程中获得的采样数据一般都不满足这些条件,主要有以下几点原因:(1)模拟初始条件的影响初始条件决定了模拟模型在开始运行时模拟系统所处的系统状态。初始系统状态对模拟系统前期的行为有很大的影响,因此在模拟前期得到的采样数据会有很大的偏差。特别是在终态模拟方式下,如果终态事件发生时,系统还没有达到稳定状态,那么采集的数据与真实情况的偏差会很大。4.2面临的问题例:考虑一个M/M/1排队系统的模拟模型,假设顾客的平均到达率为12人/小时,单位顾客的平均服务速度为0.075小时/人,即服务强度为0.9。假定模拟开始时已有的等待服务的顾客数作为系统的初始状态,我们希望通过模拟,确定在不同初始状态下,系统在1小时时的平均排队长度,以及在0初始状态下,系统在不同时刻时的平均排队长度。这是一个终态模拟问题。首先,对每一个固定的初始状态,我们进行100次重复模拟,以确定在该初始状态条件下,系统在1小时时的平均排队长度。模拟的结果如下表所示。初始状态0123456789101112平均排队长度2.103.133.344.484.755.894.337.478.409.099.9911.2211.934.2面临的问题其次,我们假定模拟开始时,系统内等待服务的顾客数均为0,进行1000次模拟以确定在不同时刻,系统的平均排队长度。下图给出了模拟的结果。这个系统的平均排队长度的理论值为8.1,从图中我们可以看到,如果初始状态为0,则大约在30小时以后,也就是说大约有12×30=360个顾客到达后,系统才进入稳定状态。4.2面临的问题(2)样本之间相关性的影响从模拟系统中得到的数据构成了一个时间序列,而该时间序列是一种具有自相关特性的随机过程。例如,在模拟一个排队系统时,如果性能测度指标是顾客的平均排队时间,此时很显然相邻顾客的排队时间之间有着密切的关系,即如果前一个顾客的排队时间较长,则后一个顾客的排队时间较长的概率就比较大在模拟结果的统计分析中,为了能够使用经典统计分析中的常用方法,应该采用恰当的数据采样方法,并对采样数据作必要的预处理,以适应模拟输出结果统计分析的需要。4.3终态模拟的输出分析在终态模拟方式下,为了使采样数据xi具有独立性并具有相同的均值,一般采用重复模拟的方法,即在相同的初始条件下,对模拟模型进行重复运行。每次运行时要求采用不同的随机数发生器或者对同一随机数发生器采用不同的随机数种子,以满足采样数据独立性以及同均值的要求。一般,xi的选取按照进行系统模拟的目的来确定例如,就排队系统而言,如果希望了解前m个顾客的平均排队时间,xi就可以采用第i次模拟过程中前m个顾客排队时间的平均值;如果感兴趣的是某一时刻系统中顾客的排队长度,则xi可以采用第i次模拟过程中在该时刻系统中排队长度的观察值。4.3终态模拟的输出分析1.重复模拟方法假如对模拟模型进行了n次独立的运行,获得了n个互相独立的样本,通常就可以直接采用统计方法给出样本样本均值的点估计与区间估计。2.获得预定模拟精度下估计的方法随着重复模拟次数n的增加,样本均值的方差将变小,从而系统性能测度指标均值的点估计的精度将会提高;随着重复运行的次数n的增加,置信区间将变小,从而区间估计的精度也将提高。但是,无限制地增加重复模拟的次数将会大大地增加模拟的时间与费用。因此,希望找到在给定精度下最少模拟运行次数的确定方法。4.3终态模拟的输出分析概率意义下定义的模拟精度(1)绝对精度模拟的绝对精度为,是指在显著水平下,置信区间的半宽不大于的概率为1-,即假设是达到绝对模拟精度的最少运行次数,则有PxEx()1nnntsnnmin,114.3终态模拟的输出分析(2)相对精度所谓模拟的相对精度为,是指在显著水平下,置信区间的半宽与样本均值之比不大于的概率为1-,即假设是达到相对模拟精度的最少运行次数,则有PxExx()1nntsnxnmin,114.3终态模拟的输出分析在实际应用中,精度参数和可由分析者根据实际要求确定。例如,在排队系统中,如果要求平均排队时间的估计值的偏差不超过1分钟,则就可取1分钟;如果要求平均排队时间的估计值的偏差不超过样本均值的10%,则可以取为10%。为了确定达到一定精度的最少模拟运行次数,必须预先知道样本标准差和样本均值样本标准差和样本均值是要通过模拟得到的。因此,在实际应用时,先对系统作n0次重复独立模拟,确定样本标准差s和样本均值的近似值4.4稳态模拟的输出分析在模拟系统达到稳定状态时才进行数据的采样主要问题(1)必须找到确定模拟系统是否已达到稳定态的方法为了消除模拟初始条件对模拟过程中采样值的影响,可以将模拟运行划分为“预热”阶段[0,T0]和数据采集阶段[T0,TE]。这里T0的选取应使得系统在T0以后的状态具有稳态代表性,实际中往往是通过试运行来确定T0。(2)系统在达到稳定状态以前的过渡阶段可能很长为了使系统尽快到达稳定状态,我们应尽量使模拟运行的初始条件(系统状态变量的初始设定)符合稳态条件的要求。4.4稳态模拟的输出分析输出分析方法(1)重复运行法与在终态模拟方式下所采用的重复模拟方法有相同的基本思想。对模拟模型在相同的初始条件下作n次运行,每次采用不同的随机数流,数据采样只在采集阶段[T0,TE]之间进行,即舍弃过渡阶段[0,T0]之间的统计数据。(2)批平均值法采用重复模拟方法,必须在每次模拟过程中经过预热阶段,此外由于每次模拟中系统处于过渡状态的时间长短不同,从而造成在采集的数据或多或少地受到初始状态的影响。在批平均值方法中,将模拟模型作一次长时间的运行,将样本采集阶段划分为n个采集区间(即批区间),然后以这些批区间上的采样值的平均值所构成的样本,来估计系统的稳态性能测度。4.4稳态模拟的输出分析(3)再生点方法在批均值方法中,对批区间采用了等间隔划分的方法,由于在每批的采集的初始点系统所处的状态并不相同,因此相邻批平均值之间不能保证独立性。再生点方法采用模拟过程中系统状态的再生点来进行分批系统状态的再生点是指系统模拟过程中的时刻点t1,t2,…,这些时刻点与系统在这些时刻点上的状态具有以下性质:(1)两个相邻时刻点的间隔时间di=ti-ti-1是独立同分布的;(2)系统在这些时刻点上具有相同的状态值;(3)系统在时刻点ti以后的行为只与ti时刻系统所处的状态有关,而与ti以前系统的状态无关。di称为“再生周期”4.5多方案模拟输出的比较对不同的方案或策略进行模拟时,不同方案的性能指标可能有差异,这种差异可能是由于不同方案或策略的本质差别所造成的,也可能是由于模拟输出的随机性引起的。对多方案的模拟输出作统计上的比较与分析,目的就是为了对性能指标差异的上述两种原因作出鉴别,从而达到正确选优的目的。由于模拟的输出在本质是随机变量,因此在用模拟输出结果进行方案比较分析时,我们必须借助于统计检验方法。为了使统计检验方法有效,样本数据应满足一些条件,其中最重要的一点就是样本数据应满足独立性的要求。在实际问题中,评价系统优劣的性能指标可能有多个。在这里,主要对单指标系统进
本文标题:第4章模拟结果的统计分析
链接地址:https://www.777doc.com/doc-2195016 .html