您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第02讲随机决策理论与方法-1
决策理论与方法——随机决策理论与方法(1)合肥工业大学管理学院2019年8月31日2019年8月31日3时47分决策理论与方法-随机决策理论与方法随机性决策风险性决策(随机性决策):指有多种未来状态和相应后果,但只能得到各种状态发生的概率而难以获得充分可靠信息的决策问题。特点:状态的随机性;决策结果的效用特性。决策的已知变量:状态空间的概率分布Θ,P={1,p1,2,p2,…,n,pn}后果的效用函数(或损失函数):u(cij),cij表示采取方案ai时出现状态j的后果解决问题的主要理论方法:概率论与数理统计2019年8月31日3时47分决策理论与方法-随机决策理论与方法随机决策理论与方法1、主观概率2、效用函数3、决策准则4、贝叶斯决策分析2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—概率的定义古典概率的定义:在相同条件下进行了n次试验(随机试验),其中事件A发生的次数nA称为事件A发生的频数,比值nA/n称为事件A发生的频率,记为fn(A),则古典概率的定义为:p(A)=limn→∞fn(A)Laplace的定义:p(A)=k/n;其中k为事件A所包含的基本事件数,n为基本事件ei的总数。(基本事件数有限,每个基本事件等概率)公理化定义:E是随机实验,S是E的样本空间,对E的每一事件A,对应有确定的实数p(A),若p(A)满足:①非负性:p(A)≥0;②规范性:p(S)=1;③列可加性:对两两不相容事件Ak,有p(∪kAk)=Σkp(Ak)。(Ai∩Aj=Φ,i≠j)2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—概率的定义客观(Objective)概率:上述三种定义的概率是在多次重复试验(随机试验)中,随机事件A发生的可能性的大小的度量,称为客观概率。主观(Subjective)概率:在实际管理决策中,许多事件的发生概率是无法通过随机试验获得的,或条件不允许,或事件本身不允许。因此需要一种方法来人为设定事件发生的概率,称为主观概率。主观概率是人们根据经验、各方面的知识以及了解到的客观情况进行分析、推理、综合判断,对特定事件发生的可能性的信念(或意见、看法)的度量(Savage,1954)。2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布与先验假设先验分布(PriorDistribution):根据先验信息所确定的概率分布叫先验分布,获得先验分布是贝叶斯分析的基础。决策中先验分布的获得具有高度的主观性。先验假设:为使先验分布估计规范化,需要做一定的假设。连通性假设:指事件A和事件B发生的可能性是可比的,即p(A)p(B),p(A)~p(B),p(A)p(B)必有一个成立。传递性假设:若对事件A、B、C,有p(A)p(B),p(B)p(C),则p(A)p(C)。(满足连通性和传递性的二元关系才能构成完全序)部分与全体关系假设:若事件A是事件B的一部分,则p(B)≥p(A)。2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:比较法比较法1-离散型(对事件发生的各种状态加以比较确定相对似然率)某气象专家对当年的气候状况进行评估,认为当年气候正常(1)与受灾的可能性之比约为3:2;如果受灾,则水灾(2)、旱灾(3)的可能性相当。据此,我们可推算出当年气候状况的先验分布:(1)+(2)+(3)=1;(1)/((2)+(3))=3/2;(2)=(3)解得:(1)=0.6,(2)=0.2,(3)=0.2思考:设某决策问题有n个状态,有m个专家对各状态发生的可能性进行了比较评估,我们如何综合利用所有专家的评估结果得到最终的先验分布?2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:打赌法打赌法(离散型)设打赌者(A)的个人财产为W。设事件E发生时A获得收入为p,(0p1;pW:保证打赌者的效用函数是线性的),不发生时A获得的收入为1-p。调整p值使A感觉无论事件E是否发生,其收入基本相同,即(E)×p=(1-(E))×(1-p)。则事件E发生的可能性(E)=1-p。不下雨下雨分蛋糕,猜下雨2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:直方图法直方图法(适合于自然状态在实轴某个区间连续取值)区间离散化:把的取值范围划分为若干子区间1…n;赋值:估计每个区间的似然率(i),据此作出直方图;变换:将直方图拟合为概率分布函数F(x)=Σ≤x()。00.050.10.150.20.251%2%3%4%5%6%7%8%9%10%11%12%13%增长率似然率不足之处:区间数n难以确定似然率(i)估计困难F(x)通常有较大的尾部误差2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:比较法比较法2-连续型离散化:同直方图法比较赋值选择一个似然率最大的子区间k作为基准,设其相对似然率为Rk,然后给出其他各区间i相对于k的似然率Ri,则(i)=Ri/ΣRi由决策者给出每两个子区间似然率的比例关系:rij=(i)/(j),然后计算出每个状态i的似然率(i)。变换拟合:同直方图法思考:(1)如果决策者判断没有误差,即rij*rji=1,rij*rjk=rik,如何求(i)?(2)如果决策者判断有误差,则又如何求(i)?2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:分位点法区间对分法(分位点法)-连续型确定事件不可能发生的临界状态取值(如某地区人口出生率不可能低于9‰,但也不可能超过18‰);求中位数:当状态取值为此值时,大于或小于此值的状态出现的概率相等(如某地区人口出生率的中位数为12.5‰);确定上下四分位点;确定八分位点(一般仅取到八分位点)。2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:分位点法CDF:出生率累积分布函数2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:分布函数法与给定形式的分布函数相匹配(最常用也容易滥用)[Matlab工具箱:StatisticsToolbox/ProbabilityDistributions]均匀分布(连续型):如果随机变量落在某个区间(a,b)中任意等长度的子区间内的可能性相等,则它服从均匀分布,均匀分布的概率密度函数为:[Matlab函数:unifpdf(x,a,b),unifit(DATA)]abxf1)(abab12019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:分布函数法二项分布:(离散型)每次随机试验中事件A出现的概率为p,n次独立试验中事件A出现k次的概率服从二项分布:[Matlab函数:binopdf(k,n,p),binofit(k,n)]泊松分布:(离散型)每次随机试验中事件A出现的概率为p,n次(n→∞,但n*p=为常数)独立试验中事件A出现k次的概率服从泊松分布:[Matlab函数:poisspdf(k,),poissfit(DATA)]knkknppCnkpB)1(),,(ekkpk!1),(2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:分布函数法2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:分布函数法2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:分布函数法正态分布(高斯分布):(连续型)若连续型随机变量的概率密度函数为:则称随机变量服从参数为、2的正态分布[Matlab函数:normpdf(x,,),normfit(DATA)]。参见相关统计学书籍,看看还有哪些分布函数可供选择使用?222)(21)(xexf2019年8月31日3时47分决策理论与方法-随机决策理论与方法主观概率—先验分布估计:分布函数法2019年8月31日3时47分决策理论与方法-随机决策理论与方法随机决策理论与方法1、主观概率2、效用函数3、决策准则4、贝叶斯决策分析2019年8月31日3时47分决策理论与方法-随机决策理论与方法效用函数—问题的引入复习信息集:为减少行动集、自然状态集、后果集的不确定性开展调查研究所获得的信息。自然状态集:事物所有可能的自然状态Θ={1,…,n}行动集:决策主体可能采用的所有行动集合A={a1,…,am}后果集:决策问题各种可能的后果集合C={cij=c(ai,j)},cij表示决策人采取行动ai时出现自然状态j时的后果。主观概率是用来量化自然状态的随机性,那么我们如何度量一个后果的价值呢?面临两个难题:后果价值的量化存在困难(如降价促销对品牌的伤害);即使能够量化标度,但相同标度值的价值因人而异。2019年8月31日3时47分决策理论与方法-随机决策理论与方法效用函数—问题的引入礼品a1抽奖a21.00.50.52000元5000元0元在各类决策中,常常面临着这种选择:风险小但期望收益也小;期望收益大但风险也大!不同的决策人有不同的选择,相同的决策人在不同的情境下选择也不同。那么在决策中如何描述或表达后果对决策人的实际价值,以便反映决策人心目中对各种后果的偏好次序呢?2019年8月31日3时47分决策理论与方法-随机决策理论与方法效用函数—效用的定义效用就是偏好的量化值。决策的目标就是使期望效用极大化。基本概念及符号严格序:ab表示a优于b。满足传递性和反对称性。无差异~:a~b表示a与b无差异。满足自反性、对称性和传递性。弱序≥:a≥b表示a不劣于b。满足自反性、传递性和反对称性。展望/前景(prospect)(事态体):每种行动i都有n种后果,n种后果及后果出现的概率(自然状态发生的概率)的组合,记为:Pi=p1(i),c1(i);p2(i),c2(i);…;pn(i),cn(i),(i=1,2,…,m)2019年8月31日3时47分决策理论与方法-随机决策理论与方法效用函数—效用的定义复合展望:当无法确定采取某个行动时,可随机选择一种行动,设选择行动ai的概率为qi。则决策的展望就是一种复合展望,记为P=q1,P1;q2,P2;…;qm,Pm。所有展望(包括简单展望和复合展望)构成展望空间。效用的定义若展望空间上的实值函数u对于展望空间的任意两个展望P1、P2,有P1≥P2iffu(P1)≥u(P2),则称u为效用函数(不同的决策者u是不同的)。2019年8月31日3时47分决策理论与方法-随机决策理论与方法效用函数—效用的定义效用存在性公理(理性行为公理)连通性:任意两个展望的优劣都是可比的。传递性:展望的优劣满足传递性。复合保序性:展望的优劣关系是可以复合的,且复合不会破坏原有的优劣关系。展望的优劣是相对的,没有无限优的展望,也不存在无限劣的展望。2019年8月31日3时47分决策理论与方法-随机决策理论与方法效用函数—效用的定义效用的公理化定义:在上述公理系统中,若展望空间上存在实值函数u,有:对展望空间中的任意展望P1、P2,P1P2iffu(P1)u(P2)u(P1+(1-)P2)=u(P1)+(1-)u(P2)(复合展望的效用等于展望效用的复合)对满足上述条件的u1,u2,必有u1(Pi)=bu2(Pi)+c,其中b,c∈R1,b0。(任意两个决策人的效用是线性相关的)2019年8月31日3时47分决策理论与方法-随机决策理论与方法效用函数—基数性和序
本文标题:第02讲随机决策理论与方法-1
链接地址:https://www.777doc.com/doc-618277 .html