您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 冶金工业 > 决策理论与方法第三章效用函数
第三章效用函数第一节效用的定义和公理系统一、引言·为什么要引入效用决策问题的特点:自然状态不确定——以概率表示;后果价值待定:以效用度量。1.无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量;2.即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的100元,与已有10000元再增加100元的作用不同,这是钱的边际价值问题。例2:2019年8月18日7时52分礼品a1抽奖a21.00.50.510万元25万元0元在各类决策中,常常面临着这种选择:风险小但期望收益也小;期望收益大但风险也大!不同的决策人有不同的选择,相同的决策人在不同的情境下选择也不同。那么在决策中如何描述或表达后果对决策人的实际价值,以便反映决策人心目中对各种后果的偏好次序呢?*偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养,心理和生理(身体)状态有关。*除风险偏好之外,还有时间偏好。而效用(Utility)就是偏好的量化,是数(实值函数).DanielBernoulli在1738年指出:若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能后果的偏好的期望值最高的行动。决策的目标就是使期望效用极大化。二、效用基本概念及符号◦严格序:ab表示a优于b。满足传递性和非对称性。◦无差异~:a~b表示a与b无差异。满足自反性、对称性和传递性。◦弱序≥:a≥b表示a不劣于b。满足可比性、传递性、与无差异~的一致性和严格优于的一致性。◦展望(prospect)(可能的前景):各种后果(r种)及后果出现的概率的组合,记为:Pj=p1(j),c1;p2(j),c2;…;pr(j),cr,(j=1,2,…,m;m为行动的可能种数)2019年8月18日7时52分◦复合展望:当无法确定采取某个行动时,可随机选择一种行动,设选择行动aj的概率为qj。则决策的展望就是一种复合展望,记为P=q1,P1;q2,P2;…;qm,Pm。所有展望(包括简单展望和复合展望)构成展望空间。2019年8月18日7时52分抽奖(lottery)与确定当量若(;)则称确定性后果为抽奖的确定当量1.0C3C1C2p1-pC1pC,2(),13pC效用的定义◦若展望空间上的实值函数u对于展望空间P的任意两个展望P1、P2,有P1≥P2当且仅当u(P1)≥u(P2),则称u为效用函数三、效用存在性公理(理性行为公理)◦连通性:任意两个展望的优劣都是可比的◦传递性:展望的优劣满足传递性◦复合保序性:展望的优劣关系是可以复合的,且复合不会破坏原有的优劣关系◦偏好的有界性:展望的优劣是相对的,没有无限优的展望,也不存在无限劣的展望。理性行为公理认为合乎理性的决策人在进行价值判断时一定能满足这些公理。(实际决策中是否存在某种悖论呢?)2019年8月18日7时52分Allais悖论2019年8月18日7时52分抽奖a1抽奖a21.00.890.0150万元50万元0元0.10250万元抽奖a1抽奖a21.00.890.0150万元50万元0元0.10250万元决策A决策A抽奖b1抽奖b20.110.9050万元0元0.10250万元决策B实际上决策B是在决策A的基础上同时减去了89%的机会获得50万元,复合保序性没有得到满足0万元0.89效用的公理化定义:在上述公理系统中,若展望空间上存在实值函数u,有:◦对展望空间中的任意展望P1、P2,P1P2当且仅当u(P1)u(P2)◦u(P1+(1-)P2)=u(P1)+(1-)u(P2)(复合展望的效用等于展望效用的复合)◦对满足上述条件的实值函数u1,u2,必有u1(Pi)=bu2(Pi)+c,其中b,c∈R1,b0。(任意两个决策人的效用是线性相关的)◦则效用函数u(P)为(基数)效用函数2019年8月18日7时52分四、效用函数—基数性和序数性前述定义的效用是一种基数效用,不仅能够反映决策者的偏好次序,还能够反映决策者的偏好强度。但在实际决策中,有时只需要偏好次序而不一定需要知道偏好强度就可以决策。此时只需要序数效用就可以了。有关序数效用的应用在多属性决策中介绍。Hicks对效用函数的基数性和序数性的比喻:如果知道两个人的身高,那么我们可以把高个儿排在第一位;如果不知道他俩的身高也没关系,让他们比一下就可以了。2019年8月18日7时52分第二节效用函数的构造一、估计效用函数值的方法概率当量法(VonNeumann,Morgenstern,N-M法):设决策系统的自然状态集Θ={1,…,n}、行动集A={a1,…,am}、后果集C={cij=c(ai,j)},最优后果为c*=max{cij},最劣后果为c0=min{cij}。则对于任意后果cij的效用值u(cij),可按以下步骤获得:◦设u(c*)=1,u(c0)=0;◦建立简单展望p,c*;1-p,c0,p可调◦反复向决策人提问,改变可调概率p,使得当p=pij时得到如下的无差异关系:cij~pij,c*;1-pij,c0◦测得后果cij的效用值为:u(cij)=pij*u(c*)+(1-pij)*u(c0)=pij2019年8月18日7时52分确定当量法(修正N-M法):◦设u(c*)=1,u(c0)=0;◦建立简单展望p,c*;1-p,c0,p为0-1间的给定值,如p=0.5◦反复向决策人提问,改变cij得到如下的无差异关系:cij~p,c*;1-p,c0◦测得后果cij的效用值为:u(cij)=p*u(c*)+(1-p)*u(c0)=pij增益当量法:已知u(cij)和u(c0),确定u(c*)的方法损失当量法:已知u(cij)和u(c*),确定u(c0)的方法2019年8月18日7时52分如何选择估计方法使用确定当量法时决策人对最优后果(增益)的保守性和对损失的冒险性都比概率当量法严重(Hershey,1982)采用增益当量法与损失当量法时产生的误差也比用概率当量法大尽可能使用概率当量法后果为离散型随机变量时,后果集中元素为有限个,构造后果集上的效用函数有两个方面的内容,一是确定各后果之间的优先顺序,二是确定后果之间的优先程度。步骤:二、离散型后果的效用设定例:看球的效用函数构造(不考虑经济成本)1.构建问题的决策树,根据一般偏好,四种后果的优劣是C2C3C4C1;2.令u(C1)=0,u(C2)=1;3.询问1:“下雨看电视转播”的后果与“现场看球”时有多大的概率下雨被淋相当?(例如:0.3,则u(C3)=0.7)4.询问2:“天晴看电视转播”的后果与“现场看球”时有多大的概率下雨被淋相当?(例如:0.6,则u(C4)=0.4)5.一致性检验:用C3,C4加上C1(或C2)进行校验,直至一致性得到满足。2019年8月18日7时52分现场看球a1电视看球a2C4:天晴看电视C3:下雨没被淋C2:天晴未被淋C1:下雨被淋三、连续型后果效用函数的构造若后果是连续型,则可通过分析u(c)的若干特征值,求出特征点的效用后再连成光滑曲线。例:试作出每天投入学习的时间t对应的效用曲线。◦分析特征点:u(t=0)=0;u(tTM)=0(TM=?);状态导入期(0~t0),效用增加较慢;状态稳定期(t0~t1),效用与投入学习的时间基本成比例关系;效率下降,效用增加期(t1~tm),效用是投入学习的时间的单调增函数,但增长率小于状态稳定期且随着时间的增加越来越小,最终达到零(t=tm),此时效用达到最大;当投入的学习时间大于tm时,将会得不偿失,学习效率急剧降低,效用减少。2019年8月18日7时52分2019年8月18日7时52分t0t1tmtM024U(t)Umaxt四、效用曲线的解析函数近似适用于规范化的效用曲线规范化的效用函数是指0≦x≦1,且u(0)=0,u(1)=1的效用函数幂函数对数函数第三节风险与效用一、风险的概念风险:遇到破坏或损失的机会或危险。◦“风险”:以打鱼捕捞为生的渔民们在长期的捕捞实践中,深深的体会到“风”给他们带来的无法预测无法确定的危险,他们认识到,在出海捕捞打鱼的生活中,“风”即意味着“险”,因此有了“风险”一词的由来。◦风险包含两个方面的内容:一是后果的损失严重程度;二是损失出现的可能性大小。◦参考:年8月18日7时52分cdyyfcys)()(222019年8月18日7时52分二、风险的度量◦方差:设某决策方案a的后果为收益y,y的概率密度函数为f(y),期望值为E(y),则方差可用来度量风险,方差越大风险越大。◦协方差:若期望收益为决策人设定的目标收益c,则可用协方差度量风险。临界概率:小于目标收益的概率。dyyfyEy)())((22)()()(cFdyyfcyPc三、效用包含的内容1、对风险的一种态度。2019年8月18日7时52分U(t)Umax=1C(万元)风险厌恶型风险中立型风险追求型0.50912.51425风险酬金k2、对后果的强度偏好3、可测价值函数四、相对风险态度1、效用函数反映的风险的局部测度效用函数与决策人风险的态度关系为:2、可测价值函数反映的偏好强度的局部测度把决策人的可测价值函数所反映的在x处的偏好强度即边际价值记作m(x),即:m(x)0时,可测价值函数v在x处凸,边际价值递增。3、决策人真正的风险态度从决策人的效用函数在x处的风险测度r(x)中扣除可测价值函数在x处的边际价值m(x),就可以得到决策人在x处的真实的风险态度(称为相对风险态度),即:
本文标题:决策理论与方法第三章效用函数
链接地址:https://www.777doc.com/doc-320926 .html