您好,欢迎访问三七文档
第三章效用、损失和风险(Utility,LossandRisk)本章主要参考文献:60,56,86,87,92,129,156,169,183,184§3—1效用的定义和公理系统一、引言·为什么要引入效用决策问题的特点:自然状态不确定——以概率表示;后果价值待定:以效用度量。1.无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量;2.即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的100元,与已有10000元再增加100元的作用不同,这是钱的边缘价值问题。例二:礼品抽奖10.50.51000元02500元上图作为商业、经营中实际问题的数学模型有普遍意义有人认为打赌不如礼品,即1000元优于02500元0.50.5*由上面两个例子可知:在进行决策分析时,存在如何描述(表达)后果的实际价值,以便反映决策的人偏好次序(preferenceorder)的问题*偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养,心理和生理(身体)状态有关。*除风险偏好之外,还时间偏好。i,折扣率ii,其他而效用(Utility)就是偏好的量化,是数(实值函数).DanielBernoulli在1738年指出:若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能后果的偏好的期望值最高的行动。二、效用的定义1.符号i,AB(即APB)读作A优于B:(Prefer(ed)AtoB)AB(即ARB)A不劣于BA~B(即AIB)A无差别于B(Indifference)ii,展望(prospect):可能的前景即各种后果及后果出现概率的组合P=(pc11,;…;,;pcii…pcnn,)既考虑各种后果(consequence)又考虑了各种后果的概率(probabilityorlikelihood)分布所有P的集合记作piii,抽奖(lottery)与确定当量1.0C3C1C2p1-p若C1(pC,2;(),13pC)则称确定性后果C1为抽奖(pC,2;(),13pC)的确定当量2.效用的定义(A)在集合p上的实值函数u,若它和p:若pp12,p,p1p2iffu(p1)≥u(p2)则称u为效用函数三、效用存在性公理理性行为公理VonNeumann-Morenstern,1994[169]·公理1连通性(Connectivity)又称可比性pp12,p,则p1p2orp1p2orp2p1·公理2传递性(Transitivity)ppp123,,p,若p1p2,p2p3则p1p3·公理3替代性公理(加等量时优先关系不变)若ppp123,,p,p1p2且01则对任何p3∈p,必有p1+(1-)p3p2+(1-)p3或者表达成:p1p2,则p1+(1-)p2p1+(1-)p2即二种后果中,决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。·公理4连续性公理----偏好的有界性若p1p2p3则存在01,01,使p1+(1-)p3p2p1+(1-)p3由p1+(1-)p3p2可知p3不是无穷劣,即u(p3)由p2p1+(1-)p3可知p1不是无穷优,即u(p1)p3即使是死亡,亦不至于无穷劣例:i,过马路1107无法到目的地不过过死亡到目的地若死亡为无穷劣,则不能过马路ii,狂犬病疫苗1106注射不注射20元死亡生存上述公理看来是合乎理性的,事实上并不尽然.例:Allais悖论(Paradox〕例如,1953年Allais在一次学术会议上提出如下问题,请效用理论权威Svage回答i.ABi.ii.ii.$2,500,000$500,000$500,000$0$0$0$0$0$0$0$0$500,000$500,000$2,500,0001.0.89.1.01.11.89.1.9Savage的回答是A组宁择i,B组宁择ii,Allais指出:B组的i,ii,均以0.89的$500,000取代0.89的$0,即与A组的i,ii,相对应,照公理3、A、B两组中i,ii,的优先关系应当不变。Savage当时语塞。·效用的公理化定义在上述公理系统中,若p上存在实值函数u,使i,pipj当且仅当u(pi)>u(pj)ii.u(α,pi;1-α,pj)=αu(pi)+(1-α)u(pj)iii,对满足上述条件的u1,u2必有u1(pi)=bu2(pi)+c,其中b,c∈R1,b>0则u(P)称为(基数)效用函数*关于线性:将ii.u(α,pi;1-α,pj)=αu(pi)+(1-α)u(pj)推广到一般,若pi∈p;i≥0,i=1,2,…m;ii=1;则u(im1ipi)=im1iu(pi)四、基数效用与序数效用(Cardinal&OrdinalUtility)基数:实数:1,2,3,π序数:第一,二,…,4,3,2,1·区别:1.基数效用定义在展望集p上(考虑后果及其概率分布),是实数;序数效用定义在后果集C上,不涉及概率,可以是整正数2.基数效用反映偏好强度:(正线性变换下唯一)原数列可变换为:b+c,2b+c,3b+c,πb+c;其中b,c∈R1,b>0.而序数效用不反映偏好强度,(保序变换下唯一),原序数列可变换为16,9,4,1;或8,6,4,2,或10,7,6,1等.·序数效用的存在性公理1.连通性(可比)2.传递性3.对任何确定的后果x,优势集与劣势集均为闭集。(教材:P29§3.1)§3.2效用函数的构造一、离散型的概率分布后果元素有限·各后果效用设定的步骤NM法由公理4:若p1p2p3,则可找到0α1,使p2αp1+(1-α)p3第一步:选定C1,C2C,使C2C1令u(C1)=0,u(C2)=1所选择的C1、C2应使比较易于进行.第二步:对C2C3C1,求α(0α1),使C3αC2+(1-α)C1则u(C3)=u(αC2+(1-α)C1)=αu(C2)+(1-α)u(C1)第三步:若C4C1,求α(0α1),使C1αC2+(1-α)C4则u(C1)=u(αC2+(1-α)C4)=αu(C2)+(1-α)u(C4)u(C4)=α/(α-1)第四步:若C5C2,求α(0α1),使C2αC5+(1-α)C1则u(C2)=u(αC5+(1-α)C1)=αu(C5)u(C5)=1/α第五步:一致性校验设C5C4C3且C5,C4,C3已知,由C4αC5+(1-α)C3求得u’(C4)若u’(C4)与已知的u(C4)不符,则反复进行二、三、四步,直到一致性校验通过.例a2a1c1c2c3()1()2()1()2下雨看球无雨看球下雨看电视c4无雨看电视设C2C3C4C1一、u(C1)=0,u(C2)=1二、C30.7C2+0.3C1u(C3)=0.7三、C40.4C2+0.6C1u(C4)=0.4校验设C30.4C2+0.6C4u’(C3)=0.66≠0.7重复二、三、若u(C3)不变u(C4)=0.5则通过校验.二、连续型后果集·当C为连续变量时,u(c)是光滑的,因此可分段构造,求特征点的效用,再连成光滑曲线例1.每天学习时间的效用曲线在10~12小时/日处效用最大8小时/日处效率最高(效用/小时)例2.见讲义P31之例·注意:效用的唯一性(在正线性变换下唯一)使效用的值域为整个实轴,而不必限于[0,1]§3.3风险与效用一、效用函数包含的内容1.对风险的态度风险厌恶(RiskAversion)风险中立(RiskNeutralness)风险追求(RiskProneness)即有冒险倾向以上是初期对风险的解释(PrattC.,1964)2.对后果的偏好强度钱的边缘价值:设某人现有积蓄为0,增加800地的作用(价值)与有了800元后再加1200元相等,则此人的财富的价值函数是凹函数。若他认为800元(0.5,0;0.5,2000),则与其说此人是风险厌恶不如说他是相对风险中立。为此有必要对确定性后果的偏好强度加以量化。3.效用表示时间偏好十分复杂,我们在第八章再介绍。二、可测价值函数——确定性后果偏好强度的量化定义:在后果空间X上的实值函数v,对ω,x,y,z∈X有i,ωxyz当且仅当υ(ω)-υ(x)≥υ(y)-υ(z),且ii,v对正线性变换是唯一确定的。则称υ为可测价值函数说明:i,ωxyz表示ω,x之间偏好强度之差超过y,z之间偏好强度之差,ii,由定义之ii,可测价值函数具有基数性质但与基数效用不同:VF不反映DMer的风险态度。iii,它定在后果空间上,能起序数效用的作用但又与OUF不同:能反映后果的偏好强度.三、相对风险态度设效用函数u和测价值函数v在X上都是单调递增,且连续二次可微。1.风险的局部测度0u在x处凹,风险厌恶r(x)=-u”(x)/u’(x)=0u在x处线性,风险中立0u在x处凸,风险追求2.偏好强度的局部测度0在x处有递减的边缘价值m(x)=-v”(x)/v’(x)=0在x处有不变的边缘价值0在x处有递增的边缘价值3.真正的(相对)风险态度的定义若m(x)<r(x)称为在X'区内相对风险厌恶m(x)=r(x)称为在X'内相对风险中立m(x)=r(x)称为在X'内相对风险追求四、风险酬金kE(x)-S这是决策人为了避免风险而顾意损失的金额k=f(v,P)五、钱的效用1.性质i,单调递增:愈多愈好有界:全世界财富总量不足$1016,u(10100)与u(1090)几乎无差异ii,x较小(相对于决策人资产而言)时,u(x)近乎线性iii,x0时u(x)通常是凹的递减的边缘价值风险厌恶x0与x0的形状不同,负债较多有追求风险的倾向.2.钱的效用曲线的构成设某人现有1000元存款(某商店有资产10万,企业有1000万等等)i,NM法(见§3.2)利用x2~αx1+(1-α)x3ii,修正的NM法利用x2~0.5x1+0.5x3例:设u(0)=0),u(1000)=1有300~0.50+0.51000u(300)=0.5又125~0.50+0.5100u(125)=0.25550~0.5300+0.51000u(550)=0.75由0~0.5a+0.5500设a=-250则u(-250)=-u(500)=-0.72-250~0.5b+0.50原因:i,价值函数是S型ii,在一定范围内相对风险态度不变iii,负债到一定程度以上有冒险倾向Friedmann-Savage效用曲线(1948):§3.4损失、风险和贝叶斯风险一、损失函数L有些文献采用损失函数进行分析∵u(c)=u(θ,a)∴l(θ,a)-u(θ,a)则损失函数与效用作用相同为了使损失值非负,可取l(θ,a)=AaSupSupu(θ,a)-u(θ,a)二、风险函数自然状态集Θ-----参数空间行动集A-----决策空间观察值集X-----测度空间决策规则δ:x→a,,Δ为策略空间损失l(θ,a)=l(θ,δ(x))由于X是随机变量,对给定的θ,采用决策规则δ时定义风险函数R(θ,δ)=EX[l(θ,δ(x))]=[xXl(θ,δ(x))]f(x|θ)dx或xXl(θ,δ(x))p(x|θ)三、贝叶斯风险r(π,δ)EπR(θ,δ)含义:θ的先验分布为π,决策规则为δ时风险函数的期望值叫贝叶斯风险即:r(π,δ)=ER(θ,δ)=[xXl(θ,δ(x))f(x|θ)dx]π(θ)dθ或xXl(θ,δ(x))p(x|θ)π(θ)
本文标题:损失和风险
链接地址:https://www.777doc.com/doc-521256 .html