您好,欢迎访问三七文档
第七章参数模型模型的估计和拟合检验例考虑一个医疗保险,保险单规定免赔额为50元,随机抽取了十个理赔观察值如下:1411646403512593171511107567假设明年的通货膨胀率为10%,免赔额不变。试用经验法分布和模型法(假设损失额服从指数分布)对明年的理赔额期望进行估计。解:(1)经验方法。若明年的通货膨胀率为10%,则理赔额为141的观察值为141501.150160.1类似的,上述9个数据变为22.655.649.0391.1289.9358.71667.1122.7628.7可以计算样本均值为05.374101101iizZ,因此每年的平均理赔额为374.05元。请问:上述方法有什么缺陷?在本例中,使用的是理赔额数据。假设明年的通货膨胀率为10%,由于免赔额不变,今年没有获赔的损失事件在明年可能获赔。例如,今年损失额在45.45—50元的损失事件,明年通货膨胀后的损失额为50-55元。由于免赔额为50元,这些事件将得到0-5元的理赔额。但是这些数据在保险公司记录中是没有显示的,因为对于今年损失额低于50元的损失事件,保险公司不承担赔偿责任。解:设X表示实际损失额,服从参数为的指数分布,Y表示今年的理赔额,50|50YXX,则Y的期望5050501501()(50|50)(-50)(|50)()(-50)1(50)exp()(-50)exp(50)(50)exp[(50)]exp[(50)]|EYEXXxfxXdxfxxdxFxxdxxxx我们使用矩估计来估计的估计值。由矩估计法,1335.5Y。若明年的通货膨胀率为10%,则明年理赔额为1.150|1.150XX,平均理赔额为1500/11(335.5)exp(/335.5)(1.150|1.150)(1.150)exp[(500/11)/335.5]369.05xEXXxdx估计方法:1、矩估计法2、极大似然估计法3、分位数估计法一、矩估计法基本思想:设未知参数为1(,,)nθ,解方程ˆ(),1,,kkknθ,或ˆ'()'kkθ,1,2,...,kn得到1(,,)nθ的估计值。下面分三种情况来讨论:1、个体完整数据的矩估计略,具体步骤参看概率统计教材。2、分组数据的样本矩,11111111()ˆ'()()(1)jjkkrrcjjjjkkcjjjjjjnnccxdxnccncck例:已知:(i)抽取10个样本x1,x2,…,x10,这10个样本独立同分布,概率密度函数为111exp()exp(),02xxx(ii)(iii)150ix,25000ix使用矩估计法估计。A9B10C15D20E21答案:D样本一阶矩为15,二阶矩为500,总体的一阶矩和二阶矩分别为222()0.5(),()EXEX。这个可以通过积分或者两个指数分布密度函数的混合得到。通过解方程2230500由于条件(ii),可以求得20例:已知:(i)赔款金额服从平移指数分布,其概率密度函数为:()/1(),xfxex(ii)一赔款金额的随机样本X1,X2,...,X10:55568911121623(iii)ΣXi=100and2iX=1306使用矩估计方法估计δ。(A)3.0(B)3.5(C)4.0(D)4.5(E)5.0答案:D()//()xyxyEXedxedy2222()//222()22xyxyyEXedxedy最终解方程组221022130.6求得4.468。如果注意到XY,Y为一般的指数分布,那么通过X的均值和方差进行估计更为快速。()()EXEY,2()()VarXVarY二、分位数估计法(1)设随机变量X的分布函数为(,)Fx,称()p为(,)Fx的100%p分位数,如果()p满足(()|)pFp(2)分位数的估计:令1ˆ(,),(,,),1,,ijpnpFjn,其中ˆjp为样本的jp分位点。求解这n个方程就得到参数估计值1(,,)n。例:设下表中的理赔记录用weibull分布来拟合,用25%和75%分位数来估计参数的值。0.10.52.24.128.10.20.72.65.930.00.20.92.96.249.20.31.33.212.163.80.41.83.313.65118.0解:weibull的分布函数为/()1xXFxe分别令/0.751xe及/0.251xe解得1112(log4),(log(4/3))xx由于0.25×26=6.5,因此,0.25的分位点为0.5×0.5+0.5×0.7=0.65类似计算,0.75×26=19.5,0.75的分位点为0.5×12.1+0.5×13.65=12.875由分位数估计法1112.875(log4),0.65(log(4/3))解得0.526,=2.770。从而确定了损失分布。例:已知:(i)损失服从loglogistic分布,其累积分布函数:(/)()1(/)xFxx(ii)损失样本如下:10358086901201581802002101500要求使用40th和80th分位点,用经验平滑的方法对分位数估计,求分位数估计法估计的θ。解:先求出40th和80th的分位点,由0.4×12=4.8计算得到40th的分位点为0.2860.89089.2由0.8×12=9.6计算得到,80th的分位点为0.42000.6210206于是我们得到方程组(89.2/)0.4,1(89.2/)(206/)0.81(206/)由第一个方程得到2(89.2/),4(206/)3,将两式相比得到6(206/89.2)于是解得ln(6)/ln(206/89.2)2.1407,由1/2.14074206/解得107.8。课堂练习:求上述数据的60%分位数。例:由10只实验老鼠组成的样本,其死亡时间(以天为单位)为3、4、5、7、7、8、10、10、10、12。假设适合的生存模型服从Gompertz分布,利用25%和65%分位点,估计参数B和c。解:由10n,0.25112.75,0.65117.15,有0.25(2)(3)0.250.754.75XX.0.65(7)(8)0.850.1510XX,Gompertz分布的分布函数为0(1)()ln()1xxBchydycFxee,0,0,1xBc因此,0.25ln(0.75)lnln[1]lncBc,0.65ln(0.35)lnln[1]lncBc令0.250.654.75,10,则由所给等式解得ˆˆ0.039,1.1896Bc。(3)分组数据的样本分位点:对于01p,分组数据的样本100p%的分位点ˆp定义为ˆˆ()nppF即1111()()ˆ()()()()njnjpjjnjnjnjnjpFcFcpccFcFcFcFc或者1111ˆ()jjjpjiijcccnpnn-=,其中1jc和jc满足1()()njnjFcpFc。例某责任险保单规定了保单限额为300,000元,表2.2.5中的第一至三列给出了该险种217份保单的理赔额情况。假设理赔额服从对数正态分布。请用30%和70%分位数法估计参数。表2.2.5理赔额保单数平均理赔额0-2,500411,3892,500-7,500484,6617,500-12,500249,99112,500-17,5001815,48217,500-22,5001520,23222,500-32,5001426,61632,500-47,5001640,27847,500-67,5001256,41467,500-87,500674,98587,500-125,00011106,851125,000-225,0005184,735225,000-300,0004264,025300,0003300,000解经验分布30%和70%的分位点分别为2,500+(65.1-41)5,000/48=5,01022,500+(151.9-146)10,000/14=26,714令5,010和26,714为对数正态分布的分位点,即0.3[(log5,010)/]0.7[(log26,714)/]解方程组得ˆ1.595871,ˆ9.356065。三、极大似然估计法极大函数1()(|)njjjLPXAθθ1、个体完整数据:1()(|)jnXjjLfxθθ,1()ln(|)jnXjjlfxθθ2、分组完整数据:11()[(|)(|)]jrnjjjLFcFcθθθ,11()ln[(|)(|)]rjjjjlnFcFcθθθ例:假设某险种的理赔数据如表理赔额范围理赔数0~7,500997,500~17,5004217,500~32,5002932,500~67,5002867,500~125,00017125,000~300,0009Over300,0003若假设理赔额服从指数分布,则对数似然函数为7,500/7,500/17,500/300,000/()99ln[(7,500)(0)]42ln[(17,500)(7,500)]3ln[1(300,000)]99ln[1]42ln[]3lnlFFFFFeeee使用数值算法得到极大似然估计为ˆ29,721,似然函数值为-406.03。例考察一个在0t处有20个个体的样本,所有的个体均在5周内死亡,并只记录每周的死亡人数,所观察的结果如下:2人在第1周死亡;3人在第2周死亡;8人在第3周死亡,6人在第4周死亡,1人在第5周死亡。假设适合模型为指数模型,求参数的极大似然估计。解:画图来帮助理解对于参数为的指数模型,/()xSxe.那么在第i周死亡的概率为(1)///1/(1)()(1)iiiSiSieeee所以似然函数,5/1/1()[(1)]iniiLee551/111()ln(1)iiiilinen,0123452023861样本(人)时间(周)令51/51221/1ln1101iiiiendLinde,由此得51/15511iiiiiiineinn。由123452,3,8,6,1nnnnn,于是有551120,61iiiinin,因此ˆ2.5170。3、非完整数据(1)只存在右删失censored数据设12,,...,nxxx是随机变量X的n个观测,将它们从小到大排列(1)(2)()nxxx。假设样本数据在xu处存在右删失,且存在1kn使得()(1)kkxux,则样本数据将变为(1)(2)(),,,,,kxxxuu。似然函数可以写为()1()[(;)](;)knkiiLfxSu例:已知:(i)损失服从单参数帕累托分布,概率密度函数:(1)(),1,0fxxx(ii)一个样本量为5的随机样本分别是3,6,14和两次超过25的损失。求α的极大似然估计值。(A)0.25(B)0.3
本文标题:精算模型第七章
链接地址:https://www.777doc.com/doc-3942563 .html