您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 武振昆的logistic判别模型在风险管理中的应用(自动保存的)
logistic判别模型在风险管理中的应用ApplicationofLogisticModeltotheRiskManagementAnalysis学院:经济学院班级:金融三班姓名:武振昆学号:21100801指导教师:花秋玲日期:2012年12月logistic判别模型在风险管理中的应用武振昆(经济学院金融三班21100801指导教师:花秋玲)摘要:logistic模型又称logistic回归分析,是多元回归分析的拓展,其因变量不是连续的变量;在logistic分析中,因变量是分类的变量;logistic和probit回归皆为定性回归方程的一种;他们的特点就在于回归因变量的离散型而非连续型。Logistic回归又分为binary和multinominal两类,模型主要在流行病学中应用较多,根据危险因素预测某疾病发生的概率等等,logistic模型目前主要还应用在我国商业银行信用风险管理中,因为在信贷风险管理上的模型方法还很落后,而恰好我国商业银行的信贷数据满足logistic模型的要求,因此logistic模型在信贷风险管理中占有一定地位,本文借用由财经报提供的数据,用logistic模型进行预测,并通过未来数据对预测结果进行检验。关键词:logistic模型,违约率,违约企业,非违约企业一、引言进入20世纪80年代以来,logistic回归分析法逐步取代了传统的判别分析法。这种方法不仅本身灵活简便,而且它的许多前提假设比较符合经济现实和金融数据的分布规律,譬如它不要求模型变量间具有线性的相关关系,不要求变量服从协方差矩阵相等和残差项服从正态分布等,这使得模型的分析结果比较客观。同时,具体公司数据带入模型之后得到的是一个概率值,在实际使用中简单方便。结合我国商业银行信用风险管理及上市公司财务数据的现状,前提假设及对数据的要求相对符合经济现实的logistic模型更加适合我国企业信用风险的度量和管理研究。一、方法理论1.1、Logistic回归原理Logistic回归模型描述的是概率P与协变量12,.......kxxx之间的关系,考虑到P的取值在0----1之间,为此要首先把logistic变换为()ln()1pfpp,使得它的取值在到之间,然后建立logistic回归模型:P=p(Y=1)()ln()1pfpp=011+......kkxx011011+......+......1kkkkxxxxepeLogistic回归模型的数据结构:观察值个数取1的观察值个数取0的观察值个数协变量12,.......kxxx的值N1r1n1-ri………………………N2r2n2-r2……………………….........Ntrtnt-rt……………………….根据数据,得到参数01....k的似然函数011011011+......1+......+......1()()11kkiiikkkkxxrnrtixxxxeee使用迭代算法可以求得01....k的极大似然估计。1.2、含名义数据的logistic模型婚姻状况是名义数据,分为四种情形:未婚、有配偶、丧偶、离婚;在建立logistic模型时,定义变量M1、M2、M3,使得(M1=1,M2=0,M3=0)表示未婚;(M1=0,M2=1,M3=0)表示有配偶(M1=0,M2=0,M3=1)表示丧偶(M1=-1,M2=-1,M3=-1)表示离婚也可以将三变量定义为(M1=1,M2=0,M3=0)表示未婚;(M1=0,M2=1,M3=0)表示有配偶(M1=0,M2=0,M3=1)表示丧偶(M1=0,M2=0,M3=0)表示离婚一般来说,只要矩阵1111122213331444abcabcabcabc非奇异,可以定义(M1=a1,M2=b1,M3=c1)表示未婚;(M1=a2,M2=b2,M3=c2)表示有配偶(M1=a3,M2=b3,M3=c3)表示丧偶(M1=a4,M2=b4,M3=c4)表示离婚1.3、含有有序数据的logistic回归文化程度是有序的定性变量,他有一个顺序,由低到高为文盲、小学、中学、高中、中专;大学。常用数字来表示顺序变量,例如用0、1、2、3、4、5表示文化程度由低到高。1.4、multinominal多项logistic回归模型以上讨论的都是二值logistic回归,实际问题中有许多响应变量是多值的情形,这时就需要用到多值logistic回归;Nominal型的响应变量:研究三个学校和两个不同的课程计划对学生偏好何种学习方式的影响。其相应变量学习方式y=1自修、y=2小组、y=3上课;学校课程计划学习方式合计X1x2x3y=1y=2y=3(10)x3=05125067X3=110172653(01)x3=016123674X3=121172664(00)x3=012122044X3=115151646在响应变量是名义变量时,挑选她的一个值作为参照物,让其他值与其作比较,这里以y=3上课作为参照物。令p1、p2、p3分表表示学生偏爱自修小组、上课的概率;以上课作为参照建立logistic模型。11011112213332202112222333lnlnpxxxppxxxp从而有10111122133101111221332021122223320211222233101111221332021122223310111122133202112222331231111xxxxxxxxxxxxxxxxxxxxxxxxepeeepeepee然后参照二值logistic模型得到多项logistic回归模型参数101123、、、、、、、八个参数的最大似然估计。二、研究现状Martin(1977)首次将多元逻辑回归分析引入财务危机理论,他从25个财务指标中选取8个变量回归分析。Ohlson(1980)选择了1970-1976年间破产的105家公司和非破产公司2058家组成配对样本,分析了样本公司在破产概率区间上的分布,发现公司规模、资本结构、经营业绩、资产流动性能显著反映公司财务危机状况,预测准确率达到96.12%,构造了Probit回归模型。三、选择Logistic模型原则第一,基于准确性原则。单变量判别模型操作简单,容易理解,但是准确性低。多元判别分析模型适用的前提条件是假设自变量呈多元正态分布以及非财务危机企业与财务危机企业具有同一协方差矩阵。现实中很少有企业能满足上述两个条件,因此,多元判别分析模型的适用性受到很大限制。Logistic模型放宽了上述两个条件,不仅适应性增强了,而且预测准确率还提高了。Logistic模型不单考虑公司的经营业绩会显著反映财务困境状态,还考虑了企业规模的影响。第二,基于实用性原则。Logistic模型不要求企业自变量呈正态分布,也不要求财务危机公司与非财务危机公司之间具有同一协方差矩阵,Logistic模型要求个体选择偏好的同质性和不相关备选方案的独立性。在现实实务中这种假设条件也很难完全满足。人工神经网络模型没有企业样本假设条件,适应性很强,但是该理论基础抽象,计算复杂且不易于理解。由于其理论抽象性,该模型的科学性和准确性还有待进一步验证,所以其实用性受到限制。第三,基于成本效益原则。模型使用与避免的贷款损失要符合成本效益原则。基于经营环境的复杂性和波动性,我们不能预测所有发生财务困境的公司,那么,在合理的接受水平下,用最小的成本最大准确性的发现可能发生财务困境的公司。四、选择Logistic回归模型进行实证分析本文选用企业信贷违约风险的一组数据,应用logistic模型进行实证分析,观察其实际应用能力。财务分析中用binary二分类,违约概率用multinominal有许多分类的,由于多分类变量过于复杂,也存在一定限制,所以本文采用二分类进行财务分析。在度量企业信贷风险过程中,企业经营成功与失败是一个两分类变量,作为两分类因变量的企业经营状况的概率取值在0-1之间,但在线性模型条件下,不能保证自变量在各种组合下,因变量的取值仍在0-1之间。解决该问题的办法可通过对因变量作logit转换,使其取值范围在-∞到+∞之间,这样就可用logistic回归方法研究企业经营状况与财务之问的关系。Logistic回归方程可以将企业的财务比率转换为企业在一定时间期限内的预期违约概率,以此判断和预测企业的违约风险大小。4.1模型设计本文将上市公司信贷违约与信贷非违约两种状况,如果上市公司信贷违约发生,其取值为1;如果上市公司经营正常出现信贷非违约,其取值为0。建立多变量Logistic回归模型,设Y是一个取值为1或0的两分类随机变量,X1,X2,„Xn是影响Y的企业的财务比率的确定变量,通过观测n组观测值(X1,X2,„Xn,Y),则因变量与自变量的对数线性模型为:lnY=ln[p/(1-p)]=α+β1X1+β2X2+...+βNXN其中p表示“Y=l”发生的概率,(1-p)表示“Y=O”发生的概率;模型中参数α是常数项,表示自变量取值全为0时,参数β1为Logistic回归系数。4.2模型选择的原因在众多的多元回归模型中,之所以选择logistic回归非线性模型,主要是因为:第一,logistic回归非线性模型能很好地解决非线性的问题,有较高的准确度,是学术界视为主流的方法,相对比较成熟。第二,logistic模型对于变量的分布没有具体要求,适用范围更广,直观明了,而其他模型如判别分析模型要求变量服从多元正态分布,在现实中不一定能满足这一条件。本文用logistic回归模型来预测企业违约的概率。本文把ST公司作为我们经营失败公司,即违约公司的样本,非ST公司作为我们经营正常,即非违约公司样本。我们利用上市公司的财务数据建立logistic模型,来预测企业的经营失败概率。我们以0.5作为我们判别的分界点,p0.5判定为非违约企业,p0.5判定为违约企业。4.3样本选择样本来自2005年以前在深沪上市的所有公司。金融行业由于其特殊性,评估金融企业良莠的指标与一般企业有较大差异,所有将其排除在外。我国上市公司当年的年报披露的截此日期为下一年的4月5日,故上市公司t-1年的年报和其在t年是否被特别处理这两个事件是同时发生的。所以对于我国的情况,采用t-1的年报来预测t年是否会发生特别处理并无实际意义。并且Ohlson(1980)的研究表明:采用破产之后的财务信息来建立预测模型会高估模型的预测能力。因此本文采用的是上市公司t-2年的财务信息来预测公司在t年是否会违约。本文以2005年前在深沪上市的所有公司为样本(金融行业除外),选取了在2006年没有被特别处理,在2007年被特别处理的28家ST公司为违约公司样本,这28家ST公司涉及了生物制药业、房地产开发业、纺织业、食品加工业、建材业、旅游业、轮胎业、电器行业、造纸业、机械业、汽车制造业、交通运输业、化纤业、有色金属业、工业机械业、酿酒业、计算机应用与服务业、供热、商业经纪与代理等二十多个行业,另外选取了112家2007年没有被特别处理的非ST公司作为非违约公司样本。利用2005年的财务数据,分别按照1:1,1:2,1:3,1:4的违约公司和非违约公司的样本比例建立Logistic回归模型来预测2007年的违约概率。另选取了15家在2007年没有被特别处理,但在2008年被特别处理的ST公司和15家在2008年没有被特别处理的上市公司,即共28家上市公司作为保留样本来检验模型的效果,并利用2006年的财务数据预测2008年的违约概率。表4-1分析样本的配比比例构成比例违约公司非违约公司合计1:12828561:22856841:328841121:428112140表5-2保留样本的样本构成违约公司非
本文标题:武振昆的logistic判别模型在风险管理中的应用(自动保存的)
链接地址:https://www.777doc.com/doc-2364181 .html