您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > logistic回归模型在信贷风险管理中的应用
logistic回归模型在信贷风险管理中的应用上传日期:2009年8月4日编辑:现代经济编辑部点击:621次郭淑彬(上海海事大学,上海200315)摘要:信贷风险已成为我国商业银行的主要风险,而信贷风险对经济的影响也越来越大。新巴赛尔协议的实行,对我国银行的信贷风险管理提出了更多的问题和挑战。我国在信贷风险管理上的模型方法还很落后。由于我国商业银行的信贷数据满足logistic模型的要求,因此logistic模型在信贷风险管理中比较受欢迎。以2005年前在深沪上市的所有公司为样本,运用logistic模型预测公司的经营失败的概率,并比较不用样本配比比例下模型的结果。实证研究得出1:3的样本比例在总体风险的预测准确率上更优于其他配比比例。关键词:logistic模型;违约率;经营失败中图分类号:F830.5文献标识码:A文章编号:1671-8089(2009)05-0021-04一、引言进入20世纪80年代以来,logistic回归分析法逐步取代了传统的判别分析法。这种方法不仅本身灵活简便,而且它的许多前提假设比较符合经济现实和金融数据的分布规律,譬如它不要求模型变量间具有线性的相关关系,不要求变量服从协方差矩阵相等和残差项服从正态分布等,这使得模型的分析结果比较客观。同时,具体公司数据带入模型之后得到的是一个概率值,在实际使用中简单方便。结合我国商业银行信用风险管理及上市公司财务数据的现状,前提假设及对数据的要求相对符合经济现实的logistic模型更加适合我国企业信用风险的度量和管理研究。本文是这样安排的,第一部分为方法原理,第二部分为是实证分析。二、方法原理当我们要预测某一事件或现象发生的概率p的大小,比如某一事件成功或失败的概率,以及讨论此概率的大小与哪些因素有关。但由于0«p«1,所以p与自变量的关系难以用线性模型来描述,且当p接近于0或1时,p的值的微小变化用普通的方法难以发现和处理好。这时,我们不处理参数p,而是处理p的一个严格单调函数Q=Q(P),就会方便得多。要求Q(P)在p=0或者p=1的附近的微小变化很敏感,于是令Q将p换成Q,这一变换就称为Logit变换。从Logit变换可以看出,当p从0→1时,Q的值从-∞→+∞,因此Q的值在区间(-∞,+∞)上变化,这在数据处理上带来了很多方便。当因变量是一个二元变量时,只取0与1两个值,因变量取1的概率就是要研究的对象。如果有很多因素影响y的取值,这些因素就是自变量记为x1,…xk,这些xi中既有定性变量,也有定量变量。最重要的一个条件是:0+b1x1+…+bkxk也即是x1,…,xk的线性函数。满足上面条件的称为Logistic线性回归。Logistic回归假定解释变量与被解释变量之间的关系类似于S形曲线。Logistic变换的非线性特征使得在估计模型的时候采用极大似然估计的迭代方法,找到系数的“最可能”的估计。这样在计算整个模型拟合度的时候,就采用似然值而不是离差平方和。Logistic回归对模型拟合好坏通过似然值来测度。一个好的模型应该有较小的-2LL。如果一个模型完全拟合,则似然值为1,这时-2LL达到最小,为0。Logistic回归对于系数的检验采用的是与多元回归中t检验不同的统计量,称为Wald统计量。在众多的多元回归模型中,之所以选择logistic回归非线性模型,主要是因为:第一,logistic回归非线性模型能很好地解决非线性的问题,有较高的准确度,是学术界视为主流的方法,相对比较成熟。第二,logistic模型对于变量的分布没有具体要求,适用范围更广,直观明了,而其他模型如判别分析模型要求变量服从多元正态分布,在现实中不一定能满足这一条件。本文用logistic回归模型来预测企业违约的概率。但在我国由于违约企业的财务数据很难收集,这在很大程度上制约了对企业违约风险的理论和实证研究。1998年中国证监会要求上海证券交易所和深圳证券交易所对企业经营出现异常状况的上市公司的股票实行特别处理(SpecialTreatment)。在对企业违约率的分析中,我国学者大多把ST公司作为我们经营失败公司,即违约公司的样本,非ST公司作为我们经营正常,即非违约公司样本。本论文也采取同样的方法。我们利用上市公司的财务数据建立logistic模型,来预测企业的经营失败概率。我们以0.5作为我们判别的分界点,p0.5判定为非违约企业,p0.5判定为违约企业。三、实证分析1、样本选择。论文的的样本来自2005年以前在深沪上市的所有公司。金融行业由于其特殊性,评估金融企业良莠的指标与一般企业有较大差异,所有将其排除在外。我国上市公司当年的年报披露的截此日期为下一年的4月5日,故上市公司t-1年的年报和其在t年是否被特别处理这两个事件是同时发生的。所以对于我国的情况,采用t-1的年报来预测t年是否会发生特别处理和并无实际意义。并且Ohlson(1980)的研究表明:采用破产之后的财务信息来建立预测模型会高估模型的预测能力。因此本论文采用的是上市公司t-2年的财务信息来预测公司在t年是否会违约。论文以2005年前在深沪上市的所有公司为样本(金融行业除外),选取了在2006年没有被特别处理,在2007年被特别处理的28家ST公司为违约公司样本,这28家ST公司涉及了生物制药业、房地产开发业、纺织业、食品加工业、建材业、旅游业、轮胎知道业、电器行业、造纸业、机械业、汽车制造业、交通运输业、化纤业、有色金属业、工业机械业、酿酒业、计算机应用与服务业、供热、商业经纪与代理等二十多个行业,另外选取了112家2007年没有被特别处理的非ST公司作为非违约公司样本。利用2005年的财务数据,分别按照1:1,1:2,1:3,1:4的违约公司和非违约公司的样本比例建立Logistic回归模型来预测2007年的违约概率。另选取了14家在2007年没有被特别处理,但在2008年被特别处理的ST公司和14家在2008年没有被特别处理的上市公司,即共28家上市公司作为保留样本来检验模型的效果,并利用2006年的财务数据预测2008年的违约概率。2、财务指标选取。财务比率的设计和选取是度量企业信用风险的出发点,也是预测企业经营失败的关键。本论文选取的财务数据全部来源于公司的财务报表。在参考已有的研究文献以及考虑我国上市公司的特色和本研究需要的基础上,本论文从能够反映企业盈利能力,偿债能力,现金流量,营运能力等方面选择了11个财务比率。表2-1备选财务指标指标类型变量定义盈利能力X1主营业务利润率(%)=主营业务利润/主营业务收入X2净资产收益率(%)=净利润/净资产X3总资产收益率(%)=净利润/总资产偿债能力X4债务资产比=总负债/总资产X5流动比率=流动资产/流动负债X6资本充足率=所有者权益期末数/总资产X7债务资本比=总负债/净资产现金流量X8现金流动负债率=经营活动现金净流量/流动负债X9现金债务比=经营活动产生的现金流/流动负债营运能力X10资产周转率=主营业务收入/总资产X11应收账款周转率=主营业务收入/平均应收账款3、指标筛选。利用SPSS软件对所选取的财务指标进行多重共线性诊断,因论文要分别利用1:1,1:2,1:3,1:4的违约公司和非违约公司的样本比例来建立logistic回归模型,这样有四个样本,因此分别诊断四个样本中的多重共线性问题,来确定共同筛除的变量,以使得模型结果具有可比性。诊断的结果如表所示:表2-2变量的多重共线性检验变量1:11:21:31:4TOLVIFTOLVIFTOLVIFTILVIFX10.5951.6800.5771.7320.5211.9190.5951.680X20.1238.1170.1456.8760.1516.6130.1238.117X30.1138.8490.1397.1750.1407.1450.1138.849X40.07613.1080.05019.8900.06515.2820.07613.108X50.5231.9100.3872.5850.4222.3690.5231.910X60.07812.7650.04920.2830.06016.5730.07812.765X70.4402.2730.3902.5670.4222.3670.4402.273X80.1158.6690.1258.0250.07213.9620.1158.669X90.1307.6710.1327.5750.07713.0580.1307.671X100.7201.3880.4702.1290.5881.7000.7201.388X110.7761.2880.5441.8380.6661.5010.7761.288注:作为一个大致的标准,容许度小于0.2可以认为是多重共线性存在的标志,容许度小于0.1则说明多重共线性很严重(Menard,1995),也即方差膨胀因子VIF小于10,可认为各变量之间不存在显著的多重共线性;VIF小于5,各变量之间基本上不存在多重共线性。从表4.2可以看出,X4(债务资本比),X6(资本充足率),X8(现金流动负债率),X9(现金债务比)与其他变量之间存在着较明显的多重共线性。为此,我们剔除X4,X6,X8,X9。剩下的变量我们再做多重共线性检验。表2-3剔除变量后的多重共线性检验变量1:11:21:31:4TOLVIFTOLVIFTOLVIFTILVIFX10.7311.3690.7431.3460.7121.4040.7671.303X20.1476.8150.1526.5790.1626.1830.1367.329X30.1486.7680.1476.8140.1526.5780.1267.930X50.7901.2660.8031.2460.8191.2210.8471.181X70.7291.3710.8271.2090.8281.2070.8801.137X100.7371.3570.5061.9760.6041.6550.7601.316X110.7691.3000.5851.7080.7041.4210.8711.148从表中我们可以看出,提出X4,X6,X8,X9后剩下的变量VIF小于10,变量不存在显著的多重共线性。因此我们把X1(主营业务利润率),X2(净资产收益率),X3(总资产收益率),X5(流动比率),X9(现金债务比),X10(资产周转率),X11(应收账款周转率)作为我们进入模型的指标变量。下面就分不同的情况对logistic模型的参数进行估计:4、不同配比比例下的logistic估计结果:表2-4不同配比比例下logistic模型的估计结果-1配比比率1:11:2变量变量估计值Wald统计量显著水平(Sig.)变量估计值Wald统计量显著水平(Sig.)X1-0.0020.0040.9500.0040.0310.860X20.0300.3970.5290.0210.5140.473X3-0.1861.3750.241-0.1822.3670.124X5-0.4880.3860.534-0.8131.1640.281X70.4582.5930.1070.2231.9020.168X10-2.0123.0540.081-1.8602.5490.110X11-0.1063.4050.065-0.0873.4440.063Constant1.9541.7270.1891.5391.5090.219-2loglikihood46.67370.306Cox&Snell0.4250.353R2NagelkerkeR20.5660.491表2-5不同配比比例下logistic模型的估计结果-2配比比率1:31:4变量变量估计值Wald统计量显著水平(Sig.)变量估计值Wald统计量显著水平(Sig.)X1-0.0050.0760.783-0.0110.3710.542X20.0130.2200.639-0.0070.0650.798X3-0.1912.7460.098-0.1051.1970
本文标题:logistic回归模型在信贷风险管理中的应用
链接地址:https://www.777doc.com/doc-506980 .html