您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 非参数加权核密度估计在股市收益率分布的应用
非参数加权核密度估计在股市收益率分布的应用许冰丁媛(浙江工商大学统计学院)摘要:大盘指数的收益率分布函数并不服从通常人们所认为的正态分布。本文采用一种新的方法——非参数加权核密度估计,对大盘指数的收益率分布函数进行研究。这种新方法不仅很好地刻画了收益率分布的尖峰和肥尾特征,而且比一般的正态分布更能捕捉市场的风险特征,结论也更加准确。关键字:收益率,非参数估计,核密度函数,加权一、引言在描述股价行为的经典计量模型中,股市的收益率通常被假定是服从正态分布。但是许多计量金融学家对这一经典假设做了大量的研究并发现,收益率的分布并不服从正态分布这一假设。事实上,大多数价格的变化存在很明显的尖峰现象,也就是说相对正态分布而言,在均值附近的数据点特别多。许多学者认为这只不过是由一些“异常值”所引起,从而在统计分析中将这些“异常值”去掉。例如,国内学者陶亚民(1999)认为,上海股市收益率分布是服从正态分布的,但这却是在剔除了“异常点”的基础上得到的结论。然而Mandelbrot(1963)认为将这些“异常值”值从数据中去掉是不可取的。因为“异常值”的出现并不是一种偶然现象,尖峰和肥尾现象几乎是所有股票收益率数据所共有的。这说明“异常值”本身反映了股票收益率并不服从正态分布这一假定。封建强﹑王福新(2003)利用几种不同的分布函数来刻画收益率分布,并且利用稳定的Pareton分布和t分布来拟合了沪深股市的收益率分布。但是正如作者在文章最后所讲到的一样,从精确的意义上来讲Pareton分布和t分布都不能很好的描述收益率数据。同样李亚静(2002)也检验得到收益率分布的非正态性。在收益率分布非正态的情况下,我们又该如何对收益率分布进行估计呢?对于这个问题,本文从另一个角度来进行说明,即利用非参数加权核密度估计的方法来对上证综合指数的收益率分布进行研究,从而得到一些与以往不同的结论。大量文献表明,收益率与成交量存在一定的关系,价差绝对量对收益率也存在影响,本文尝试在通常收益率密度函数非参数估计模型的基础上,将成交量和价差作为权重因子引入到核估计模型中,得到加权的非参数估计,分别得到一个基于交易量和价差的金融资产收益率分布模型。本文安排如下:第二节进行收益率分布的正态性检验,第三节介绍基于交易量和价差加权的收益率模型,第四节进行实证比较研究,,第五节简短总结。二﹑收益率分布的正态性检验考虑到数据的代表性与完整性,本文选取了上证综合指数和深证成分指数作为沪深股市的代表,以每日的收盘价为分析对象。考虑到数据的平稳性,样本取值范围为:2001年7月17日至2007年9月27日上证共1500个有效数据,数据来源于大智慧软件,分别计算它们的日收益率Rt=ln(Pt+1/Pt),Pt是第t日的收盘指数,Pt是第t+1日的收盘指数。计算得到沪深大盘指数收益率数据的统计特征见表1。表1上证综合指数收益率基本统计量基本描述统计量均值标准差偏度峰度上证综合指数-0.0006350.015327-0.0402007.636481收益率数据的直方图见图1。-0.1-0.08-0.06-0.04-0.0200.020.040.060.080.10100200300400500600700上证综合对数收益率频率直方图收益率频率图1上证综合指数收益率频率直方图从表1和图1可以看出,股票样本偏斜度基本上对称,一般将偏度绝对值超0.5认为偏斜度明显.本文所选的股票样本属于偏斜度不明显,可以认为偏斜度与0相差不显著,符合正态分布偏斜度为0的要求,然而峰度显著大于3,即样本呈现厚尾现象,这个现象可能是我国现阶段股票市场的一个普遍特征。三、基于交易量和价差加权的收益率模型非参数核估计就是利用数据直接对分布形式进行估计,该方法已经应用到现实问题的各种领域,利用非参数估计的特点来研究沪市收益率分布时,股票收益率的波动较大,采用灵活性较大的非参数密度估计是恰当的。具体方法如下:假设收益率分布函数为F,其相应的密度函数是f,收益率历史数据样本为X1,X2,…,Xn,经典的由样本数据所确定的密度函数f的简单核估计为:11ˆ()[]niixXfxKnhh(1)其中,n为历史数据样本数,h是核估计的窗宽,K[*]是核函数许冰(2006)将“物”和“人”的因素定向加权到人均GDP分布的核密度估计中,同时在对城市的实证中,将我国城市划分为5个不同的人均GDP分布区域分别进行估计,提出了一种新的计量方法,加权人均GDP。吴文锋和吴冲锋(2003)提出了股价推进的成交量进程假设,进行股价的成交量推进进程及其动力学分析。因而本文试图捕抓交易量支撑的收益率的动力学性质。股票价格的波动与成交量之间存在密切的关系,价格的上升依赖成交量作为其支撑,否则,价格的上升难于持续;而价格的下降,通常可能出现萎缩的成交量,同时绝对价差与收益率也存在一定联系,本文尝试在对股票收益率分布研究时,通过用其相应的交易量和绝对价差来进行加权,充分考虑交易量的变化和价差大小对收益率分布的影响。注意到,要求权重1,2,…,i满足1nii=1这时,对于经典的核密度估计的一个自然推广,就是把公式(1)中的简单和用加权和来代替,具体形式如下:11ˆ()[]niiixXfxKhh(2)式(2)中,各数据点所包含的信息是不同的,每个收益率对总体函数求和的贡献度随成交量或价差的不同而不同,第i个收益率对总体密度函数的求和贡献度是i/h,这种处理方法反映了每个收益率观测值对于它的密度函数来说,包含了不同的交易量或价差信息i,而不是相同的平均信息量1/n,在这种情况下,不同的交易量信息权重值i会改变各个收益率观测值对于密度函数的跳动高度:1[]iixXKhh四、实证比较研究选取上证综合指数日数据,时间跨度2001年7月17日至2007年9月27日,上证共1500个有效数据,计算日收益率t1t+1lntR+=(P/P),tP是第t日的收盘指数,t+1P是第t+1日的收盘指数,取核函数t1t+1lntR+=(P/P),1/22()(2)exp(/2)Kuu,选择窗宽h为满足均方误差最小,利用公式(1)、(2)分别进行简单的(Simple)非参数估计,加权(Weighted)样本的非参数估计比较这三个核密度估计结果。图2上证综合指数收益率的密度函数图由非参数估计及图2可以发现(图2中从左到右依次为volweighted,priceweighted,standard,h=0.002):1.简单核密度估计无法捕抓到收益率分布的多峰性。2.加权窗宽核实度估计的收益率分布的左右尾明显呈现出比简单的核密度估计还要厚的尾部,表明真实的收益率分布或许存在更厚的尾部特征。基于成交量和价差加权的核估计能更好的刻画股票的收益率,两者各显个性,各有所长,volweighted相对与priceweighted有更明显的偏度,多峰性也较明显,但峰度不及priceweighted,后者淡化了次高峰,而使最高峰处更接近原收益率密度函数。3.上证综合指数的三个核密度估计的收益率分布均在0.04附近出现小尖峰,产生多峰现象,明显地刻画出收益率分布的集聚性和厚尾性。五、总结中国的股票市场的收益率从整体上不符合正态分布实际收益率分布,说明了中国证券市场尚未满足正态马尔科夫过程,处于弱势非有效市场,离正态分布有一定的差距,表明股价的波动并非完全由外来噪声造成的,还存在一些非随机因素影响着股价,这些影响因素的性质有待进一步的深入研究。-0.1-0.08-0.06-0.04-0.0200.020.040.060.080.10510152025303540standardvolweightedpriceweighted金融资产收益率与交易量或绝对价差的相关性,虽然已有大量研究文献,但是,把交易量或绝对价差作为收益率的一种权重,这为深入研究金融资产收益率分布研究提供了一个新的视角。这种方法比基于参数估计的混合分布和污染分布,以及基于二阶矩存在的ARCH类模型,更合理且容易捕抓到收益率分布的多峰性,及其厚尾、集聚性和长记忆性。实证结果显示,加权对于混合分布收益率的真实描写是不可或缺的。作为基于交易量加权的收益率非参数估计方法的应用研究,实证检验了上证指数收益率分布多峰性的非参数拟合效果。如果从市场流动性角度,一种基于流动性指标作为权重的收益率的研究,将同样是一个很有意义的有待研究的课题。参考文献:[1]MandelbrotBB.NewMethodinStatisticalEconomics[J].JournalofPoliticalEconomy,1963,(71).[2]MariaGP,&RobertoZ.Testingforchangingshapesofincomedistribution:Italianevidenceinthe1990sfromkerneldensityestimates[J].EmpiricalEconomics2004(29).[3]叶阿忠.非参数计量经济学[M].南开大学出版社.2003,7.[4]陶亚民,蔡明超,杨朝军.上海股票市场收益率分布特征的研究[J].预测,1999,(2).[5]李亚静,朱宏泉.沪深股市收益率分布的时变性[J].数学的实践与认识,2002,(2).[6]封建强,王福新.中国股市收益率分布函数研究[J].中国管理科学,2003,(1).[7]吴文锋,吴冲锋,黄登仕.中国股票市场的多标度特征[J].数量经济技术经济研究,2003,(9).[8]陈敏,王国明,吴国富,蒋学雷.中国证券市场的ACD-GARCH模型及其应用[J].统计研究.2003.(11).[9]许冰.一种可选择的新方法:加权人均GDP[J].数量经济技术经济研究,2006,(7).[10]蒋春福,李善民,梁四安.中国股市收益率分布特征的实证研究[J].数理统计与管理,2007,(7).
本文标题:非参数加权核密度估计在股市收益率分布的应用
链接地址:https://www.777doc.com/doc-1979947 .html