您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 非参数统计检验方法的应用
论文投稿领域:数理经济与计量经济学非参数统计检验方法的应用阮曙芬1程娇翼1张振中2(1.中国地质大学数理学院,武汉430074;2.中南大学数学科学与计算学院,长沙410075)摘要:本文对非参数统计中常用的三种假设检验方法进行了简单的介绍。运用Kruskal-Wallis检验方法对2002年前三季度的上海股市综合指数收益率数据进行了周末效应的检验,结果表明2002年上海股市综合指数收益率不具有周末效应。关键字:符号检验;Wilcoxon秩和检验;Kruskal-Wallis检验1引言非参数统计是统计分析的重要组成部分。非参数假设检验是在总体分布未知或者总体分布不满足参数统计对总体所做的假定的时候,分析样本特点,寻找相应的非参数检验统计量。本文就是以此为出发点,介绍了非参数统计中假设检验常用的几个检验方法:符号检验、Wilcoxon秩和检验和Kruskal-Wallis检验,然后结合具体的问题和数据,在统计软件SAS中作相应的非参数检验。2非参数假设检验介绍2.1配对样本的符号检验符号检验是根据正、负符号进行假设检验的方法。这种检验方法用于配对设计数值变量资料的假设检验,常常是差值不服从正态分布或者总体分布未知的情况下不能用t检验的时候使用。其原理是对差值进行编制并冠以符号,然后对正负秩和进行比较检验。设随机变量12,,...,nXXX相互独立同分布,分布为()Fx,()Fx在0x连续。假设检验问题0H:(0)12F1H:(0)12F检验统计量可取11()nniiiiBX,即为12,,...,nXXX中取正号的个数。在0H下,B的分布是参数为n和1/2的二项分布1(,)2bn。2.2两独立样本的Wilcoxon秩和检验Wilcoxon秩和检验的理论背景如下:有两个总体,一个总体的样本为12,,...,nXXX,相互独立同分布,分布为()Fx;另一个样本为12,,...,nYYY,相互独立同分布,分布为()Gx,()Fx,()Gx连续。问随机变量Y是否随机大于随机变量X,即检验0H:()()FxGx,1H:()()FxGx,且有某些点不等号成立。将12,,...,nXXX,12,,...,nYYY共mn个随机变量一起排序,产生对应的秩11(,...,;,...,)mnRQQRR。则Wilcoxon秩和检验统计量为:1niiWR即12,,...,nYYY在混合样本中的秩的和为Wilcoxon秩和检验统计量。2.3多样本的Kruskal-Wallis检验Kruskal-Wallis检验一般对多个总体的分布情况进行检验。其理论基础为:假设有m种处理,对于第j个检验体实行第i种处理产生的效果记为ijx,其分布函数为()iFx。即0H:12()()...()nFxFxFx;1H:存在i和'i,'()()iiFxFx。设观测值为{,1,2,...,;1,2,...,}ijximjn。全体样本数为N,ijx的顺位记为ijr。假定同顺位不会出现。考虑统计量:2112(1)1[12]miiiikNNnrnN2112(1)3(1)miiiNNrnN检验方法为:00,NNkkHkkH拒绝不拒绝。其中,0{}NPkkH=。当12(,,...,)mnnn较小时,可以查表得到的值;当该值较大时,k近似服从自由度为1m的2分布。因此2(1)m,2(1)Nkm为自由度为1m的2分布的右侧的分位数点。3Kruskal-Wallis检验的应用股市的周末效应是指周一的收益率比其他交易日收益率低,且风险较大;周五的收益率比其他交易日高,且相对风险较小。下面分别对2002年的前三季度的上证综合指数进行周末效应的分析。本实证分析中,样本为2002年1月4日到2002年9月27日的上海股市综合指数(数据来源于)。指数收益率的计算公式为:1ln()tttrpp,其中tp为第t天的指数,tr为第t天的指数收益率。3.1收益率分布状况的分析首先计算收益率序列的方差,均值,偏度和峰度初步判断该序列是否服从正态分布。然后利用Kolmogorov-Smirnov等检验结果对收益率进行正态性检验。[SAS程序]创建数据集:将excel数据导入SAS中,然后在分析家中利用数据计算得到:r0=p/lag1(p)和r=log(r0);datasasuser.chx1sasuser.chx2sasuser.chx3sasuser.chx4sasuser.chx5;setsasuser.ch01;select(w);when(1)outputsasuser.chx1;when(2)outputsasuser.chx2;when(3)outputsasuser.chx3;when(4)outputsasuser.chx4;when(5)outputsasuser.chx5;end;run;procunivariatedata=sasuser.ch01;varr;run;[SAS结果输出]见表1汇总表1上证指数收益率描述性统计分析星期周一周二周三周四周五全体数据均值-3.882E-34.875E-30.422E-31.363E-3-3.423E-3-0.110E-3t统计量-1.268(0.214)1.399(0.171)0.180(0.858)0.423(0.675)-1.776(0.085)-0.084(0.933)自由度3434343433169方差0.319E-30.413E-30.186E-30.352E-30.123E-30.283E-3偏度-1.0692.2922.6960.992-0.6301.144峰度3.6667.85012.4333.6460.3897.084由上表可知,上证指数收益率序列的偏度和峰度分别为1.144和7.084,而正态分布的偏度和峰度分别为0和3,所以我们可以初步断定指数收益率序列为非正态分布。为了进一步证实这一论断,我们对收益率序列进行Kolmogorov-Smirnov检验。SAS自动输出包括Kolmogorov-Smirnov检验统计量在内的四种检验正态分布的检验统计量。[SAS程序]procunivariatedata=sasuser.chx1normal;varr;histogramr;probplotr;run;[SAS结果输出]见表1汇总,图1和图2。表2上证指数收益率的正态性检验Kolmogorov-Smirnov检验对应的p值Shapino-Wilk检验对应p值Cramer-vonMises检验对应的p值Anderson-Darling检验对应的p值自由度周一0.04640.01060.02720.021134周二<0.0100<0.0001<0.0050<0.005034周三<0.0100<0.0001<0.0050<0.005034周四0.09100.01260.01640.017234周五0.15000.10100.15280.096233全体数据<0.0100<0.0001<0.0050<0.0050169-0.06-0.04-0.0200.020.040102030405060Percentr图1上证综合指数收益率分布的直方图1510255075909599-0.08-0.06-0.04-0.0200.020.04rNormalPercentiles图2上证综合指数收益率分布的概率图包括Kolmogorov-Smirnov检验统计量在内的四种检验正态分布的检验统计量均表明上海综合指数收益率序列不服从正态分布,图1和图2也说明了这一点。所以要采用非参数方法进行以后的周末效应的检验。3.2周末效应存在性的Kruskal-Wallis检验我们利用Kruskal-Wallis检验2002年前三季度上证综合指数收益率的周末效应的存在性。[SAS程序]procnpar1waywilcoxondata=sasuser.ch01;classw;varr;run;[SAS结果输出]-------------------------------------------------------------------------TheNPAR1WAYProcedureWilcoxonScores(RankSums)forVariablerClassifiedbyVariablewwNSumofScoresExpectedUnderH0StdDevUnderH0MeanScore5332576.02805.0252.15074978.0606061342610.02890.0255.00000076.7647062343206.02890.0255.00000094.2941183342996.02890.0255.00000088.1176474342977.02890.0255.00000087.558824Kruskal-WallisTestChi-Square3.0846DF4PrChi-Square0.5438-------------------------------------------------------------------------K-W检验得2=3.086,df=4,p=0.53480.05,所以不能拒绝0H,即周一到周五得上证综合指数收益率得分布125()()...()FxFxFx,所以我们认为在2002年的前三季度中,上海市股市综合指数收益率不存在周末效应。参考文献:[1]DamodarN.Gujarati.BasicEconometrics.北京:中国人民大学出版社,2005.p791-p800.[2]GeorgeE.P.Box,GwilymM.Jenkins,GregoryC.Reinsel.TimeSeriesAnalysisForecastingAndControl.[3]何书元.应用时间序列分析.北京:北京大学出版社,2003.p218-p226.[4]张卓.SAS软件的应用.统计与信息论坛(2005),Vol.20,No.4.p104-p106.[5]樊欣,邵谦谦.SAS8.X经济统计.北京:北京希望电子出版社,2003.p28-p60.[6]岳朝龙,黄永兴,严钟.SAS系统与经济统计分析.合肥:中国科学技术大学出版社,2004.p469-p487[7]李彦萍.发达与非发达地区收入与消费非参数统计分析.山西农业大学学报(2005),Vol.4,No.4.p334-p339.[8]刘彤.利用非参数方法对上海股市周末效应的研究.数理统计与管理(2003),Vol.22,No.1.p69-p71.ApplicationofNonparametricstatisticalMethodRUANShu-fen,CHENGJiao-yi,ZHANGZhen-zhong(SchoolofMathematicsandPhysics,ChinaUniversityofGeosciences,Wuhan430074)Abstract:Inthispaper,wesimplyintroducethreecommonhypothesistests.UsingtheKruskal--Wallistest,wedoweekeffecttestabouttheshanghaisyntheticindexofwhichwetakethefirstthreequartersof2002forsamples.Showingthatduringtheyearof2002,theyieldofshanghaistockmarketsyntheticindexhasnoweekeffect.Keywords:singedtest;wilcoxonranksumtest;Krtuskal-
本文标题:非参数统计检验方法的应用
链接地址:https://www.777doc.com/doc-1979965 .html