您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > 实证会计分析统计方法
1实证会计分析统计方法谭洪涛2007.10.162本讲主要目的一、常见计量软件二、常用实证分析方法3常见计量软件zSASzSPSSzMatlabzEViews4SASzSAS是美国SAS软件研究所研制的一套大型集成应用软件系统,具有完备的数据存取、数据管理、数据分析和数据展现功能。z特点:强大的数据分析能力,数据处理和统计分析领域,被誉为国际上的标准软件和昀权威的优秀统计软件包,z广泛应用于政府行政管理、科研、教育、生产和金融等不同领域,发挥着重要的作用。zSAS系统中提供的主要分析功能包括统计分析、经济计量分析、时间序列分析、决策分析、财务分析和全面质量管理工具等等。z详细内容请登陆:查询。5SPSS(StatisticalPackagefortheSocialScience)z社会科学统计软件包是世界是著名的统计分析软件之一。z20世纪60年代末,z特点,微机化,界面友好zSPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。z详细内容请登陆:查询。6Matlabz由美国Mathworks公司推出的用于数值计算和图形处理的科学计算系统,z特定:程序设计、数值计算、图形绘制、输入输出、文件管理等各项操作。z昀直观,昀简洁的程序开发环境,语言简洁紧凑,使用方便灵活,库函数与运算符极其丰富,另外具有强大的图形功能。z在国际学术界,Matlab已经被确认为准确、可靠的科学计算标准软件,许多国际一流学术刊物上,都可以看到MATLAB的应用。z详细内容请登陆:查询。7EViewsz美国GMS公司1981年发行第1版的MicroTSP的Windows版本,z通常称为计量经济学软件包。zEViews是EconometricsViews的缩写,z它的本意是对社会经济关系与经济活动的数量规律,采用计量经济学方法与技术进行“观察”。z使用EViews软件包可以对时间序列和非时间序列的数据进行分析,建立序列(变量)间的统计关系式,并用该关系式进行预测、模拟等等。详细内容请登陆:查询8常用实证分析方法z一、统计描述z二、均值分析与T检验z三、相关分析z四、回归分析z五、非参数检验z六、聚类分析z七、主成分分析z八、时间序列的平稳性检验――单位根检验z九、葛兰杰因果检验(Granger因果检验)Eviews实现9一、统计描述z1.1.频数分布表分析(Frequencies)z1.2.统计描述分析过程(Descriptives)101.2.统计描述分析过程(Descriptives)zDescriptives过程是连续资料统计描述应用昀多的一个过程,他可对变量进行描述性统计分析,计算并列出一系列相应的统计指标。11二、均值分析与T检验zT检验是检验差异性显著性z差异显著性的检验是样本均值间的比较,zT检验也可以称为一种均值比较分析。–单样本T检验、–独立样本T检验、–配对样本T检验。122.1.独立样本T检验(One-SamplesTTest)过程z用于进行样本所在总体均数与已知总体均数的比较,可以自行定义已知总体均数为任意值,132.2.独立样本T检验(Independent-SamplesTTest)过程zIndependent-SamplesTTest过程用于进行两样本均数的比较,即常用的两样本t检验。z进行独立样本T检验要求被比较的两个样本彼此独立,即没有配对关系。z要求样本均来自正态总体,而且均值对于检验是有意义的描述统计量。142.3.配对样本T检验(Paired-SamplesTTest)过程z用于进行配对设计的差值均数与总体均数0比较的t检验,配对样本T检验与独立样本T检验均使用TTest过程,但两者调用该过程的菜单不同,对数据文件结构的要求不同和使用的命令语句也有区别。z在进行配对样本T检验的数据文件中一对数据必须作为同一观测值的两个变量。15三、相关分析z实证研究中经常要遇到分析两个或多个变量间关系的情况,z有时是希望了解某个变量对另一个变量的影响强度:回归分析实现z有时则是要了解变量间联系的密切程度,相关分析实现。16相关分析:Bivariate过程z此过程用于进行两个/多个变量间的参数/非参数相关分析,如果是多个变量,则给出两两相关的分析结果,zPearson相关:两个变量必须服从正态分布、z当当资料不服从双变量正态分布或总体分布未知,或原始数据是用等级表示时,宜用Spearman等级相关zKendall相关。z假设检验,可选择进行单尾或双尾检验,给出相关系数为0的概率。17Partial过程:偏相关检验z如果需要进行相关分析的两个变量其取值均受到其他变量的影响,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数;zPartial过程就是专门进行偏相关分析的。18相关分析:Distances过程:z调用此过程可对同一变量内部各观察单位间的数值或各个不同变量间进行距离相关分析,前者可用于检测观测值的接近程度,后者则常用于考察预测值对实际值的拟合优度。z该过程在实际应用中用的非常少。19四、回归分析z4.1.一元线性回归分析z4.1.1.线性回归分析概念z在数量分析中,我们经常会看到变量与变量之间存在着一定的联系,而不只是前面所讨论的单个变量的某些孤立的特性,如均值、方差的特性等。z要了解的是变量之间是如何发生相互影响的,这就是所谓回归分析。204.2.多元线性回归模型-4.2.1.多元线性回归模型介绍z一元线性回归分析所反映的是一个因变量与一个自变量之间的关系。z在许多场合,仅仅考虑单个变量是不够的,还需要就一个因变量与多个自变量的联系来进行考察,才能获得比较满意的结果。这就产生了测定多因素之间相关关系的问题。214.3.逻辑回归分析-4.3.1.逻辑回归分析概念z线性回归模型的一个局限性是要求因变量是定量变量(定距变量、定比变量)而不能是定性变量(定序变量、定类变量)。z但是在许多实际问题中,经常出现因变量是定性变量(分类变量)的情况。224.3.1.逻辑回归分析类型z判别分别(Discriminantanalysis)、zProbit分析、zLogistic回归分析z对数线性模型23Logistic回归分析z应用昀多zLogistic回归分析根据因变量取值类别不同,又可以分为–BinaryLogistic回归分析用于因变量只能取两个值1和0(虚拟因变量),–MultinomialLogistic回归分析因变量可以取多个值,在此只讨论BinaryLogistic回归,并简称Logistic回归。24解释Logistic回归结果的一些常用的检验统计量1、-2对数似然值(-2loglikelihood,-2LL)z似然(likelihood)即概率,特别是由自变量观测值预测因变量观测值的概率。z当-2LL的实际显著性水平大于给定的显著性水平α时,因变量的变动中无法解释的部分是不显著的,意味着回归方程的拟合程度越好。25解释Logistic回归结果的一些常用的检验统计量2、Cox和Snell的R2(Cox&Snell’sR-Square)Cox和Snell的R2试图在似然值基础上模仿线性回归模型的R2解释Logistic回归模型,但它的昀大值一般小于1,解释时有困难。26z3、Nagelkerke的R2(Nagelkerke’sR-Square)z为了对Cox和Snell的R2进一步调整,使得取值范围在0和1之间,Nagelkerke把Cox和Snell的R2除以它的昀大值。274、Hosmer和Lemeshow的拟合优度检验统计量(HosmerandLemeshow'sGoodnessofFitTestStatistic)z该拟合优度检验通常把样本数据根据预测概率分为十组,然后根据观测频数和期望频数构造卡方统计量(即Hosmer和Lemeshow的拟合优度检验统计量,简称H-L拟合优度检验统计量),昀后根据自由度为8的卡方分布计算其p值并对Logistic模型进行检验。z如果该p值小于给定的显著性水平α(如α=0.05),则拒绝因变量的观测值与模型预测值不存在差异的零假设,表明模型的预测值与观测值存在显著差异。z如果p值大于α,表明在可接受的水平上模型的估计拟合了数据285、Wald统计量z同线性回归方程的参数显著性检验似,Wald统计量用于判断一个变量是否应该包含在模型中,Wald统计量近似服从于自由度等于参数个数的卡方分布。判断变量是否显著类似于线性回归。29五、非参数检验z非参数检验,是不依赖总体分布的统计推断方法,是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。30五、非参数检验zChi-squaretest:zBinomialTest:zRunsTest:zOne-SampleKolmogorov-SmirnovTest:zK-SampleKolmogorov-SmirnovTest:31Chi-squaretest:z检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,)。z如通过掷六面体600次得出各面结果数据来建议六面体是否没面都均匀325.2.二项分布检验(BinomialTest)z5.2.1.二项分布检验步骤z实际问题中,有许多总体是由二项式组成的。例如,是与非、男与女、正面与背面、正确与错误等等。这种总体通常就称为二项总体。33BinomialTest:z用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一刀两断。345.3.游程检验(RunTest)(略)z5.3.1.游程检验的原理与步骤z游程检验是一种利用游程的总个数来判断样本随机性的统计检验方法。所谓游程,就是指在样本单位的抽取序列中,某一类型的单位被另一类型单位在其前后隔开所形成的一个连续串。z判定:用于把样本数据分成两类(A和B)的分割点可以是指定的某个具体数值,也可以是均值、中位数、众数等。当Xi分割点时设为A类,否则为B类,其相应的单位数分别为N1和N2。在大样本情况下,游程总数R的分布接近于正态分布。z根据输出结果,如果p值α=0.05,所以接受零假设,即样本是随机的。35RunsTest:z检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。z如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。36One-SampleKolmogorov-SmirnovTestz采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。z如果p值α,可以认为样本来自正态分布总体。375.5.两个独立样本检验z虽然有时样本所属的总体的分布类型往往是不明的,但我们还是想知道在这种情况下两个独立样本是否来自相同分布的总体,–Mann-WhitneyU检验、–Kolmogorov-SmirnovZ检验、–MosesExtremeReactions检验–Wald-Wolfowitz游程检验等就是用于处理此类问题的有效方法。–其中Mann-WhitneyU检验是处理该问题中昀常用的方法。385.6.多个独立样本检验zKruskal-WallisH检验为单向方差分析,检验多个样本在中位数上是否有差异;z中位数检验法用于检验多个样本是否来自具有相同中位数的总体;zJonckheere-Terpstra检验法用于检验多个独立样本是否来自相同总体,它适用于定量数据和定序分类
本文标题:实证会计分析统计方法
链接地址:https://www.777doc.com/doc-1106298 .html