您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 第三章 数据分析方法与参数统计推断 06.01.30
第三章数据分析方法与参数统计推断在计量经济分析推断中,其主要是根据观察到的数据进行整理,然后做出判断。因此,根据观察到的数据探讨对某些参数的估计方法是计量经济学中的主要内容之一。在介绍常用的一些估计方法及评价估计标准之前,我们先介绍一些常用的数据的平滑技术:第一节数据的分析方法一、算术平均(arithmeticmean)二、加权算术平均法(weightedarithmeticmean)三、几何平均法(geometricmean)四、移动平均法1、算术移动平均法2.移动几何平均法香港股票价格指数与3年移动平均附加例1图百货店销售额原数列与中心化4项移动平均附加例2图日元3.k的选择在时间序列的估计中,应用移动平均法时,观察值得到平滑,移动平均数的变化趋势也同样被平滑,以消除原时间序列的不规则变动和周期变动,其平滑程度取决于k,当k较大时,灵敏度较差,有显著的滞后现象发生;当k值较小时,预测结果可以灵敏地反映出时间序列的变化趋势。但是当k过小时,又达不到消除不规则变动和周期性变动的目的,另外还可能因为随机干扰反映过快而造成错觉,一般是利用不同的k,对估计对象进行实际试验,从中选择最佳的k。五、指数平滑法第二节抽样分布一、总体的分布对任意的实数集合S,令P(S)为属于S的个体在总体中所占的比率。当S确定后,P(S)也就唯一的确定,称这个对应的关系为总体的分布。因此可用一个随机变量X来表示总体,X的分布就是总体的分布。分布函数记为F(x),概率密度记为f(x)。总体、个体定义3.1简单随机样本设X为具有分布函数F(x)的随机变量。若X1X2Xn为具有同一分布函数F(x)的相互独立的随机变量,则称X1X2Xn为从总体X得到的容量为n简单随机样本,简称样本。它们的观测值x1x2xn为样本观测值。设X1,X2,Xn为是来自总体X的样本,g(X1,X2Xn)是X1,X2,Xn的函数,若g是连续函数且g中不含任何未知参数,则称g(X1,X2Xn)是一统计量。定义3.2统计量二、样本的矩估计样本平均值niiXnX11样本方差22221111()11nniiiiSXXXnXnn样本标准差niiXXnSS122)(11样本k阶(原点)矩,2,1,11kXnAnikik样本k阶中心矩,2,1,)(11kXXnBnikikOLS条件:设,,21XXX是一个随机序列,相同方差且互不相关,将这种不相关称作无序列相关。这三种特征称作最小平方条件(OLS条件)。,,,21nXXX具有相同的期望值,三、正态总体的几个常用统计量统计量是样本的函数,它是一个随机变量。统计量的分布称为抽样分布。(一)2分布A.2统计量C.上分位点对于给定的正数,01称满足条件222()()()nPnfydy2()n分布的概率密度:B.的为上分位点(二)t分布A.t统计量:B.t(n)分布的概率密度函数C.上分位点(三)F分布A.F统计量B.F(n1n2)的分布的概率密度C.上分位点及其性质:(1)上分位点的定义(2)F分布的上分位点有如下的性质四、正态总体的样本均值与样本方差的分布:方差存在)的均值为,方差为2,X1,X2,Xn)(XE2()DXn设),(~2NX令niiXnX11于是,对于正态总体的X)/,(~2nNX命题3.1设总体X(不管服从什么分布,只要均值和是X的一个样本,则总有有定理3.1设nXXX,,,21是总体),(2N的样本,2,XS分别是样本均值和样本方差,则有222(1)1).~(1)nSn2).X与S2独立定理3.2设12,,,nXXX是总体2(,)N的样本,2,XS分别是样本均值和样本方差,则有)1(~/ntnSuX定理3.3第三节参数的统计推断一、参数的估计(一)、估计量的选择标准(1)无系统误差(2)在一切无系统误差的估计量中,应该选择取值最集中的估计量.(3)当样本容量n无限增大时,它的值趋于稳定在参数的真值附近.我们选择估计量的原则是:在一切可能的估计量中选择具有无偏性(或相合性)和最小方差的估计量。一般估计量的相合性是大数定律的推论,无偏性和最小方差性的要求,无论在理论上还是从实际应用的观点来说都是合理的。因此,选择最优估计量的问题就集中到在一切无偏估计中选择具有最小方差的无偏估计的问题上,最小方差无偏估计又叫最优无偏估计。(二)矩估计法(三)极大似然估计法(四)贝叶斯估计与极大极小估计1.决策论的基本概念2.极大极小估计3.贝叶斯估计(一)假设检验的基本思想假设检验有参数假设检验和非参数假设检验之分。假设检验就是通过样本获取数据对所提出的假设作出判断:是接受、还是拒绝原假设。1.假设检验的两类错误假设检验的推断只用一个样本观察值作为判断的依据,因此将产生以下两个问题:1.)当H0为真时,仍可能做出拒绝H0的判断,称为犯第一类错误.(这种可能性是无法消除的)2.)当H1为真时仍有可能接受H0,称为犯第二类错误.二、假设检验显著性检验:一般来说,控制犯第一类错误的概率,使它小于或等,通常取0.1,0.05,0.01等值。这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的概率检验问题,称为显著性检验问题。2.K值的确定给出一个较小的数,使犯第一类错误的概率不超过,即使得)10(P{拒绝为真}00|HH数k是检验上述假设的一个门槛。如果:knxz0与0的差异是显著的,这时拒绝H0x则称反之,如果:knxz0||与0的差异是不显著的,这时接受H0x则称数称为显著性水平。显著差异的判断是在显著性水平下做出的。nxz0F.显著性水平、检验统计量称为检验统计量。统计量x上面关于与0有无(二)双边检验在显著性水平下,假设检验01:H00:HH0称为原假设或零假设H1称为备择假设。拒绝域21|||,,zzxxn22,zzzz为临界点(三)单边假设检验1.单边假设检验的思想我们需要检验假设00:H01:H2.单边检验拒绝域的确定拒绝域为:znxzxx021|,,左边检验问题00:H拒绝域形式为10:H01,,|nxxxzzn(四)参数假设检验问题的步骤1.根据实际问题的要求,提出原假设H0及备择假设H1;2.给定显著性水平及样本容量n;3.确定检验统计量以及拒绝域的形式;4.按P{拒绝H0|H0为真}=求出拒绝域;5.取样,根据样本观测值确定接受还是拒绝H0;(五)正态总体均值假设检验的进一步讨论1.2已知,关于的检验(1)U检验利用在H0为真时,总体服从N(0,1)分布的统计量nx0来确定拒绝域的,这种检验方法常称为u检验法。(2)原假设为不等式情形需要检验的问题写成以下的形式,00:H01.:H取显著性水平为,现在要求检验问题(3.3.24)的拒绝域。(3.3.24)从而得检验问题(3.3.24)的拒绝域为znx0这与前面得到的检验问题的拒绝域是一致的。比较正态总体),(2N对均值两种检验问题00:H01:H00:H和我们看到尽管两者原假设H0的形式不同,实际意义也不一样,但对于相同的显著性水平,它们的拒绝域是相同的在方差2已知时10:H2.2未知,关于的检验(t检验)检验问题00:H01:H的拒绝域(显著性水平为)采用nSXT0作为检验统计量。拒绝域的形式为:knsxtxxn0,1|||,上述利用t统计量得出的检验法则称为t检验法第四节方差分析方法一、单因素试验概念1.因素在试验中,考察的指标称为试验指标。影响试验指标的条件称为因素。因素可分为两类,一类是人们可以控制的(可控因素);一类是人们不能控制的。2.水平因素所处的状态,称为该因素的水平。如果一次试验中只有一个因素在改变,称为单因素试验;如果多于一个因素在改变的试验称为多因素试验。二、方差分析方法(试验数据的分析方法)将各个总体的均值依次记为321,,需要检验假设:3210:H3211,,:H不全相等,设因素A有S个水平sAAA,,,21在水平Aj(j=1,2,s)下,进行nj次独立试验,得到如表中所给出的结果。例[3-18]例[3-19](一)基本假定及模型设各个水平(1,2,,)jAjs下的样本jnjjjxxx,,,21来自同方差2,均值分别为(1,2,,)jjs的正态总体),(2jN且设不同水平Aj下的样本之间相互独立。,j与2未知。ijjijxjni,,2,11,2,,js),0(~2Nij各ij独立其中j与2均为未知参数,称(3.4.1)式为单因素试验方差分析的数学模型(3.4.1)(二)方差分析的任务1.检验s个总体221(,),,(,)sNN的均值是否相等,即检验假设sH210:sH,,,:211不全相等2.作出未知参数221,,,,s三、平方和的分解引入总平方和sjniijTjxxS1122)(其中sjniijjxnx111分解成为:2TS222AETSSSsjnijijEjxxS1122)(sjnijAjxxS1122)(其中四、22,EASS的统计特性sjjEnS1222)1(~且当H0为真时)1(~222sSA五、假设检验问题的拒绝域拒绝域具有形式KsnSsSFEA)()1(22拒绝域为),1()()1(22snsFsnSsSFEA六、未知参数的估计
本文标题:第三章 数据分析方法与参数统计推断 06.01.30
链接地址:https://www.777doc.com/doc-3993000 .html