您好,欢迎访问三七文档
SchoolofAtmosphericSciencesNanjingUniversity气象统计预报【Chapter1绪论】1.气象统计预报:利用统计学方法对气象(气候)样本进行分析来估计和推测总体的规律性。2.气候统计预测的基本假设:气候系统的未来状态类似于过去和现在。【Chapter2气象资料的整理】1.平均值(均值)是描述某一气候变量样本平均水平的量。它代表样本取值中心趋势的统计量。2.中位数是表征气候变量中心趋势的另一个量。在按大小顺序排列的气候变量中,位置居中的那个数就是中位数。其优点是它不易受异常值的干扰。在样本小的情况下,这一点尤为显著。3.距平:气象上常用的变量,也就是通常说的异常,即对平均值的正常情况的偏差。一组数据中的某一个数ix与均值x之间的差就是距平,即diixxx=-。统计诊断中用距平来研究变量的变化幅度。4.方差与标准差(均方差)是描述样本中数据与以均值为中心的平均振动幅度的特征量。在气象中也称标准差为均方差(或均方根误差)。方差2211()niisxxn==-∑均方差211()niisxxn==-∑5.资料的标准化处理:在气象要素中,各个要素的单位不一样,平均值及方差也不同。为使它们能在同一水平上进行比较,需要标准化。任何气候变量序列经过标准化处理后,都可以化为平均值为0、方差为1的序列。()/ixxs-6.协方差:2个变量距平向量的内积。n个样本的资料序列kx,lx,其协方差为()()11nklkiklilisxxxxn==--∑协方差是反映两个气象要素异常关系的平均状况,协方差为正则变化一致,协方差为负则变化相反。变量自身的协方差是方差。7.相关系数(correlationcoefficient):协方差是带单位的统计量,不便于比较不同要素的异常关系。利用标准化处理方法,对变量先进行标准化,然后计算协方差(不带单位),这种协方差就是相关系数。相关系数是标准化的协方差。相关系数是描述两个随机变量线性相关的统计量,一般称为相关系数或点相关系数。用r表示。设有两个变量序列:12,,,nxxxL和12,,,nyyyL,相关系数计算公式为:12211()()cov(,)()()niiinnxyiiiixxyyxyrssxxyy===--==--∑∑∑8.自协方差与自相关系数是衡量气象要素不同时刻之间的关系密切程度的量。时间序列SchoolofAtmosphericSciencesNanjingUniversityix(1,,)in=L,其时间间隔j的自协方差为(n为时间序列样本容量)()11()()njiijisjxxxxnj-+==---∑自相关系数是描述某一变量不同时刻之间相关的统计量。将滞后长度为j的自相关系数记为r(j)。不同滞后长度的自相关系数可以帮助我们了解前j时刻的信息与其后时刻变化间的联系。由此判断由ix预测jix+的可能性。对变量x,滞后长度为j的自相关系数为11()()njijiixxxxrnjss-+=--=-∑s是样本序列的标准差,r一般称为滞后(落后)自相关系数。9.落后交叉协方差与落后交叉相关系数:考虑两个变量不同时刻之间的相关密切关系。落后交叉协方差:()11()()njxyiijisjxxyynj-+==---∑落后交叉相关系数:()()11()()njijxyixyixyxyyysjxxrjnjssss-+=--==-∑10.相关系数的检验:在总体相关系数0r=成立的条件下,相关系数r的概率密度函数正好是t分布的密度函数,因此可以用t检验进行显著性检验。步骤如下:(1)计算统计量221rntr-=-(2)它服从自由度为n-2的t分布,因此可用t-检验法检验相关系数的显著性程度(3)由给定的显著性水平a及自由度为n-2,查t分布表,得到临界值ta(4)比较t与ta,若tta,则认为超过给定的显著性水平a的信度检验,拒绝原假设,认为相关系数是显著的临界相关系数22ctrtnaa=+-,表示在给定显著性水平α和样本数n的条件下,相关系数r显著区别于0的临界值。当crr时拒绝原假设。【Chapter3回归分析】1.一元线性回归:一元回归处理的是两个变量之间的关系(一个预报变量,一个因子)。基本原理:一般来说,对抽取容量为n的预报量y与预报因子x的一组样本,如认为y与x是一种统计关系,那么预报量的估计量$y与x有如下关系:$0ybbx=+SchoolofAtmosphericSciencesNanjingUniversity用离差平方和来刻画全部观测值与回归直线的偏离程度:$201(,)()niiiQbbyy==-∑Q值越小越好,根据极值原理,要求:00Qb∂=∂0Qb∂=∂得:0bybx=-2xyxsbs=2.方差分析:预报量y与回归估计值$y以及误差值e之间关系:$yye=+,可得$222yeysss=+,其中2211()nyiisyyn==-∑为预报量的方差,$$2211()niyisyyn==-∑为回归估计值的方差,$2211()neiiisyyn==-∑为误差方差。yySUQ=+,多元情况下亦成立,其中21()nyyiiSyy==-∑为总离差平方和,$21()niiUyy==-∑为回归平方和,$21()niiiQyy==-∑为残差平方和。3.相关系数与线性回归:用线性组合来反映预报因子与预报量之间的关系,其优劣程度用回归方差与预报量的方差比来表征:()()22ˆ212211ˆ1nyixynyyyiiyysUnrsSyyn==-===-∑∑2xyxsbs=xyxysrss=()()()22222211222211ˆ()()()nnixyxyiixnnxyxyiiiiyybxxsssssssyyyy====--===--∑∑∑∑2211yySUQrr==-$2222211yyesssrr==-yxsbrs=(b与r同号)4.一元线性回归方程的显著性检验:检验预报因子与预报量是否有线性关系。在总体回归系数为0的原假设条件下,统计量/1/(2)UFQn=-遵从分子自由度为1,分母自由度为(n-2)的F分布。查F的分布表,在0.05a=下,若aFF则认为回归方程是显著SchoolofAtmosphericSciencesNanjingUniversity的。反之,则不显著。多元线性回归方程的显著性检验类似,其中//(1)UpFQnp=--5.复相关系数:衡量一个预报量与多个变量之间线性关系程度的量。(变量之间的关系归结为多元线性回归方程)复相关系数是衡量预报量y与估计量$y之间线性相关程度的量$$12211()()()()niiinnyyiiiiyyyyURSyyyy===--==--∑∑∑2211yySQURR==-6.逐步回归分析的基本思想:根据一定的显著性标准,每步只选入一个变量进入回归方程,逐步回归时,由于新变量的引进,可使已进入回归方程的变量变得不显著,从而在下一步给以剔除。因此逐步回归能使最后组成的方程只含有重要的变量。它的自变量都已经经过统计检验,在一定的置信水平下,保证所有的回归系数的总体值均不为零,因此逐步回归分析建立的回归方程也称为最优回归方程。【Chapter4气候变化趋势分析】1.线性倾向估计:用xi表示样本量为n的某一气候变量,用ti表示xi所对应的时间,建立xi与ti之间的一元线性回归关系:ˆiixabt=+(1,2,)in=L其含义是,用一条合理的直线表示x与其时间t之间的关系。a是回归常数,b是回归系数,a和b可用最小二乘法进行估计。对于线性回归计算结果,主要分析回归系数b和相关系数r。回归系数b(倾向值):b的符号说明了气候变量x的趋势倾向。当b0说明x随时间t的增加,x是呈上升趋势;当b0,则相反。b值的大小反映了上升或下降的速率,b的绝对值越大,表明直线越倾斜。相关系数r:它反映了x与t间的密切程度。当r=0,则回归直线平行与x轴,说明x的变化与时间无关。r0,说明,x随时间t的增加,x是呈上升趋势;当r0,则相反。R的绝对值越大,说明x与时间的关系越密切。这与b所反映的意义是一致的。当然,要判断变化趋势的程度是否显著,就要对r进行显著性检验。线性倾向估计的检验(回归方程的检验)。2.滑动平均是趋势拟合技术最基础的方法,它相当于低通滤波器。用确定时间序列的平滑值来显示变化趋势。对样本量为n的气候序列x,其滑动平均序列表示为:111ˆkjijixxk+-==∑,(j=1,2,…,n-k+1)式中k为滑动长度,一般取奇数,以使滑动平均对准中间排列。经过滑动平均后,序列中短于滑动长度的周期大大削弱,体现出变化趋势来。但经过这种滑动平均后的新序列比原气候时间序列短,原序列两头的信息不能体现。用这种方法求得的是各个时刻的趋势值,而不是具体的数字表达式。3.气候变化趋势的显著性检验:Z检验【Chapter5气候突变检测】1.滑动t-检验:考察两组样本平均值差异是否显著来检验突变。基本思想:把气候序列中SchoolofAtmosphericSciencesNanjingUniversity两段子序列均值有无显著差异看作来自两个总体均值有无显著差异的问题来检验。对于具有n个样本量的时间序列x,设置一个基准点,基准点前后两段子序列x1,x2的样本分布为n1,n2,则121112xxtsnn-=⋅+遵从自由度n1+n2-2的t分布,其中221122122nsnssnn+=+-2.Mann-Kendall法:非参数统计检验方法(无分布检验)。(1)计算顺序时间序列的秩序列Sk(2)计算逆序时间序列的秩序列Sk(3)给定显著性水平,将计算的UFk和UBk及显著水平临界线(2条直线)画到一张图上。若UFk和UBk出现交点,且交点位于临界线之间,那么交点对应的时刻即为突变开始的时间。【Chapter6气候序列周期分析(谱分析)】1.功率谱分析:以傅立叶变换为基础的频域分析方法,将时间序列的总能量分解到不同频率上的分量,根据不同频率的波的方差贡献诊断出序列的主要周期。2.离散功率谱估计:(1)根据公式计算傅里叶系数,kkab(2)计算相应的功率谱值221()2kkksab=+$(3)确定周期,周期与波数的关系为/kTnk=(4)作周期与功率谱图(5)显著性检验(F检验),确定显著周期3.连续功率谱估计:(1)计算最大滞后时间长度为m的落后自相关系数()11njtjttxxxxrjnjss-+=-⎛⎞-⎛⎞=⎜⎟⎜⎟-⎝⎠⎝⎠∑(2)计算粗谱估计值(3)平滑粗谱估计值(4)确定周期,周期与波数的关系为2/kTmk=(5)作周期与功率谱图(6)显著性检验,确定显著周期4.功率谱检验:离散功率谱用F检验。连续功率谱检验:如果序列的滞后相关系数r(1)为较大正值,表明序列具有持续性,用红噪音标准谱检验;如果r(1)接近0或为负值,表明序列无持续性,用白噪音标准谱检验。红噪音过程是一阶马尔科夫过程或一阶自回归模型,而白噪音过程是一种非周期性过程。5.交叉谱分析是揭露两个时间序列在不同频率上互关系的一种分析方法。6.奇异谱(SingularSpectrumAnalysis,SSA)是从时间序列的动力重构出发,并与经验正交函数(EmpiricalOrthogonalFunction,EOF)相联系的一种统计方法。优点:滤波器不需要预先给定,而是根据资料自身最优确定适合确定和寻找噪声系统中的弱信号;不需要作时间序列由不同频率正弦波叠加而成的假定;对嵌套空间维数m的限定,可以使得对振荡的转换进行时间定位。SSA是一种特别适合于识别隐含在气候序列中的弱信号,是一种研究周期振荡现象的新统计技术。先作扩展矩阵,再做EOF分解,找周期。SchoolofAtmosphericSciencesNanjingUniversity7.小波分析:小波分析(WaveletAnalysis)亦称多分辨率分析。分析时间序列在局部时段的频率特征,能表示强度和初位相随时间变化,称时-频局部分析。优点:一般的功率谱方法对时间域上分辨不清的信号,通过频域分析便可以清晰地描述信号的频率特征,
本文标题:气象统计预报
链接地址:https://www.777doc.com/doc-6803179 .html