您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 一元线性回归模型的应用
§2.4一元线性回归分析的应用:预测问题一、区间估计有关知识的回顾二、条件均值和个别值的预测值的估计三、实例:时间序列问题及其他典型例四、作业五、附录一、区间估计有关知识的回顾1、点估计根据总体参数的性质构造一个统计量,然后由样本资料计算出统计量的值,并直接作为相应的总体参数值得替代。常见的点估计有最小二乘估计、极大似然估计、矩估计等。2、区间估计区间估计就是用两个估计值所构成的实轴区间作为总体参数取值的可能范围。设和是的两个估计量,用或直接替换就是点估计,若用(,)估计,这就是区间估计。1ˆ2ˆ1ˆ2ˆ1ˆ2ˆ举例说明一大型超市为研究顾客的购买额,抽取了100个客户作样本,这些顾客平均花费水平为80元,标准差是25元,试求总体平均购买额的变化范围()解:根据题意,n=100,=80,S=25,由统计学原理知,在原假设成立时,统计量服从自由度为25的t分布,其分布图象大致是0.01xxtSn0.02520.02522t2tt统计量的值落在与之间的概率是,所以有下面的等式成立代入有关数据,查课本370页的t分布表,找到=2.06,并计算得上述区间[74.85,85.15]称为的置信度为95%的置信区间,0.95称为置信水平或置信度。该区间表示意义是我们以95%的概率断定这个大型超市全体消费者的平均购买额落在区间[74.85,85.15]内。2t2t1221xPttSn2t74.8585.150.95P二、总体条件均值与个别值的预测值1、总体条件均值E(Y|X)的预测值含义在总体回归函数为的情况下,Y在时,条件均值为其含义是当研究的总体的自变量X的取值为时,该总体因变量的均值是,在例2.1.1中,当X=4000时,E(Y|X=4000)=3004.8表示当这个社区有一部分居民的月收入达到4000元时,该社区这一部分居民平均消费水平将达到3004.8元。01(|)EYXX0XX010(|)EYXX0X010(|)EYXX总体均值的区间估计含义:在例2.1.1中,当X=4000时,E(Y|X)的95%置信区间是[3004.8-1.96×115.76,3004.8+1.96×115.76]=[2777.9,3231.69],其含义是当这个社区有一部分居民收入达到4000元时,我们以95%的概率断定这一部分居民平均月消费额在2777.9元至3231.69元之间。2、个别预测值的含义个别预测值表示当总体回归函数为的情况下,Y在时,条件均值为其含义是当研究的总体中有一个个体,其自变量X的取值为时,该个体的因变量预测值是01(|)EYXX0XX010(|)EYXX0X010(|)EYXX在例2.1.1中,当总体自变量X的取值为4000时,个别值的预测值的点估计是3004.8元。表示当该社区居民中,若有一个居民其月收入达到4000元时,估计他(或她)的月消费额是3004.8元。个别值的区间估计含义若在该社区中,有一个居民其月收入达到4000元时,他(或她)的月消费额的95%置信区间是[3004.8-1.96×163.71,3004.8+1.96×163.71],也就是[2683.93,3325.67]。表示意义是我们可以以95%的概率断定他(或她)的月消费额在2683.93至3325.67元之间。从上面的分析知道,对同一个总体,当自变量时,其总体均E(Y|X=)预测值和个别值的预测值的点估计是相同的(都是),但是,它们的区间估计是不同的。这是因为它们的方差不同所致。它们的方差分别是同时,即使它们的点估计是相同的,但是所表示的意义是不同的,请同学们注意这个问题。0Y0Y0XX0X0Y010(|)EYXX220021()1ˆ((|))()()niiXXVarEYXXnXX220021()1ˆˆ()(1)()niiXXVarYnXX2211ˆˆ()2niiiYYn例2.5.1讲解从总体上考察中国居民收入与消费支出的关系。下表给出了以1990年不变价测算的中国人均国内生产总值(GDPP)与以居民消费价格指数(1990年为100)缩减的人均居民消费支出(CONSP)两组数据。这两组数据是1978-2000年的时间序列数据(timeseriesdata),即观测值是连续不同年份中的数据,该表的数据与表2.1.1中的数据不同,表2.1.1中的数据涉及的是同一年份中不同居民家庭的可支配收入与消费支出,因此也称为截面数据(cross-sectiondata).年份人均居民消费支出人均GDP19781979198019811982198319841985198619871988198919901991199219931994199519961997199819992000395.8437.0464.1501.9533.5572.8635.6716.0746.5788.3836.4779.7797.1861.4966.61048.61108.71213.11322.81380.91460.61564.41690.8675.1716.9763.7792.4851.1931.41059.21185.21269.61393.61527.01565.91602.31727.21949.82187.92436.12663.72889.13111.93323.13529.33789.7iYiX解法1(手工算)解题思路:根据一元线性回归模型参数的最小二乘估计表达式其中112101ˆˆˆniiiniixyxYX1111,,,nniiiiiiiixXXyYYXXYYnniXiYixiyiixy2ix2iy解法2(用EViews软件)•DependentVariable:CONSP•Method:LeastSquares•Date:10/02/07Time:23:47•Sample:19782000•Includedobservations:23•••VariableCoefficientStd.Errort-StatisticProb.•••C201.118914.8840213.512410.0000•GDPP0.3861800.00722253.474710.0000•••R-squared0.992710Meandependentvar905.3304•AdjustedR-squared0.992363S.D.dependentvar380.6334•S.E.ofregression33.26450Akaikeinfocriterion9.929800•Sumsquaredresid23237.06Schwarzcriterion10.02854•Loglikelihood-112.1927F-statistic2859.544•Durbin-Watsonstat0.550636Prob(F-statistic)0.000000•••DependentVariable:CONSPMethod:LeastSquaresDate:10/02/07Time:23:47Sample:19782000Includedobservations:23VariableCoefficientStd.Errort-StatisticProb.C201.118914.8840213.512410.0000X0.3861800.00722253.474710.0000R-squared0.992710Meandependentvar905.3304AdjustedR-squared0.992363S.D.dependentvar380.6334S.E.ofregression33.26450Akaikeinfocriterion9.929800Sumsquaredresid23237.06Schwarzcriterion10.02854Loglikelihood-112.1927F-statistic2859.544Durbin-Watsonstat0.550636Prob(F-statistic)0.000000几个概念:S.E.ofregression回归标准误差,计算方法是其中表示残差列向量,T为样本容量,k为被估计参数的个数。Sumsquaredresid残差平方和,计算方法是21)]/(ˆ'ˆ[..kTuuESuˆuuSSRˆˆ'其中nixyuuuuuiiin,,2,1)ˆˆ(ˆ,ˆˆˆˆ1021Loglikelihood对数似然函数,计算方法是Meandependentvar因变量均值Akaikeinfocriterion赤池信息准则,计算方法))/ˆˆlog()2log(1(2)log('TuuTlikelihoodTttyTy11TkTLAIC2)log(Schwarzcriterion施瓦茨准则,计算方法Prob(F-statistic)=pro(F),即回归方程的p值TTkTLSClog)log(2*F解法3(用SPSS软件)Coefficientsa201.11914.88413.512.000.386.007.99653.475.000(Constant)GDPPModel1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:CONSPa.四、作业下表是10个品牌啤酒的广告费用和销售量的数据,请你做以下工作:(1)、用广告费用作自变量x,销售额作因变量y,求出估计的回归方程。(2)、简要概括一下你的发现。啤酒品牌广告费(万元)销售量(万箱)ABCDEFGHIJ120.068.7100.176.68.71.021.51.45.31.736.320.715.913.28.17.15.64.44.44.3五、附录:有关公式的推导1、一元线性回归模型的最小二乘估计设有一元线性回归模型,其样本数据分别是,i=1,2,…,n.根据最小二乘估计原理,使为最小。由微积分学原理,有(1)01YX(,)iiXY220111ˆˆˆ()(())nniiiiiiQYYYX01100111ˆˆ2(())0ˆˆˆ2(())()0ˆniiiniiiiQYXQYXX化简(1),得正规方程组解正规方程组得(2)0111201111ˆˆˆˆnniiiinnniiiiiiiYnXXYXX211110221111112211ˆ()ˆ()nnnniiiiiiiiinniiiinnniiiiiiinniiiiXYXYXnXXnYXYXnXX化简(2),得离差形式的估计其中2、参数和的最小二乘估计的性质(1)线性性由和的最小二乘估计的表达式知,、是的线性函数,故线性性显然。(2)无偏性112101ˆˆˆniiiniixyxYX1111,,,nniiiiiiiixXXyYYXXYYnn01010ˆ1ˆ12,,...,nYYY2111102211211112211201011111221120ˆ()()()()()()()()().nnnniiiiiiiiinniiiinnnniiiiiiiiinniiiinnnniiiiiiiiinniiiiiiXYXXYEEnXXXEYXXEYnXXXXXXXnXXXnXX
本文标题:一元线性回归模型的应用
链接地址:https://www.777doc.com/doc-2824058 .html