您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 市场调查与预测第十七章 回归分析预测
第十七章回归分析预测1、概述2、一元线性回归一、概述1、变量间的关系确定性关系——函数关系:Y与X之间存在确定的函数关系。距离=速度*时间;电流=电压/电阻;银行存款年利率2%,存入本金X,到期本息Y=x(102%).非确定性关系,但两者又有密切联系——相关关系、统计相关。当自变量取确定值时,因变量值是不确定的。在社会经济生活中,存在大量的相关现象:孩子身高和父母身高的关系;施肥量和粮食产量;市场需求规模和市场价格的关系;航空运量和GDP的关系等等无关系。2、回归分析回归分析是一种定量分析变量间相关关系的数理统计方法。它可以提供表示变量之间相关关系的数学表达式(经验公式、回归方程)y=f(x)处于被解释地位的变量y是“因变量”,处于解释地位的变量x是“自变量”。可以判断所建立回归方程(经验公式)的有效性,判别它是否能够代表变量XY间的相关关系。可以利用经验公式,根据自变量的取值对因变量进行预测;或者根据自变量的取值对因变量进行控制。如价格和销售量的关系。可以知道预测或控制可达到的精确程度。3、回归分析预测法利用回归分析的理论和方法建立起回归方程进行预测的方法。4、回归分析预测法的分类按变量的多少可以分为:一元回归分析:只涉及一个自变量、一个因变量多元回归分析:涉及两个或两个以上自变量,一个因变量按回归方程的类型可分为:线性回归分析:因变量是自变量的一次函数非线性回归分析按回归方程的类型和变量多少综合分类:一元线性回归分析——基础一元非线性回归分析——要转化为一元线性回归分析多元线性回归分析——和一元线性回归分析类似多元非线性回归分析——要转化为多元线性回归分析5、回归分析预测法的步骤1)确定预测变量2)确定影响预测变量的因素3)收集整理预测变量及其影响因素的历史统计资料4)分析因变量和自变量的关系,确定回归模型经验确定散点图分析确定理论试算(计算拟和误差(预测误差)),选出拟和程度最好的模型5)求解模型参数,建立回归方程6)检验回归方程的有效性7)利用检验通过的回归方程进行预测,并确定预测值的置信区间二、一元线性回归预测法1、相关分析(1)散点图法1r10r01r1r(2)相关系数分析法:2()xxLxx——自变量与平均值的离差平方和2)(yyLyy——因变量与平均值的离差平均和上式可简化为xyrxyxxyyLLL01rxyL()()xxyyxyr2222().()nxyxynxxnyyr值与两变量之间的关系r=1完全正相关1r0正相关,越接近1,相关性越强。越接近0,相关性越弱r=0不线性相关0r-1负相关,越接近-1,相关性越强;越接近0,相关性越弱r=-1完全负相关7.0rX与Y强相关:r平方大于0.49,说明自变量的变动对总变差的影响大于一半。7.03.0rX与Y中度相关3.00rX与Y弱相关0rX与Y不相关2、选择回归预测模型①曲线比较分析法:与标准曲线比较②误差比较分析法3、参数的确定:参数确定可采用最小二乘法,min∑(yi-a-bxi)222()nxyxybnxxaybx式中,x为非均匀分布,故0x因此不能用简化公式。得到预测模型:y=a+bx4、回归模型的显著性检验:相关系数检验法:1)、从样本计算相关系数r02)、根据回归模型的自由度n-2和给定的显著性水平a,从相关系数临界值表中查出临界值ra(n-2).3)、若r0大于等于临界值,表明两个变量之间显著相关,回归模型有效。可依此预测。方差分析法:基本特点是把因变量的总变动平方和分为两部分,一部分反映因变量的实际值与用回归方程计算出的理论值之差Q.一部分反映理论值与实际值的平均值之差U.Y的总变差=Y的残余变差+Y的说明变差,SST=SSE+SSR或:总离差平方和=剩余平方和(Q)+回归平方和(U)UQSyyQyySnyyyyyyyyyyiiiiyyiiiiiiUYX)ˆ(YX)ˆ()()ˆ()ˆ()(222222差、可解释变差,记为的影响造成的,说明变对—由于—为差、不可解释变差,记的影响造成的,残余变以外其它因素对—除了—离程度,记为个数据和其平均值的偏——回归平方和U与剩余平方和Q相比越大,说明回归效果越好。F检验:构造统计量F=(U/m-1)/[Q/(n-m)]其中:m为变量个数(总数);n为样本数。统计量F服从第一自由度为m-1、第二自由度为n-m的F(m-1,n-m)分布。F=r2/(1-r2)*(n-m)/(m-1)判断规则:对于给定的置信度α,从F分布表中查出Fα(m-1,n-m),把其与用样本计算出来的统计量F0比较:若F0〉Fα(m-1,n-m)成立,则认为回归方程在α水平上显著。反之则认为不显著,回归方程无意义,变量间不存在线性关系。5、进行预测得到预测方程y=a+bx点估计:把自变量的取值mx代入预测方程中,得到对应的值即为预测结果。my区间估计:标准误差:S=sqrt((∑e^2)/(n-m))区间估计:标准误差:S=sqrt((∑e^2)/(n-m))5、预测结果的可靠性检验检验:采用统计方法进行检验,P311p313例:某五金公司历年的销售总额与供应地区的工业产值资料如表所示,并预计2004年该地区工业产值达60.7亿元,试用一元线性回归预测2004年该公司的销售总额。6、应用举例年份销售额(百万元)产值(亿元)19968.527229.5729199710.631328.696119981334.5448.51190.25199915385701444200017.5427351764200119.745.5887.252070.2520022249.61091.22460.16200324.654.21333.322937.64∑130.9321.85623.3713556.3iyixiiyx2ix解:①首先列计算表②计算参数:b预测模型为:xy6.0772.765.287.606.0772.72004y(百万元)③预测:2004年:=60.7亿元2004x22..()nxyxynxx285632.47130.9321.80.6813556.3321.82ayxbnn130321.80.67.77288三、一元线性自回归预测法引言,普遍一元线性普通回归预测对数据要求较高,要求:已知:①1ˆnmyyy1mnxxx②mx为自变量的先期预测值。而实际应用中nxx1,尤其是mx获得很困难。如何才能既适用回归预测的方法,又对数据在的要求不太高,以至于在更多的场合能应用,人们提出一元线性自回归预测方法,即设1ttyx,则预测模型:ttttbyaybyay11:或其它与普遍一元线性回归完全相同年份销售额(百万元)19968.5199710.68.572.2590.119981310.6112.36137.819991513169195200017.515225262.5200119.717.5306.25344.7520022219.7388.09433.4200324.622484541.2∑130.924.6iy1ttyx2txttyx.b预测模型:xy023.195.11158.276.24023.195.12004y(百万元)②计算参数:③预测:2004年=24.60万元2004x22.()nXYXYnXX272004.75122.4106.31.02371756.95106.32ayxbnn122.4106.31.0231.9577四、一元线性加权回归预测分析法1、一元线性普通回归iYabX22.()nXYXYbnXXyXY矩阵形式方程组:2XYaXbXYXabnn2nXaXXb2、直接用矩阵形式求参数写成矩阵baXXYYnn1111求a,b设nnXXYY11近似在直线方程上111ebXaYnnnebXaY…………11bXaY1bXaYn…………两边同乘以1111nnYXXYYXY说明两种方法求解公式等价。111111nnXaXXbX2nXaXXb3、在矩阵求解公式中,可以看出对每个历史数据同等对待,对于加权回归,给以不同时期的历史数据以不同权数iW且:nn121分别对不同期历史数据以不同权数1122nnYYYYYY112211111nnXXXaXbXXXab矩阵方程解出的即为加权回归的参数方法同上,两边同乘nnYYXX1111111WnW11111111nnnnYYXXXXYY111111111111nnnnXXaXXXXbXXWYWXY即2与普通一元线性回归相比,每项多WiWi一般取,1,2……n自然数例:见书上实例P2522WWXaWXWXb五、一元非线性回归分析预测法思路:与一元线性回归分析基本相同。即通过变量替换将非线性方程转化为线性方程;使用最小二乘法建立线性回归方程;在通过逆变换将线性方程转化为非线性方程。六、多元回归分析多元非线性回归分析——转换为多元线性回归分析。多元线性回归分析——与一元线性回归分析基本相同,只是在自变量的选定上、求解回归方程及统计检验等方面比一元回归要复杂一些。设多元线性回归模型为:y=b0+b1*x1+b2*x2+……+bm*xm
本文标题:市场调查与预测第十七章 回归分析预测
链接地址:https://www.777doc.com/doc-1555991 .html