您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 回归-时间序列判别分析
回归分析时间序列判别分析回归分析是由一个(或一组)非随机变量来估计或预测某一个随机变量的观测值时,所建立的数学模型和所进行的统计分析,称为回归分析。如果这个模型是线性的,就称为线性回归分析。研究两个变量间的相关关系的回归分析,称为一元回归分析。一元线性回归模型在一元回归分析里,我们要考察的是随机变量与非随机变量之间的相互关系。虽然和之间没有确定的函数关系。但是我们可以借助函数关系来表达它们之间的统计规律性。用以近似地描述具有相关关系的变量间的联系的函数,称为回归函数。YxYx由于与之间不存在完全确定的函数关系,因此必须把随机波动产生的影响考虑在内。于是有一元线性回归模型的一般形式为xY0120,YxED其中是固定的未知参数,也称为回归系数,自变量是非随机可精确观测的,是均值为0,方差为的随机变量,在模型中它代表其他随机因素对Y产生的影响。01,x2x()yEY一元线性回归分析的主要任务是用样本值对回归系数和作点估计;对作假设检验;在处对作预测,并对作区间估计。01,0xxy记,则,称为对的回归直线方程。01yxy01,y101121()()ˆˆˆ,()niiiniixxyyyxxx的无偏估计为2211ˆˆ()2neiiiyyn2残差平方和参数的置信水平为的置信区间为22001122221111ˆˆˆˆ[(2),(2)]()()eenniiiixxtntnnnxxxx01参数的置信水平为的置信区间为1111222211ˆˆ(2)(2)ˆˆ[,]()()eenniiiinnttxxxx11参数的置信水平为的置信区间为221122122ˆˆ()()[,](2)(2)nniiiiiiyyyynn21用的回归值作为的预测值,同时的置信水平为的预测区间为200122120012211()ˆˆ[(2)1,()1()ˆˆ(2)1]()eniieniixxytnnxxxxytnnxx0y10010ˆˆˆyx0y0y用最小二乘法寻找参数的估计值,使离差平方和达极小经整理后,得正规方程组nininiiiiiniiniiyxxxyxn1111201110ˆ)(ˆ)(ˆ)(ˆ1,0niiiniiixyxyQ1210,121010)(min)ˆˆ()ˆ,ˆ(100)ˆˆ(2ˆ0)ˆˆ(2ˆ110111110000niiiiniiixxyQxyQ得到的解为:我们记:则解可以表示为:211110)())((ˆˆˆniiiniixxyyxxxyniniiixxxnxxxL11222)()(niiiniiixyyxnyxyyxxL11))((xxxyLLxy/ˆˆˆ110多元线性回归模型有多个自变量的线性回归模型称为多元线性回归模型。假定是一个可以观测的随机变量,为k个自变量,且有Y01122(1)kkYxxx现假定对于变量与自变量已得到n组观测数据如下:Y12,,kxxx与观测值表ix变量序号12nY1x2x11xkxY21x1kx1y2yny12x1nx22x2nx2kxknx在理论模型式(1)下,可以认为表中数据满足YX01122(1,2,)jjjkkjjyxxxjn若记11121100212222111211,,,1kknnnknkkyxxxyxxxYXyxxx则上式可用矩阵表示为未知参数估计式为1ˆ()TTXXXY于是,有经验回归方程为01ˆˆˆˆTk01122ˆˆˆˆˆkkyxxx的无偏估计为2于是,有经验回归方程为221ˆ()ˆ1niiiyynk对于给定自变量,用来预测***12,,,kxxx****01122ˆˆˆˆˆkkyxxx称为的点预测,的的置信区间为*ˆy10021002ˆˆ[1(1),ˆˆ1(1)]kkijijijkkijijijycxxtnkycxxtnk****01122kkyxxx*yy11()()ijTCcXX用spss进行回归分析•某牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格、广告投入等之间的关系,从而预测出在不同价格和广告费用下的销售量。为此,销售部的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏的销售量、销售价格、投入的广告费用,以及同期其它厂家生产的同类牙膏的市场平均销售价格,分析牙膏销售量与其它因素的关系,为制订价格策略和广告投入策略提供数量依据。牙膏销售量与销售价格、广告费用等数据首先在spss中导入数据,由于差价是根据厂家自己定价和其他厂家平均价决定的,所有灵活性更好,将差价作为x1,将广告费作为x2,销量作为y。在spss中画出y与x1的散点图。以便我们观察y与x1的关系。由图中我们大致可以看出差价x1与销量y是线性关系。画出y与x2的散点图,我们大致的也可以看出y与x2也是线性关系。所以我们可以认为y与x1、x2的关系是线性的。即:y=ax1+bx2+c所以我们在spss中做多元回归分析,得到结果如下。其中R方=0.886表示y的88.6%可以有模型确定。模型汇总模型RR方调整标准估计的误差1.941a.886.878.23833a.F=104.967F0.05(2,29)=3.33,显著性水平sig00.05。所以可以认为模型是可以用的。Anovab模型平方和df均方FSig.1回归11.92525.962104.967.000a残差1.53427.057总计13.45929a.b.系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)4.407.7226.102.000价格差1.588.299.5305.304.000广告费.563.119.4734.733.000a.所以我们可以得到回归方程Y=1.588X1+0.563X2+4.407所以我们就可以根据x1、x2的值来预测销量y。由上面的回归方程我们可以看到x2的系数靠近0,也就是说其实销量Y的值跟x2的线性关系不是那么明显的,即说明这个回归方程式可以改进的,其实我们可以从y跟x2的散点图在x2=6.5的时候是有一定的弯曲的,所以我们对模型进行改进y=ax2+bx2*x2+c用spss得到改进的结果由上面我们可以看出R方=0.905比上面的要大说明,拟合的效果要好。模型汇总模型RR方调整标准估计的误差1.952a.905.894.22130a.F=82.941F0.05(3,29)=2.93,显著性水平sig大约等于00.05。所以可以认为模型是可以用的。Anovab模型平方和df均方FSig.1回归12.18534.06282.941.000a残差1.27326.049总计13.45929a.b.由上面的表我们可以知道:Y=1.307X1-3.696X2+0.349X2*X2+17.324这样我们就得到了回归方程,我们可以根据差价和广告费投入只能大致的进行销量估计。因为我们从回归方程中可以看到,当我们进行大量的广告费投入的话,根据回归方程算出销量是大幅增加的,但是现实生活中我们不可能无限制的增加。系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)17.3245.6413.071.005价格差1.307.304.4364.305.000广告费-3.6961.850-3.102-1.997.056x2.349.1513.6502.306.029a.时间序列•所谓时间序列,是指观察或记录到的一组按时间顺序排列的数据,经常用X1,X2,…Xn表示。序列包含了产生该序列的系统的历史行为的全部信息。•基本思想:根据系统有限长度的运行记录(观察数据),建立能够比较精确地反映时间序列中所包含的动态依存关系的数学模型,并借以对系统的未来行为进行预报•时间序列分析简称时序分析,是一种根据动态数据揭示系统动态结构和规律的统计方法,是统计学科的一个分支。用spss进行时间序列分析数据来自中国统计出版社出版的《中国统计年鉴》,数据年限为1978—2004年。用时间序列分析,我国未来两年末从业人员人数和三产业从业人员数有什么样的发展趋势?数据:通过spss分析得到发展趋势图将数据导入spss,得到结果如下同时spss给出了预测值预测模型20052006失业人口预测1709.991757.41UCL2074.842234.02LCL1345.131280.80对于每个模型,预测都在请求的预测时间段范围内的最后一个非缺失值之后开始,在所有预测值的非缺失值都可用的最后一个时间段或请求预测时间段的结束日期(以较早者为准)结束。预测模型20052006第三产业预测24732.8426293.43UCL26153.0629360.73LCL23372.4823477.89对于每个模型,预测都在请求的预测时间段范围内的最后一个非缺失值之后开始,在所有预测值的非缺失值都可用的最后一个时间段或请求预测时间段的结束日期(以较早者为准)结束。判别分析判别分析和聚类分析的区别聚类分析:是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称。它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。判别分析:是根据多种因素(指标)对事物的影响来实现对事物的分类,从而对事物进行判别分类的统计方法。判别分析适用于已经掌握了历史上分类的每一个类别的若干样品,希望根据这些历史的经验(样品),总结出分类的规律性(判别函数)来指导未来的分类用spss做判别分析:为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。1991年30个省、市、自治区城镇居民月平均收人数据表x1:人均生活费收入x6:人均各种奖金、超额工资x2:人均国有经济单位职工工资x7:人均各种津贴(国有+集体)x3:人均来源于国有经济单位标准工资x8:人均从工作单位得到的其他收入x4:人均集体所有制工资收入x9:个体劳动者收入x5:人均集体所有制职工标准工资样品序号地区x1x2x3x4x5x6x7x8x9类序号G11北京170.03110.259.768.384.4926.8016.4411.90.412天津141.5582.5850.9813.49.3321.3012.369.211.053河北119.4083.3353.3911.07.5217.3011.7912.00.704上海194.53107.860.2415.68.8831.0021.0111.80.165山东130.4686.2152.3015.910.520.6l12.149.610.476湖北119.2985.4153.0213.18.4413.8716.478.380.517广西134.4698.6148.188.904.3421.4926.1213.64.568海南143.7999.9745.606.301.5618.6729.4911.83.829四川128.0574.9650.1313.99.6216.1410.1814.51.21
本文标题:回归-时间序列判别分析
链接地址:https://www.777doc.com/doc-728970 .html