您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 基于SVM预测股票波动
北京理工大学毕业设计外文翻译1本科生毕业设计(论文)外文翻译外文原文题目:Forecastingstockmarketmovementdirectionwithsupportvectormachine中文翻译题目:应用支持向量机预测股票市场运动趋势毕业设计(论文)题目:基于混沌时间序列的金融市场预测模型研究北京理工大学毕业设计外文翻译2应用支持向量机预测股票市场运动趋势黄伟𝒂,𝐛,𝑌oshiteruNakamori𝑎,汪寿阳a:SchoolofKnowledgeScience,JapanAdvancedInstituteofScienceandTechnology,1-1Asahidai,Tatsunokuchi,Ishikawa923-1292,Japanb:中国科学院数学和系统科学研究院系统科学研究所中国北京邮编100080摘要:SVM是一种非常特殊的学习算法,其特点是拥有控制决策的能力,使用核函数以及对稀缺性的解决。在本文中,我们将通过预测日经225指数每周的运动趋势来研究使用SVM系统预测财政运动趋势。为了评估SVM的预测能力,我们将其表现与线性判别分析,二次班别分析还有埃尔曼的反向传播神经系统进行比较。实验结果证明,SVM分析优于其他方法。而且,我们计划将SVM与其他分析方法结合起来,这种结合的方法将成为最好的预测方法。关键词:SVM;预测;多元分类;1.介绍金融市场是一个复杂的,进化的,非线性动力系统[1]。金融预测领域以数据密度、噪音、不稳定性、本质松散、高度不可靠和关系隐蔽为特点[2]。在金融市场中包括政治事件、一般的经济条件和交易者的期望等许多因素互相影响,所以,预测金融市场的价格波动非常困难。不过,按照学术研究,我们知道市场价格的变动并不是随机的。确切来说,价格波动以高度的非线性,动态的方式表现出来。认为未来价格是随机运动的的假设可能仅仅是受非线性运动的表象的影响[3-5]。SVM是一种非常特殊的学习算法,其特点是拥有控制决策的能力,使用核函数以及对稀缺性的解决[6-8]。它是一种建立在系统风险最小化原理理论的基础上,通过最小化一般错误的最大值来判断系统的作用。SVM系统显示出对拟合问题很强的抵抗力,最终达到好的表现。SVM另外一个重要特性是使SVM等同于解决线性约束的二次规划问题,因此,SVM的结果总是独特而且全局最佳,不像神经网络那样需要非线性最优化和要求得到风险在局部的最小值。最近,一些报道经常会提到SVM在金融预测上的应用[9-13]。大部分情况下,某一预测的精确度和可接受性受到观测值的偏差的影响。对金融市场的参与者来说,基于最小化估计错误的预测方法并不适合他们的目标。换言之,受一个具体而些微错误的预测驱动的交易可能达不到以准确预测交易遵循的方向运动。这篇文章的主要目的是探索SVM对金融市场运动趋势的预测。下面的文章将按照以下的结构展开:在第二部分,我们介绍SVM的基本理论;在第三部分,给出三个实验计划;实验结果将在第四部分展示;北京理工大学毕业设计外文翻译3而在第五部分,我们会给出我们的结论。2.分类中的SVM理论在这一部分,我们呈现支持向量机模型的一个基本理论。如果想了解更详细的介绍,请参考[14,15]。假设D是数据球体的最小半径。对分开的超平面上两边的点到超平面的距离来说,最小的距离叫做间隔边际。如果边际最大,则超平面是最佳的间隔超平面。假设q是最佳超平面上的边际,那么原理最佳超平面的点同时距离q的点叫做支持向量。考虑到这个问题的分离的集合属于训练矢量两种分化的集合。G={(;);i=1,2,…,N}随着一个超平面()+b=0(∈是输入矢量,∈{−1;1}二元目标)。最初的SVM符合下面的条件:()+b1if=1;(1)()+b1if=−1;(2)或者[()+b]i=1,2,…,N(3)这里,:→是特征地图中绘制了从输入空间到一个平常的高维度特征空间,这个特征空间里数据点变得线性分离了。点到超平面的距离是:d(;w,b)=(4)根据定义边际是2/||w||。因此,我们在Eq的约束条件下(3)可以通过结局下面的式子得到超平面的分离数据:minφ(w)=(5)上述问题的结果是拉格朗日方程中的鞍点=−∑[(()+b)-1](6)在Eq约束条件下,是非负的拉格朗日因子。目前为止,我们的分析只是局限在分离数据之中。为了解决一般的未分离数据案例,我们引入松弛变量:[()+b]1-(≥0,I=1,2,……N)(7)因此,对一个产生的误差来说,相应的必须协调。因此∑是一个数据误差的上限。所以修正一个额外错误消耗的自然方式是在Eq(7)的条件下改变Eq(5)的目标函数至minφ(w,)=+∑(8)C是一个在实验误差和边界之间权衡的恒定正值。本文中,给予实验经历我们赋C=50。类似的,我们在Eq(7)限制下,通过最小化拉格朗日方程来解决最优化问题。北京理工大学毕业设计外文翻译4=∑−∑[(()+b)-1+]-∑(9)其中,是非负的拉格朗日因子。卡罗需-庫恩-塔克条件(KKT)对于初始问题是=w-∑)(10)=-∑(11)=C--=0(12)[()+b]1-(13)(14)0(15)0(16)(()+b)-1+]=0(17)=0(18)所以W=∑)(19)我们可以通过补充条件Eq(17)和(18)来决定b。联立Eq(12)和Eq(18),如果C可得=0。所以我们简单的代入0C)到Eq(17)(=0)来计算b:()(20)由上面的计算我们去所有b的平均值可以的到合理数值:b=∑()(21)是支持向量的取值对于一个新的数据x,分类函数是:f(x)=Sign()(22)以Eqs(19)和(21)代换Eq(22)可得最终的分类函数:f(x)=Sign(∑)∑(()))(23)如果一个核函数,比如K(,)=(),我们常常没有必要明确的知道是什么,只要求在运算中使用核函数就可以了。因此,非线性的分类函数是f(x)=Sign(∑,∑(()))(24)任何满足莫塞条件的函数都可以作为核函数。在此次调查中,基本的函数K(s,t)=exp(-st)被用于SVM的核函数,其原因在于因为理想状况下基本核函数可以提供好的表现。总之,如果没有额外的应用数据基本核函数是非常有用的。北京理工大学毕业设计外文翻译53实验设计在我们的经验性分析中,我们打算检验日经225指数的周变化。日经225指数是有日本经济新闻整理公布的。它用来测量东京股票交易所中的225支具有代表性的股票交易价格,广泛的反应了日本工业不同领域的经济状况。指数交易在世界范围内的金融市场中得到史无前例的流行。当前,日经225指数的期货和期权交易在新加坡国际交易所,大阪证券交易所和芝加哥商品交易所非常活跃。日益增加的日经225衍生金融工具增加了个体和企业投资者在全球投资的机会。日经225指数成功有两个原因。第一,它为投资者提供有效地方式来规避潜在的市场风险。第二,他为投机者和套利者提供新的盈利机会。因此,对研究者和实践者来说,日经225指数具有重要的意义。3.1模型输入选择大多数先前的研究者都使用多元的输入。一些研究显示出股票指数和宏观经济变量的代表性的关系。预测模型使用潜在的宏观经济投入量,包括利率的期限结构,短期利率,长期利率,消费者物价指数,工业生产政府采购,私人消费,国民生产总值和国内生产总值[19-27]等。然而,日本的利率在1990的时候几乎为0.而且,其他的一些宏观经济变量也是我们无法得到的。日本的国内消费能力是有限的。经济的增长主要依靠出口。日本最大的出口对象是世界经济的领导者美国。因此,美国的经济状况对日本经济有很大的影响,这在日经225指数上反应明显。和日经225指数相似,标准普尔500指数也反映美国经济的综合情况。因此,标普500指数可以作为模型的输入因素。影响日本出口的另外一个因素是美元和日元的汇率。这也被选择为模型的输入因素。因此,预测模型可以被表达为下面的方程iretiotio=F()(25)在这里,分别指的是第一阶差分自然对数变换原始标准普尔P500指数和在时间t−1日元在时间t−1的汇率。iretiotio是一个类别变量,它指出了日经225指数在时刻t的运动趋势。如果日经225指数在时刻t比在时刻t-1的值大,则iretiotio取值为1,否则取值为-1.以上的模型输入选择仅仅基于宏观经济分析。在下图中,我们可以发现日经225,标准普尔500和日元北京理工大学毕业设计外文翻译6汇率的关系是非常复杂的,很难得到一个明确的式子来描述他们之间的关系。3.2数据采集我们通过雅虎财经板块获得历史数据,另外,我们从加拿大温哥华大不列颠哥伦比亚大学维纳教授那里获得太平洋交易利率。整个的数据集包含了从1990年一月一日到2002年12月31日,总共676对观测结果。数据集分为两个部分。第一部分,包含640对观察结果用来确定模型和参数的规格。第二部分,包含36对,是用来留做样本和用来比较不同模型的预测结果。3.3与其他预测模型的比较为了评估SVM的预测能力,我们使用RW模型为基准来进行比较。RW是个领先一步的预测模型,它用现在的数据来预测未来的表现:̂=,(26)在这里是现在的值,̂是下一时期的值。我们还比较了SVM和线性判别分析(LDA),二次判别分析(QDA)还有埃尔曼反向传播神经系统(EBNN)的表现。LDA可以用来处理那些内部组频率相同的案例,它的表现可以被随机的数据测量。这种方法最大化阶级间的多样性与阶级内的多样性的比率。因而保证了最大的可分离性。QDA和LDA类似,仅是在等量协方差的假设中使用。因此,当极大似然率与正态分布协调的时候两个区别地区的边界可以成二次的表面。进一步的说明请参考[28]。在本文中,我们展现线性判别式函数:L()=+(27)二次的判别式函数Q()=a+P+()T(28)在这里,,a,P,T是协同估算值。埃尔曼反向传播神经系统是一个部分周期的网络。它的连接时主要的前馈和一套精心挑选的反馈关系,让该网络记得近来发生的线索。输入层分为两个部分;真是的输入单位和环境单位副职以前的隐藏单位的反应。因此,在该网络中通过过去的数据预测将来的投入。更多的细节请参考[29,30]。3.4结合模型对于一个需要专业的知识来完成的工作,如果个体能够协同工作,那么将产生最好的结果。基于这个想法,结合不同的模型可以调高预测表现。因此,我们打算将SVM和其他模型结合在一起。北京理工大学毕业设计外文翻译7∑(29)在这里是分配给传统方法的比重i,∑=1我们基于实验阶段的表现决定比重方案。根据这个战略,不同的预测方法对最后的结合的贡献取决于实验阶段的表现。理论上来说,表现好的方法将获得更多的比重。比重组合为:=𝑎∑𝑎(30)这里是预测方法在样本中的表现。4.实验结果在上个部分描述的各个预测方法是在内部样本数据中估算和确认的。模型的估算选择过程是基于经验评估,经验评估出自外部样本数据。在这个阶段,相关的表现方法被偶然率测量。表格1显示实验结果表明RW表现最差,仅仅产生50%的偶然率。RW模型不仅假设所有的历史信息都表现在现在值,而且还认为所有的增量(不论正负)都是随机的,平衡的,换言之,期望值等于零。换句话说,长期来看正增量和负增量将平衡。SVM在所有的单独预测方法中表现最好。第一个原因是SVM最小化系统风险,换言之,SVM尝试最小化一般错误的最大值,因此,SVM不容易受到过度的攻击。从表格2和3,显了QDA和LDA的表现,事实上,这两种方式有不同的协方差矩阵。异方差模型比协方差模型表现的更好。SVM与其他方式的结合提高了预测能力。不同的方式从不同的角度获得信息,因此,我们可以结合不同的信息从而得到最优的预测。北京理工大学毕业设计外文翻译85,结论本文中,我们研究了使用支撑向量机预测金融波动的趋势。SVM是一种很有希望的金融预测工具。正如我们的分析显示,在预测日经225指数的周波动中SVM优于其他独立的预测模型。SVM给交易员提供清晰的信息,从而导致资本利得。然而,每个预测模型都有优缺点,结合有点才能获得最佳的预测模型。感谢感谢中国教育
本文标题:基于SVM预测股票波动
链接地址:https://www.777doc.com/doc-5022032 .html