您好,欢迎访问三七文档
第九届广东大中专学生科技学术节----首届广东大学生金融建模大赛1基于极值过滤思想的择时交易策略杨程炜2015.6.26摘要首先,结合核回归、指数滑动平均模型,对价格序列进行去噪、光滑化。然后,通过对极值建立过滤规则,筛选出一系列具有“代表性”的极值,极值序列有两方面的信息具有重要意义:第一,能够很好地反映价格序列过去的走势;第二,最后一个极值有可能成为趋势扭转的信号。因此,适当添加限制条件,使得尽可能在趋势扭转时进行开仓。本文基于第二点,通过构造标准差区间确定买卖信号,在三年多的股指期货的分钟数据回测中,收益达到133万,收益风险比接近2.3。最后,本文最大的成功之处在于提出了一种创新的方法描述过去的价格走势,能够将过去的价格走势极大程度地提取到一个低维的向量中,因此能够有效地为机器学习模型提供“前处理”工作,模型发展潜力较大。第九届广东大中专学生科技学术节----首届广东大学生金融建模大赛2承诺书我们已阅读2015广东高校金融建模邀请赛竞赛章程。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们大赛网站公布论文,以供网友之间学习交流,大赛网站以非商业目的的论文交流不需要提前取得我们的同意。我们的参赛队名为:水滴的梦想参赛队员(签名):杨程炜参赛选题组别:【普通组】■【高频组】□第九届广东大中专学生科技学术节----首届广东大学生金融建模大赛3基于极值过滤思想的择时交易策略一建模目的与问题分析本文希望从历史价格走势中提取有用信息,预测价格未来走势,建立能够获得超额收益的择时交易策略,即“趋势模型”。首先面临的第一个问题:如何描述历史的价格走势信息。如果直接采用过去的价格信息,不仅面临噪声数据的干扰,而且维度过高,每个变量的信息量过少。因此第一步需要对价格序列进行去噪和光滑化;第二步需要提取数据,用一些特征信息反映过去一段时间价格走势的反映。即用低维的数据反映高维数据的大部分信息。针对问题一,有如下的想法:如果在价格序列中选定一系列具有“代表性”的极值,按照它们的时间间隔与先后顺序排列,连接起来,就可以反映价格序列大致的走势,因此可认为这一系列具有“代表性”极值序列蕴含了价格走势的大量信息。面临的第二个问题:如何利用提取后的信息假设我们已经筛选得到一系列具有“代表性”的极值,那么如何利用这些信息呢?如果这些极值的相对大小、出现间隔具有一定的模式,可以采用机器学习模型进行挖掘;另一方面,极值是趋势扭转的必要条件,当前产生的极值具有代表性意义,因此也可以只利用当前的少数极值,建立交易模型。二模型思路首先,通过核回归、指数滑动平均等模型,对价格序列进行去噪、光滑化。再者,价格序列总是在“波动中上升”、“波动中下降”,因此,在一个大趋势中可能有多个极值,因此,即使这些极值并不是由噪声交易产生,但仍不是本轮趋势的终点,是“不具有代表性”的,因此,需要对这些极值进行过滤。最后,利用过滤后的极值的信息,建立择时交易策略。三模型建立3.1价格序列的去噪与光滑由于交易噪声、市场扰动等原因,会产生噪声,导致价格序列频繁产生极值,不利于对极值的分析,因此对股价序列进行去噪是重要且必要的。我们采用核回归与指数平滑结合的方法去噪。核回归由于使用到数据中心点两侧的信息,因此其效果往往较好,但在做回测的过程中,近期数据不能使用右侧的数据进行核回归,否则就会使用未来信息。第九届广东大中专学生科技学术节----首届广东大学生金融建模大赛4因此,对核回归进行了改良:当核回归中心点的右侧尚未使用到未来信息时,使用核回归对股价进行去噪,随着核回归的中心点的移动,当中心点右侧已经超过当前时刻,以最后一次核回归的预测结果作为基准,使用指数平滑。3.1.1核回归(KernelRegression)①核函数使用高斯核:22002exp),(axxxxK0x为回归中心点x为以中心时间窗口内的数据点为时间窗口a为核宽度②核回归结果:3.1.2指数平滑tttPnEMAnnEMA12111tEMA为t时刻指数平滑的结果n为指数平滑的时间参数3.2极值过滤极值过滤的目的是在不使用未来信息的前提下,选取一系列具有“代表性”的极值,通过这些极值点,反映价格的走势。但是,即使是光滑化后的序列,除了仍存在一些噪声产生的极值,而且还存0xNiiiiNixxKxYxxKXY10010,,ˆ第九届广东大中专学生科技学术节----首届广东大学生金融建模大赛5在“震荡期”,在“震荡期”会产生许多极值点,但价格的总体趋势并不向下或向下,因此,并不是“所有光滑化序列中的极值点都具有代表性”。因此,需要对产生的极值进行过滤。3.2.1极值的过滤规则:过滤的规则则有两条:(1)如果当前的极值点与前两个极值点反映的趋势不一致,则它们相差的价格应大于一定的“阈值”才能真正说明当前价格趋势已扭转。(2)如果当前的极值点与前两个极值点反映的趋势一致,则保留而且并且替换掉上一个极值点。原因是认为当前趋势仍在延续,而上一个极值点不是本次趋势的终点,从而被替换掉。3.2.2极值过滤的阈值关于极值的阈值,有如下的想法:“当近期价格总体波动较大,则最近一次极值点需要偏离上次极值点较大才能说明价格趋势已扭转,而当近期价格总体波动较小,则最近一次极值点需要偏离上次极值点相对较少即可说明价格趋势已扭转。”采取以下做法:选定标准差的时间窗口stdT,,计算这段时间的标准差Std过滤阈值为标准差的一定倍数1p,即可通过“过滤”。3.2.3极值过滤规则的完整表达将上述讨论总结,得到最后的过滤规则假设在t时刻,此时已通过“过滤”的极值有N个,若当前出现极值点E,则通过“过滤”有四种途径:①EEENN1,则用E替换NE②,则用替换③,,并且,则E成为1NE④,,并且,则成为NNEEEE,,...,,121EEENN1ENENNEE1EENStdpEEN1NNEE1EENStdpEEN1E1NE第九届广东大中专学生科技学术节----首届广东大学生金融建模大赛63.2.4过滤极值的稳定性假设在t时刻,此时已通过“过滤”的极值有个,其中1E~1NE不会因为当前的价格走势而改变,是稳定的,可用作反映过去趋势。但NE可能会被不断替换,与当前价格走势有关,是不稳定的,而且它通过过滤与1NE有关,而通过过滤与有关,如此类推,通过过滤与~都有一定程度相关,因此是中信息量最大的变量。理解这一点对于交易策略制定有重要的作用。如图一,其中分段横向的直线(蓝色)正是任意时刻对应的“最后一个极值”.图1过滤极值示意图四交易策略本文制定的交易策略并没有使用反映的过去价格走势信息,仅仅是使用了“NE是趋势扭转的必要条件”这一性质。通过添加一定的条件限制,增加在扭转趋势的极值开仓的准确率。交易策略的制定,实质是确定开多、开空、平多、平空四种信号。首先,对于任意时刻t,以当前最后一次极值作为中心值,计算标准差NNNEEEE,,...,,1211NE2NENE1E1NENENNEEEE,,...,,121121,...,,NEEEtEN第九届广东大中专学生科技学术节----首届广东大学生金融建模大赛7(见2.2.2节),设定一定比例,形成一个标准差区间tStdptEtStdptENN22)(,)(4.1基本的交易策略4.1.1策略设计想法(一)开仓策略有以下的想法:(1)当出现一个极小值后,而价格上穿标准差区间上限,则这个极值很可能是扭转趋势的极值;(2)当出现一个极大值后,而价格上穿标准差区间上限,则可认为上涨趋势仍在继续,而前一个极大值的产生只是调整,正是“波动中上涨”的体现;(3)当出现一个极小值后,而价格下穿标准区间下限,则可认为下跌趋势仍在继续,而前一个极小值的产生只是调整,正是“波动中下跌”的体现;(4)当出现一个极大值后,而价格下穿标准差区间下限,则可认为上涨趋势仍在继续,而前一个极大值的产生只是调整,正是“波动中上涨”的体现;(二)平仓策略的制定基于以下的想法:采用一直持仓的策略。这样的平仓策略对模型一般适用于以“要求”:①对于做趋势的模型,对于趋势的判断不存在“灰色地带”,总能判断当前时刻所处的趋势。②对模型的准确率有较高的要求,否则趋势判断错误后由于没有平仓策略而导致风险过大。4.1.2策略制定开多:平滑化后价格上穿上一时刻的标准差区间上限,即开空:平滑化后价格下穿上一时刻的标准差区间下限平多:平滑化后价格下穿上一时刻的标准差区间下限,同开空。tStd2p1)1(12tStdptEtPN1)1(2tStdptEtPN1)1(12tStdptEtPN1)1(2tStdptEtPN第九届广东大中专学生科技学术节----首届广东大学生金融建模大赛8平空:平滑化后价格上穿上一时刻的标准差区间上限,同开多。交易的示意图如图二,其中分段横向的直线(红色)是任意时刻对应的“最后一个极值”.图2交易策略示意图4.2改进策略的设计由于上述模型并不能判断趋势何时结束,不能很好地止赢,而且当趋势判断错误时并没有相应的方法控制止损,不能很好地止损。因此我们可以引进一些策略实现止赢、止损,从而对风险进行控制。4.2.1基于模型的平仓策略开多时,记录当时标准差区间下限,当价格低于这个数值,采取平多。开空时,记录当时标准差区间上限,当价格低于这个数值,采取平空。[注]:由于“最后极值”的不断更新,因此标准差区间在不断移动,4.1.2的平仓策略是上穿或下穿当前的极值,与开仓策略一致,而这里的平仓策略是记录开仓时的那个标准差区间的上下限,两个时刻对应的标准差区间是不同的。4.2.2基于止损率的平仓策略若当次交易亏损超过一定阈值,强行平仓。4.2.3基于资金回撤的平仓策略第九届广东大中专学生科技学术节----首届广东大学生金融建模大赛9设定一个回撤阈值,但是由于资金变动是按原始价格序列计算的,而我们买卖策略是基于光滑化的价格序列,因此,我们按光滑化后的价格序列计算一人“仿回撤率”,当回撤超过一定的阈值,则平仓。4.3一个交易策略的细节假设平滑后的价格:tttPPP12,则1tP是极小值,但却在t时刻才被发现。因此,极值的发现是滞后了1个时刻的(低频数据即滞后了1分钟)。若不考虑1分钟滞后:(开多)若考虑1分钟滞后:(开多)两者之间最重要的区别在于:当前时刻的价格是否纳入标准差的计算范围。举一个例子分析两者不同带来的影响:由于标准差对偏大、偏小的数据都比较敏感,当价格快速变化时(例如快速上涨),如果把当前时刻的价格纳入计算,标准差跟随价格快速变化,一定程度延缓开仓动作。如果标准差区间是不变的,这种延缓影响当然不大,但是,一般当价格快速上升都会很快伴随一定的调整而产生极大值,在延缓的两三分钟,很可能产生了新的极值,使得当初的“最后的极值点”就变成了新产生的极大值,使得标准差区间中心点向上移动了,价格线一直在标准差区间中上涨,无法突破,从而减少盈利。而且,当我们决定t时刻的“行为”,更习惯的做法是由过去信息确定的买卖信号,考虑t时刻的指标是否这个信号,而不会将当前t时刻纳入用于确定信号的信息集中。五模型参数量化投资的模型参数是重要的内容。关于参数之间的关联与搭配、参数合理范围、参数的优化与过优化问题都是重要的探讨内容。因此,这里单独列作一章说明。5.1模型参数汇总①为核回归的时间窗口1)1(12tStdptEtPNtStdptEtPN2
本文标题:论文参考模板
链接地址:https://www.777doc.com/doc-2020371 .html