您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > 股票风险投资与趋势预测
股票风险投资与趋势预测作者:汤志高【摘要】本文在大盘指数高速增长趋势下,运用多元逐步回归、RBF神经网络等方法对股市预测、风险期货投资进行了多角度研究分析。第一问,通过绘出历年大会期间和全年指数K线图,从横向(每年大会期间)、整体统计指数的K线特征。最后通过K线种类频度直方图(5.2)直观分析,得出大会与股市走势之间的关系(5.2图示分析)。问题二,首先运用了多元逐步回归讨论各指标与指数的相关性,通过相关系数和F、s、R2统计量确定了2个变量的回归方程,并求出了回归系数(6.1.2);然后对指标数据特征分析,对非线性较强的时间序列股票数据采用了前向型RBF径向机神经网络进行预测,得出变量一(成交量)较优,变量二(成交金额)不理想的结果,原因见(6.2.2);最后通过变量的变换改进得到模型3把变量二改为平均成交金额,得出最终回归系数,预测得到了a股后30个交易日的变化指数,并绘制了K线走势分析图。问题三,通过问题2的预测模型与逐步回归模型预测,得到缺失的大会期间b股近似数据,然后以最大化满足第一问分析的大会期间数据特征为目标,建立非线性规划模型Lingo软件求解,得到最终达到满足大会期间特征的预测数据见7.3。问题四,第一步是在第二问的模型下,结合第三问补齐的数据,预测出b股后21个交易日指数。然后对可卖出期货的范围内进创建分段积平均概率函数p(x),利用p(x),建立以总概率收益最大为目标的0-1混合规划模型,利用Matlb顺序搜索求解,得到应买b股,并且在第20天时抛出的方案,具体见8.3。关键字:K线图前向型RBF神经网络股市预测多元线性逐步回归1问题重述1.1问题背景自2005年6月6日最低跌破1000点后,上证综合指数不断攀升并屡创新高,中国股市再次成为世人瞩目的焦点,而股指期货将在何时正式推出则更是焦点的中心。所给出的数据为指数A和指数B从2000年1月4日至2007年5月10日的日交易数据,其中指数B的数据因故缺失2007年3月5日至2007年3月16日共10个交易日的数据。1.2问题提出[1]请利用所给出的数据检验说明每年全国人民代表大会和全国政协会议的召开是否会对此段时间内指数的变化趋势有显著的影响?[2]数据中给出了指数A每个交易日的各项交易指标,请讨论现有的这些指标对指数今后走势的影响,并建立模型对接下来30个交易日内的指数走势进行预测。要求在保证预测效果的前提下,对交易指标进行筛选,尽量减少模型变量。[3]请根据1和2中的讨论,试将指数B中的缺失数据补齐。[4]假定以指数A或指数B为标的的股指期货合约已经在5月10日正式挂牌交易,1份股指期货合约的价格=标的指数点数×100元,无交易费用。现有一位风险投资者手中有一笔资金投资于股指期货,并希望在1个月之后收回以作它用。该投资者在5月10日以指数收盘点数买入一份6月8日到期的股指期货合约。若至合约期满,他所能获得的利润为:(到期日指数收盘点数-合约期初指数收盘点数)×100元。同时为控制风险,当在某日收盘后,合约价值损失累计达到或超过15%时,他便会选择在次日以此价格将合约卖出(假定一定可以卖出),且此后剩余时间内不再继续进行投资。那么为了在1个月内获取最大的收益,该投资者应选择买入以指数A为标的的期货合约还是买入以指数B为标的的期货合约?2问题分析(略)3模型假设[1]股票指数能准确反映股票价格变化;[2]假设开盘指数与前日收盘指数无较大差别;[3]进行股票期货投资时,必须在合约期满前卖出;[4]股票预测期间无对股市有重大影响的突发事件发生。4K线图简介4.1何为K线图目前对股票市场的分析与预测主要采用K线图。K线图又称阴阳炷图。阳烛表示该时段中收盘指数高于开盘指数,阴烛表示收盘指数低于开盘指数,烛顶和烛底反映该时段中的最高、最低指数。根据开盘指数、收盘指数、最高指数以及最低指数之间的不同情况,阴线阳线会呈不同的形态。其记录方法如下:阳线:收盘指数高于开盘指数时,收盘指数在上开盘指数在下,二者之间的长方柱用红色绘出,其上影线的最高点为最高指数,下影线的最低点为最低指数。阴线:开盘指数高于收盘指数时,开盘指数在上收盘指数在下,二者之间的长方柱用蓝色绘出,其上影线的最高点为最高指数,下影线的最低点为最低指数。4.2K线图分类根据开盘指数与收盘指数的波动范围,可将K线分为极阴、极阳,小阴、小阳,中阴、中阳和大阴、大阳等8种线型。各类烛体形状如下图所示:极阴线、极阳线小阴线、小阳线中阴线、中阳线大阴线、大阳线波动范围0~0.5%0.5~1.5%1.5~3.5%≥3.6%5问题一模型的建立与求解本问要求通过历史数据研究每年全国人民代表大会和全国政协会议的召开是否会对此段时间内股票指数的变化趋势有显著的影响。5.0模型准备——分类函数的确定由于最高指数及最低指数存在极大偶然性,所以对分类的影响不大,对日K线的分类主要从烛体大小考虑。由此,以波动程度来对K线进行分类,一天内的波动程度可表示为开盘、收盘指数的差值相对于两指数较大值的大小。以K表示开盘指数,S表示收盘指数,则分类函数可表示如下:KSFMaxKS−=(,)FFFFFFFF∈−∈∈−−∈∈−∈∈−∞−∈∞-11-22-33-44(0.5%,0)(0,0.5%)(1.5%,0.5%)(0.5%,1.5%)(3.5%,01.5%)(1.5%,3.5%)(,3.5%)(3.5%,)极阴线极阳线小阴线小阳线中阴线中阳线大阴线大阳线5.1模型的分析与建立两会召开对股票指数的变化趋势的影响主要反映在:开会期间各种类型K线图出现的频率相对其他时间是否有较大变化。基于此,需分别计算全年与两会期间各类型的出现频率。5.1.1全年各类型K线出现频度计算由题中已知数据可得指数A和指数B从2000年1月4日至2007年5月10日股市各交易日(周一到周五)的开盘、收盘、最高、最低指数。以AjK、BjK分别表示指数A、指数B第j天的开盘指数,AjS、BjS分别表示指数A、指数B第j天的收盘指数,则代入分类函数可得股市第j天的指数A、指数B的K线类别:AAjjAijAAjjKSFMaxKS−=(,)BBjjBijBBjjKSFMaxKS−=(,)ij==(1,2,...,81,2,...,1764)以Aif、Bif分别表示全年指数A和指数B第i类K线出现频度,则:AAiijjfF==∑17641BBiijjfF==∑17641i=(1,2,...,8)5.1.2两会期间各类型K线出现频度计算采用与前面相同的思路,仅对两会期间数据进行类似计算,那麽首先需要将会议期间的K线筛选出来,定义两个一维行向量a、b表示各年会议开始的时间及结束的时间,则有题中数据可统计得到:a=(35,274,513,754,993,1238,1479,1721)b=(42,282,520,763,1000,1244,1485,1733)以Aif′、Bif′分别表示两会期间指数A和指数B第i类K线出现频度,则:iibAAiijjafF=′=∑iibBBiijjafF==∑i=(1,2,...,8)5.2模型的计算首先,将各年全年、大会期间K线走势图通过Matlab编程绘出(程序附录10.3):200400600800100012001000200030002000a指数,K线线200400600800100012001500200025002001a指数,K线线200400600800100012001000150020002002a指数,K线线200400600800100012001000150020002003a指数,K线线200400600800100012001000200030002004a指数,K线线200400600800100012001000150020002005a指数,K线线200400600800100012001000200030002006a指数,K线线200400600800100012002000400060002007a指数,K线线200400600800100012001500160017002000a指数,K线线200400600800100012002100220023002001a指数,K线线200400600800100012001600180020002002a指数,K线线200400600800100012001500160017002003a指数,K线线200400600800100012001900200021002004a指数,K线线200400600800100012001550160016502005a指数,K线线200400600800100012001300135014002006a指数,K线线20040060080010001200300035002007a指数,K线线然后,将上述2幅K线图数据代入K线分类模型中,通过SPASS软件统计,绘出频度直方图如下:图一图二图示分析:两会召开对大盘涨跌情况影响由图一可见近8年股市阴线、阳线基本各占一半,说明股市大盘总体涨跌平衡,而图二中阳线总数明显大于阴线,说明股市大盘在两会期间较平时有上涨趋势。两会召开对各类型K线出现频度影响由图一可见日K线主要以极阴线、极阳线为主;少数大阴线、大阳线,且各类K线呈类似正态分布。由图二可得两会期间股市K线以极阳线、小阳线为主,无大阴线、大阳线,且各类K线分布较均匀,说明两会期间股市相对较稳定。两会召开对大盘涨跌幅度影响两图有一明显区别为图二无大阴线、大阳线,说明两会期间股市无爆涨或暴跌,较平时涨幅相对稳定。6问题二模型的建立与求解本问要求根据题中数据,讨论指标对指数今后走势的影响,对接下来30个交易日的指数走势进行预测,并在保证预测效果的前提下对交易指标进行筛选,尽量减少模型变量。基于此,本问共建立了以下两模型:模型Ⅰ:删减模型变量的逐步回归模型模型Ⅱ:预测指标走势的神经网络模型模型Ⅲ:预测指数走势的改进型逐步回归模型6.1删减模型变量的逐步回归模型(模型Ⅰ)6.1.1模型Ⅰ的分析与建立基于问题要求,首先分析指标对指数走势的影响因素,由题中可得:成交量指数影响因素成交金额换手率上面三个影响因素对于指数走势的影响的显著水平不同,我们希望从中挑选出影响显著的自变量来建立回归模型,“逐步回归”是一种从众多变量中有效的选择重要变量的方法。逐步回归简介:逐步回归是实现变量选择的一种方法,基本思路为先确定一个初始子集,然后每次从子集外影响显著的变量中引入一个对y影响最大的,再对原来子集中的变量进行检测,从变得不显著的变量中剔除一个影响最小的,直到不能引入和剔除为止。此时子集中包含的量即为对因变量影响显著的影响因子。从而在保证预测效果下减少了模型变量。变量选择标准:若候选的自变量集合为{}mSxxx12=,,...,,从中选出一个子集SS∈1,设S1中有l个自变量lm=(1,2,...,),由S1和因变量y构成的回归模型的误差平方和为Q,则模型的剩余标准差的平方Qsnl=−−21,n为数据样本容量。所选子集S1应使s尽量小,通常回归模型中包含的自变量越多,误差平方和Q越小,但若模型中包含有对y影响很小的变量,那末Q不会由于包含这些变量在内而减少多少,却因l的增加可能使s反而增大,同时这些对y影响不显著的变量也会影响模型的稳定性,因此可将剩余标准差s最小作为衡量变量选择的一个数量标准。在逐步回归分析中,自变量mxxxx=12(,,...,)是影响因变量y的主要因素,是人们能控制或能观察的,而y还受到随机因素的干扰,可以合理地假设这种干扰服从零均值的正态分布。以xxx123,,分别表示影响指数的因素:成交量、成交金额、换手率,以βββ123,,分别表示三个影响因素的影响系数,以iy表示第i个指数,则可建立逐步回归模型:iyxxxNββββεεσ=++++01122332~(0,)i=.........(1,2,3,4)6.1.2模型Ⅰ的求解运用逐步回归的方法,根据各统计量的大小剔除影响不显著
本文标题:股票风险投资与趋势预测
链接地址:https://www.777doc.com/doc-1155333 .html