您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > 大学生数学建模竞赛-沪深300股指波动分析
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):日期:2013年_08_月19日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):1沪深300指数的波动分析摘要本文对沪深300指数的波动方式进行了简单的分类,依据不同的分类基准用了两种分类方法进行分类,探讨了其波动方式,并根据已有的历史数据,对股指的走势做出短期预测和长期预测,并且还建立了股指交易模型,并对模型进行了深入的分析。针对问题一,基于两种分类基准,对问题一采取了两种不同的处理方式。第一种处理方式是以每五天为分析对象,即排除了非工作日的影响,运用MATLAB软件做出各种变量指标的曲线图,根据曲线图,对变量做出适当的分类,进而考察每个分类的具体变化规律;第二种处理方式是采取动态聚类法,由SAS软件得出分类的形式,再对所得的结论进行总结。综合两种分类处理方式,发现两种方式都是将股指波动规律分为4类,且第一类方法分得的时间段是连续的,第二类方法分得的时间段是离散的。针对问题二,从两个角度对股指走势做出预测,即分别从短期和长期的角度对问题进行分析。显然,经过分析计算,发现,若对原始数据直接进行线性回归分析,得出的理论值与实际值误差较大,故采取这种方法是明显不合理的,所以,对所有的变量都进行对数处理,再用处理之后的变量进行回归分析。对短期预测而言,发现只要进行直接的线性回归即可求解,并且得到的理论值与实际值相差不大;对长期预测而言,发现直接的线性回归模型误差较大,且其协方差数据相差不大,所以考虑采用主成分回归分析法,经显著性检验,此模型的误差较小,在几天时间内,预测效果还是比较好的。针对问题三,为了构建一个简单的交易模型,使得两年内的收益最大,考虑当天的投资意愿受前天日收益率的影响,将每天的收益量化为每天股指买卖的数量等相关变量的对应关系,将两年内的所有天数的收益加总,便可得到两年内的最大收益,因此建立了适合本问题的0-1规划交易模型。针对问题四,另外建立了保守投资者的股指交易模型,点出了模型三的缺陷,因为模型三考虑的只是冒险投资者的投资行为,对大部分投资者而言显然是不合理的。故通过对比分析冒险投资者的股指交易模型和保守投资者的交易模型,从而评估模型三的优劣性。关键字:动态聚类全对数处理主成分回归显著性检验0-1规划模型2一、问题重述沪深300指数(ShanghaiShenzhen300StockIndex)于2005年4月8日时由中证指数有限公司编制而成,包括了上海和深圳证券交易所上300只具代表性的A股,占两个股票交易所70%的市值。沪深300指数的基准日为2004年12月31日,并以1000点作为指数的起点。指数以调整股本加权法计算。沪深300指数也是沪深300股指期货的标的物,此股指期货交易于中国金融期货交易所。沪深300股指期货实行T+0的交易规则,具有投机交易双向获利的功能,有关我国股指期货的交易知识可参见网上相关介绍。由于沪深300股指期货是以沪深300指数为标进行结算的,因而股指期货的波动与沪深300指数的波动具有高度的相关性。附件中的数据文件给出了我国2011年8月1日至2013年8月2日若2年的沪深300指数每5分钟的基本数据,请以这些数据为基础,建立数学模型回答下列问题:1通过数据分析,对沪深300指数的波动方式进行简单的分类,你的分类应该有利于后续问题的解答。波动方式可以是日内短期波动规律,也可以是以天为单位的波动规律,可自由设定;2根据前面已有的历史数据,对指数后期的走势做出预测,并和实际数据相比较确定你的预测方法的优劣。这里既可以是短期的日内预测,也可以是长期走势的预测。例如:你可以根据2012年7月24日10点55分以前的数据,对当日10点55分至11点20分的走势做出预测;3设沪深300指数每点是300元,交易手续费是交易额的万分之一(双向收取),保证金为交易额的10%,初始资金为20万。请利用前面已经得到的相关结果,建立交易模型,使在二年内的收益最大。注意:不能使用未来数据,如你在2012年7月24日10点55分是进行“买入指数”还是“卖出指数”或者是不交易的决策时,你不能利用2012年7月24日10点55分以后的任何数据;4试分析确定合理的评价指标体系,用以评价你的交易模型的优劣。二、问题分析2.1问题一分析问题一要求通过数据分析,对沪深300指数的波动方式进行简单的分类。通过对所有数据以天数为单位的整合,发现,可以从两个角度对其股指波动方式进行分类,即以每个星期为分析对象,对其走势图进行连续性的分类分析,或以3天数为分析对象,对其波动方式进行离散性的聚类分析。对于第一类分类方式,先分别做出股票K线图,成交量折线图,收益折线图,最高上涨波动率折线图,最低下跌波动折线图,经过对比比较并进行统计结果的简单描述,得到简单的分类方法;对于第二类分类方式,先整理数据,并用动态聚类法进行分类,得出其分类的每一类别的规律,再进行总结。最后,依据每个分类方法的分类基准,并对每一基准的数据进行统计描述,得知每一分析段的波动规律并评价两种分类方式的异同。2.2问题二分析问题二要求根据前面已有的历史数据,对指数后期的走势做出预测,并和实际数据相比较确定你的预测方法的优劣。针对问题二,为了对指数后期的走势做出误差较小的预测,分别采用短期指数预测和长期指数与预测两种方式,并对每一种模型的预测效果进行检验。当然,本文中,针对大量的数据,考虑短期预测以分钟为分析对象,长期预测以天为分析对象。不管是短期预测与长期预测,用简单的线性回归模型进行分析,经过计算,发现预测效果不明显,理论值与实际值对比的部分数值偏差较大,说明模型有较大的缺陷,数据对模型的拟合效果影响较大,为了减少大量数据的随机误差以及缩小变量数据的弹性,考虑对其所有变量进行全对数处理,并将对数化之后的变量进行回归分析,发现预测效果较好,误差较小,故采用对数处理的处理方式,最后再用SAS软件对其模型进行检验。2.3问题三分析问题三要求建立一个股票交易模型,使在两年内的收益最大。显然,影响股指交易的因素是很多的,且构建模型的角度也是多方面的,为了简化分析,只简单的从日收益率的角度对此问题进行分析,,忽略投资者心理因素,市场内部因素,基本面因素,政策因素等其他因素对模型的影响,并在一定的误差允许范围内构建一个简单的交易模型,最后对其做分析。在此说明,当天的交易由前天的日收益率决定,虽然沪深股指交易实行的是T+0交易规则,但此模型只考虑前天日收益率对当天日收益率的影响,得出的模型和按照T+1的交易方式得出的模型基本无异。最后再在此模型的基础上用问题一的分类方式进行两年内的投资预测分析,评估投资的平均收益和风险。2.4问题四分析通过分析,我们发现问题三中的模型其实是针对冒险投资者来建立的,对大部分人群而言,显然都不是风险投资型人物。所以,我们还要建立起保守派投资者的交易模型,故要先给定一个含参变量k,用于区分冒险投资者和保守投资者的投资模式,建立起适合保守投资者的股指交易模型,以此来评价问题三中的模型的优劣性。三、模型假设1.假设题目中所给的数据为原始数据;2.假设所选取得股票具有代表性;3.假设股指当天的交易取决于前天的日收益率;4.假设股民都是理性人,依据最大收益原则进行投资5.假设问题三中的模型只考虑冒险派。4四、定义与符号说明五、模型的建立与求解5.1模型的建立与分析5.2.1以每个星期,即每五天的走势进行分析在过对沪深300指数两年内的波动分析中,我们得出了一些隐藏在数字背后的规律,据此,我们有如下的分析方式。首先,整理出两年中485天的股票K线图,因为只做走势分析,故没对图形进行差异性的颜色处理,结果如图1-1所示。(注,图1-2,图1-3,图1-4,图155都可由附录1中的代码用MATLAB得出。)Profit表示问题一中的日收益率tldv表示问题一中的最低下跌率thdv表示问题一中的最高上涨率X表示分析问题二中的短期开盘价Y表示分析问题二中的短期收盘价和长期当天开盘价X1表示问题二中的长期前天开盘价X2表示问题二中的长期前天收盘价Ai表示第i天收盘时投资者手中的持仓量Bi表示第i天若进行买入交易,则交易的股票指数为iBCi表示第i天若进行卖出交易,则交易的股票指数为iCHi表示为一个随着收益率变化而变化的量,只取0和1数值Li表示为一个随着收益率变化而变化的量,只取0和1数值Fi表示投资者第i天进行买卖交易后所剩交易资金Ri表示当天收盘时当天的收益率M表示投资者的初始交易资金20万TR表示两年内的投资收益总和5图1-1由图1-1,可以发现,在2011年8月到2013年8月两年的时间内,股票的走势总体呈缓慢下跌态势,中间有部分时间呈上涨趋势,但未对整体下跌形势造成影响,为做进一步上涨和下跌分析并据此进行分类分析,我们用MATLAB分别做出成交量折线图,收益折线图,最高上涨波动率折线图,最低下跌波动折线图,分别如下图1-2,图1-3,图1-4,图1-5所示,为使数据更具代表性和使折线图更加美观和减少对数据的处理,我们以5天为单位做横坐由图2可以看出沪深300成交量折线图大致地处于3条水平线附近波动,分别为y=1.5*106、y=2.5*106和y=3*106,其中从整体观察,整个折现图是围绕y=2.5*106此线上下波动的,其波动范围与波动幅度都有很大的局部差异,所以,再做出收益折线图,如图1-3所示。图1-26图1-3通过观察图3,可以发现,沪深300的收益折线图的波动同样具有局部的差异性,据此可以通过分析总结得到,沪深300指数的分布可以分为4类,结合图4最高上涨波动率折线图,图5最低下跌波动折线图,我们对分类的情况做进一步的分析:图1-47图1-5分析:综合以上结果,可以收益率为分类依据,对时间跨度进行连续性分类,分类结果如下。表1-1其中,第一类为0-32,第二类分类为32-44,第三类分类为44-86,第四类分类为86-97.(注:分类以五天为依据,并且星期六和星期日是工作的)。分析:由上表可以看出,第一类与第四类都是方差较大的类型,且其方差分别为1299.956和1339.508,但是查原始数据得出,第四类方差大的原因是存在极少数较小数值的拖动,致使第四类方差大,而第一类方差大的原因是原始数据的波动范围大,为-89.369-113.033,涨跌幅度也大,为-3.317%-4.8149%,所以第一类可分为收益波动较大类型。继续观察可以看出,第二类较第一类是属于方差较小类型,根据其变化范围,涨跌幅度都可以看出其属于变化范围小的类型,故第二类可分为收益波动较小类型。由表1并结合图3和图4,可以分析得到,处在这一类的沪深300指数的涨幅,上涨波动率,和变化的上限都是属于相对较大的类型,具体表现为其最大涨幅4.9086%为四类中最高,最大上涨波动率0.0492远高于其他三类,变化上限110.229也是相对较高,均值2.62545是四类中最高的,所以我们有理由说,第三类是属于大波动上涨型。类似的,从第四类的收益分类结果变化范围日成交量范围最大涨幅最大跌幅均值方差最大上涨波动率最大下跌波动率0-32(
本文标题:大学生数学建模竞赛-沪深300股指波动分析
链接地址:https://www.777doc.com/doc-5649491 .html