您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > 通过回归分析预测股票走势
龙源期刊网通过回归分析预测股票走势作者:杨雨彤来源:《全国流通经济》2019年第07期摘要:股票是一种用来募集资金的有价证券,对个人、集体、国家,以及社会的影响日渐增大,所以寻找一种有效的投资方法,成为了所有投资者的目标。本文运用多因素模型,有效市场假说,线性回归模型等方式分析对于股票的波动性产生影响的因素。通过研究不同因素对股票的波动趋势的影响强弱来寻找低价买入、高价抛出的机会,以求收益最大化。文中以Google为例,因为美国市场历史悠久,趋于稳定,更加接近于半强型市场,所以从多家美国本土上市公司中,选择了著名网络公司Google为实验对象。经过对于2012年~2018年的数据统计,整理出上百组数据并进行研究,用spss等工具进行进一步探究,然后从中挑选出成果最具有代表性的部分数据放入本文做参考数据。最终利用所得数据分析可知各因素对于股票波动的影响强弱。关键词:有效市场假说;多因素模型;资本资产定价模型;多元线性回归中图分类号:F8309文献识别码:A文章编号:2096-3157(2019)07-0104-04一、前言1研究背景股票是一种用来募集资金的有价证券,随着时代的发展,股票已经成为公民理财的重要方式之一,其在公民收入与支出中所占的比重也不断增大,与此同时也影响着国家、企业、个人的经济状况与环境以及社会和个人的可持续发展。股市中很多因素对于股票的波动性产生影响,因此,寻求一种有效的投资方法,成为了几乎所有投资者的首要目标。当今信息技术日新月异使得数据的大规模增长,许多学者将数据挖掘、机器学习、神经网络应用在股票分析中。揭示事物发展规律变化的内部规律,发现不同事物之间的相互关系,使人们能够正确认识事物和科学决策,已经成为了金融分析领域的重要方法。股票分析分为两种,一种是对于股市总体的评价和预测,这种分析有益于政府制定正确的政策,也有助于企业制定恰当的发展战略。另一种是针对单个股票的涨跌进行预测,其主要目的是为股民提供规避风险的参考。目前,我们接近于一个半强型的市场,半强型市场中分析的作用效果甚微,而内幕消息却可能获得超额利润。比如拼多多出现了假货之后丑闻快速传播,股票在当天就有强烈的波动,龙源期刊网通过对于股票因素的研究可以找到影响股票波动的重要因素,在一定范围内控制其波动,能够有效规避系统性风险与非系统性风险带来的损失。本文的研究控制了平均月活跃人数,股票成交量,标准普尔,密歇根消费者信心指数,核心消费价格指数,失业率等指数,通过分析这些因素对于股票的影响强度,来寻找影响股票走势的重要因素。通过研究最终可以确定成果,而这也有利于个人选股,通过研究股票的波动趋势,寻找低价买入、高价抛出的机会,以求收益最大化。2国内外文献综述国内外许多学者都对波动幅度大的股票的影响因素进行了具体的分析。郝知远(2017)将数据挖掘的手段运用到股票分析中,实现了把握股票的涨跌规律、在眾多股票中选择优质股的难题。最后实现了一个量化选股方法。郑挺国,尚玉皇(2014)基于宏观基本面构建了多因子的广义自回归条件异方差——混频数据抽样(GARCH-MIDAS)模型,并运用该模型对中国股市日度波动率进行估计及预测比较。卢钰(2013)机器学习一直是研究者研究的一个方向,但其中具有非普遍性。为了在小样本量的情况下实现机器学习,VVapnik(1995)等人基于统计学习理论(SLT)的基础上提出了一种新的机器学习算法支持向量机(SupporyVectorMachine,简称SVM)用于数据挖掘。贾云朋(2015)主要研究了数据挖掘在股价曲线的趋势预测。通过对比时间序列法以及马尔可夫预测法,最终发现后者更加适合预测单一股票短期的价格趋势。LeilaBateni(2014)采取了基于人工神经网络的方法,选取2012年~2013年美国纳斯达克的股市数据对模型进行训练并得到了准确的结果。当收盘指数大于3000点时,其预测错误率小于2%。NelsonMainaWweru(2012)采取了基于RBF神经网络的模型对1990年~1999年香港股市进行分析,得到了相比于其他分析方式更为精确的结果,并且实现了对长线、短线的不同预测。通过以上文献综述的研究,可以发现目前对于股票趋势的文章基本上以回归分析为主体拓展为数据挖掘、机器学习、神经网络应用等方面,再细分为数据统计分析、网络数据分析、日常数据分析等为方式进一步构建模型,分析研究。二、研究方法1多因素模型因素模型是建立在证券收益率对各种因素或指数变动具有一定敏感性的假设基础之上的一种模型。主要分为:单因素模型E(Ri)=ai+biE(F)多因素模型Rit=αi+βi1F1t+βi2F2t+εit龙源期刊网单因素模型主要研究一种因素对于股票波动的影响,同理,多因素模型主要研究多种因素对股票波动的影响。在对单只股票波动的影响因素的研究中,主要采用一种特殊的单因素模型:capm模型,E(ri)=rf+βim(E(rm)-rf),又称为资本资产定价模型,它主要研究某一只股票的收益率对于市场的波动的敏感度。本文主要采用了多因素模型,意在找到影响股票波动的重要因素,在一定范围内控制其波动,能够有效规避系统性风险与非系统性风险带来的损失。系统风险是指市场中无法通过分散投资来消除的风险,也被称做为市场风险非系统性风险也被称做为特殊风险,这是属于个别股票的自有风险,投资者可以通过变更股票投资组合来消除。公式中的β,在经济学范畴是一种风险指数,主要用来衡量个别股票或股票基金相对于整个股市的价格波动情况。β系数一般用以度量一种证券或一个投资证券组合相对总体市场的波动性,是一种评估证券系统性风险的工具。2有效市场假说有效市场假说奠基人是一位名叫路易斯·巴舍利耶的法国数学家,他把统计分析的方法应用于股票分析率的分析,发现其波动的数学期望值总是为零。自他以后1964年奥斯本提出了“随机漫步理论”(任何无规则行走者所带的守恒量都各自对应着一个扩散运输定律),尤金·法玛在FinancialAnalystsJournal上发表文章第一次提出有效市场理论,并在1970年对其定义:如果在一个证券市场中,价格完全反映了所有可以获得的信息,那么就称这样的市场为有效市场。有效市场具体分为三个层次:弱形式有效市场,半强形式有效市场和强形式有效市场。弱势有效市场中对从技术方面分析股票价格的方式失去作用,而基本分析仍有可能帮助投资者获得超额利润。这类市场凝聚了所有历史记录的信息所以没有分析的必要。半强行有效市场中利用技术分析和基本分析研究股票价格的方式的都效果甚微,了解内幕消息才可能获得超额利润。简而言之这种市场反映过去信息,也反映所有公布于众的目前信息,所以获得其他额外信息才可以获得厚利。而强行有效市场中没有任何方法能帮助投资者获得超额利润。它包含弱有效和半强有效市场的内容,还包含了内幕信息,投资者只能根据给定的价格作出自己的行为选择。以近期出现多处安全事故而负债千亿的碧桂园为例,因为负面的信息披露,后果及时的反应在了股票价格信息上面,简而言之,有效市场中公布的信息都有效的反应在价格上。反之公布的信息与股票的价格不匹配的便是市场无效。3线性回归模型龙源期刊网在统计学中,线性回归是利用线性回归方程的最小平方函数对一个或多个自变量和因变量之间进行建模的一种回归分析的方法。用来确定变量间相互依赖的定量关系。如果其中只包括一个自变量和一个因变量,而且二者的关系用近似一条直线的模型表示,那么称这种回归分析为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。它的运用十分广泛,表达形式为:y=w’x+ee为误差服从均值为0的正态分布。Y=Y1Y2YnU=u1u2unX=1X11…Xk11X12…Xk21X1n…Xkn=X′1X′2X′nβ=β0β1βkY为因变量;β代表无风险利率,比如一年期国库券;X是本项研究的自变量;U用来调整误差。线性回归是经济学的主要实证工具。例如,它是用来预测消费支出,固定投资支出,存货投资,一国出口产品的购买,进口支出,要求持有流动性资产,劳动力需求、劳动力供给。三、实验过程1搜集数据经济并不是一个简单、统一的实体,它是一个多元化的融合,影响其的因素有很多,所以对于单一股票波动的研究需要从多方面来实践研究得到与现实拟合度最高的实验结果。在本次实验中,笔者从众多影响因素中选择出来了6个最具有影响性和代表性的因素来进行研究:平均月活跃人数,股票成交量,标准普尔,密歇根消费者信心指数,核心消费价格指数,失业率作为实验的自变量。龙源期刊网年的数据作为研究基础,上表仅摘要2012年~2015年中部分数据作为参考。表中明显直观的显示:股票价格自2012年起从每股23705美元的价格不断攀升,始终保持上涨态势,截止到2015年11月股票价格已涨到每股10901美元。再看股票的影响因素中,平均月活跃人数从955为起点不断上涨,截至2015年11月平均月活跃人数上升至155。根据上面的折线统计图可读出股票成交量的涨幅趋势不稳定2012年~2013年中大体趋势上升,而从2013年中~2015年末数值大幅度减小,呈下降趋势。标准普尔,密歇根消費者信心指数,核心消费价格指数的也均呈增长趋势,而失业率持续下降。从图表中我们大体可知,经济在不断增长,社会逐渐趋于稳定。图中的自变量中,(1)平均月活跃人数:股票交易次数,取月平均值。(2)股票成交量:股票买卖双方达成交易的数量,是单边的,用来作为价格形态的确认。(3)标准普尔:是由亨利·瓦纳姆·普尔先生创立于1860年的一所世界权威金融分析机构,它涵盖多个全球及指定国家指数,反映世界各地股票的表现。(4)咨询会消费者信心指数:消费者信心指数是美国密歇根大学率先编制的消费者信心指数,调查研究中心为研究消费需求对于经济周期的影响,而对于消费者个人的收入,生活质量,宏观经济及消费支出等方面进行的调查研究。消费者信心指数是反映消费者对该国经济信心强弱的指标,是综合反映并量化消费者对当前经济形势评价和对经济前景、收入水平、收入预期以及消费心理状态的主观感受,预测经济走势和消费趋向的一个先行指标。主要反映了消费者对股票购买欲望的强烈程度,进一步分析消费者心理的预期分析是否对股票价格有影响。(5)失业率:是资本市场的重要指标,属于滞后指标。失业率的增加可以看出国家经济情况较差,社会经济疲软;而失业率减少,也将造成通货膨胀等问题。所以需要随着社会的发展不断调整,达到一个平衡状态。失业率是可以反映一个国家或地区失业状况,是可以观察社会经济和金融发展程度和状况的一项重要指标。本文使用的因变量的数据来自雅虎财经,采集了Google自2012年上市至2018年5月的每日股票开盘价、收盘价、当日最高价、当日最低价与交易量的数据。本文使用的平均月活人数与净利润的数据来自于Google的每季度财报。本文使用的标准普尔500指数来自于雅虎财经。本文使用的密歇根消费者信心指数的数据来自于东方财富网。本文使用的失业率的数据来自于美国劳工统计局。本文使用的股票成交量的数据来自于东方财富网。2数据分析结果据文调查报告分析可知:月活跃用户人数对股票波动趋势的影响较大,信心指数,标准普尔500指数,营收及贸易账对于股票波动趋势基本没有影响,而从数据可知,失业率对股票波动趋势有重要影响。参考文献:[1]郝知远基于数据挖掘方法的股票预测系统[D].南京理工大学,2017龙源期刊网[2]郑挺国,尚玉皇基于宏观基本面的股市波动度量与预测[J].世界经济,2014,37(12):118~139[3]卢钰基于参数优化的支持向量机股票市场趋势预测[D].浙江工商大学,2013[4]贾云朋数据挖掘在股票曲线趋势预测中的研究
本文标题:通过回归分析预测股票走势
链接地址:https://www.777doc.com/doc-4688652 .html