您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 投融资/租赁 > 量化投资-用机器学习寻找Alpha
用机器寻找Alphaxinhua.sun@datayes.com目录•量化投资的基本概念–什么是Alpha?•机器学习在资产管理中应用•SignalWeighting–Lasso/RidgeRegressionvs.OLS–AdaBoost量化投资•定性投资和量化投资在投资理念上没有本质上的区别,只是投资方法不同•定性投资:–偏艺术–深入研究–少而精•定量投资:–偏科学–发掘市场规律–广度•用统计规律和数学模型来指导投资,本质是定性投资的数量化实践对冲基金常用量化策略常用的量化策略收敛性套利市场中性Alpha事件驱动统计套利多空策略CTA风险+Alpha假设任何有价证券的超额收益都来自于以下模型:r=a+brb那么ra=r–rb=a+brb-rb=a-(1-b)rb其中a=主动收益的选股部分(b-1)rb=主动收益的基准择时部分Alpha的解释•Alpha(a)指的是投资回报中来自投资经理选股的一部分,而不是来自于基准表现•Alpha也指“剩余收益”•如果我们规定b=1,则禁止标的指数择时,Alpha就是主动收益(传统做多投资目标)•如果将基准设定等于某一计价单位(例如:美元),那么alpha=主动回报=超额收益和投资经理资产配置(对冲基金投资目标)市场中性Alpha•国内常用的市场中性策略做法:构建一个股票组合(多因子模型)放空一个指数(沪深300,中证500……)风险收益来源于股票组合相对于指数的表现,与指数本身的表现无关多因子模型•A股市场由于散户的参与量大,价格与价值往往偏差较大,因此A股市场非常适合运用多因子模型来挖掘股票投资的价值股票因子定价模型单个因子分析因子之间的优化•依据国外学术界和业界多年研究发明的股票定价多因子模型•已经在海外市场被广泛应用并得到充分验证•A股市场非常适合运用多因子模型来挖掘股票投资价值•以基本面为导向的估值因子•以技术分析为导向的股票走势技术因子•以及其他风格因子•综合多维度因子:综合考量单因子贡献度,以及因子之间的相关性/互补性常见因子池基本面•市净率•市盈率•企业估值倍数•企业负债率•等等技术•动量趋势•价格反转•流动性•波动率•等等其他风格•规模•成长•分析师•等等机器学习•基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称为统计机器学习机器学习在投资中的应用•信息处理–公告阅读–关联关系–主题发现–情感分析•策略研究–事件研究–动态多因子•财富管理–机器人理财–资产配置机器学习&策略研究•寻找新的因子–探索新的数据源(特别是信噪比高的数据)•因子配权SignalWeighting–固定权重•经验和主观偏好•稳定,对极端值不敏感•抓不住短期风格变化–动态多因子•对于短期风格变化敏感•对于极端值敏感SignalWeighting•假设我们已经有了多个不同风格因子的集合,如何确定因子在模型中的权重(因子收益率)•固定权重–根据经验–Grinold(2010)•OLS&Lasso&RidgeRegression•AdaBoost•SVM•RandomForest•…OLS&Lasso&RidgeRegression•多因子策略–固定权重•稳定,对极端值不敏感•抓不住短期风格变化–回归法OLS•对于短期风格变化敏感•对于极端值敏感•𝑦𝑤,𝑥=𝑤0+𝑤1𝑥1+𝑤2𝑥2+⋯+𝑤𝑝𝑥𝑝•min𝑤𝑋𝑤−𝑦22OLS的问题•对于min𝑤𝑋𝑤−𝑦22,其解析解为–𝑤=(𝑋𝑇𝑋)−1𝑋𝑇𝑦–𝑋𝑇𝑋Almostsingular•X的轻微扰动造成𝑤的巨大变化•不合理–加入正则项RidgeRegression&Lasso•RidgeRegression–优化目标:•min𝑤𝑋𝑤−𝑦22+𝛼𝑤22其中𝛼≥0•Lasso–优化目标:•min𝑤1𝑛𝑠𝑎𝑚𝑝𝑙𝑒𝑠𝑋𝑤−𝑦22+𝛼𝑤1ModelselectioninLasso•Lasso算出来的w很多项是0•参数估计和选择一并完成AdaBoost简介•监督学习、分类问题•弱分类器比强分类器容易•Boosting方法–从弱学习算法出发,反复学习,得到一系列弱分类器,然后组合这些弱分类器,构成一个强分类器•WhyAdaBoost–模型机制与原理清晰–模型参数少,参数敏感度低–每一轮如何改变训练数据的权值或概率分布–如何将弱分类器组合成一个强分类器AdaBoost算法流程训练样本弱分类器权重调整强分类器因子数据标准化按收益率区分强势弱势股权重初始化为等权重计算因子区分度选择区分度最优的因子降低分类正确的股票权重提高分类正确的股票权重合并所有的弱分类器示例来源:浅谈AdaBoost算法细节处理•训练样本集–数据准备:•以横截面上因子去极值+行业内标准化之后的值为输入•按收益率排序,前后30%分别记为±1,其余为噪声•组合构建–行业中性–行业按照市值权重加权AdaBoost动态多因子算法流程风格可测性回测结果参考资料•[1]李航.《统计学习方法》2012.3•[2]兴业证券.聪明的Alpha,机器觉醒!•[3]Grinold&N.Kahn《ActivePortfolioManagement》•ThankstoElecQuantTeam!Copyright©2016DataYes.Allrightsreserved●保密文件,请勿外泄谢谢!
本文标题:量化投资-用机器学习寻找Alpha
链接地址:https://www.777doc.com/doc-1437342 .html