您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 能源与动力工程 > 核聚类方法与寻找A股行业轮动的核
核聚类方法与寻找A股行业轮动的核分析师焦健SAC执业证书编号:S0980210040012金融工程研究2010,成都内容目录行业轮动方法的综述比较1核聚类方法的介绍与应用2寻找A股行业轮动的两个核3轮动效果与模型稳定性检验4后续研究:从恒星到行星和流星5从美林投资时钟到国信投资时钟美林投资时钟强调大类资产之间的轮动,而国信投资时钟强调资本市场中具有各类资产相似属性的行业之间的轮动。宏观经济数据的滞后性及真实性、股市行业轮动的频度与经济周期轮动速率的不匹配,都可能影响最终的轮动效果。穷举切分下的市场周期非周期轮动对沪深300超过50万种切分,周期非周期分类轮动超额收益面积排名第一排名一类行业名称平均超额收益差切换次数1采掘,金融,交运,金属非金属,房地产0.03455378.002采掘,金融,木材家具,交运,金属非金属,房地产0.03447785.793采掘,金融,交运,电气水,金属非金属,房地产0.03442888.404采掘,金融,交运,社会服务,金属非金属,房地产0.03431390.495采掘,金融,木材家具,交运,社会服务,金属非金属,房地产0.03424192.586采掘,金融,交运,传播文化产,金属非金属,房地产0.03423993.557采掘,金融,木材家具,交运,传播文化,金属非金属,房地产0.03416194.588采掘,金融,交运,金属非金属,造纸印刷,房地产0.03409495.399采掘,金融,交运,金属非金属,制造业,房地产0.03403697.0910采掘,金融,木材家具,交运,金属非金属,造纸印刷,房地产0.03401796.52伪轮动还是过度拟合?多元线性方法使用LOGIT模型,将是否切换的0与1事件转换为多元线性方程:通过历史数据对多个因子进行线性拟合,得到轮动的预测方程式。期望用简单多元线性模型对轮动进行左侧的预判,无法摆脱“看图说话”-“海选因子”-“刷参数”的三部曲,美好的效果基本都停留在样本内。在多因子轮动预测中,建议使用CART决策树方法而非线性/非线性拟合。相对强弱RS模型结合技术分析指标两资产相对强弱(relativestrength)方法上世纪90年代提出后,受到广泛应用,在国内资本市场的实证中,也出现了多种变形:RS1=ln(A价格)-ln(B价格)RS2=ln(A累积收益率)-ln(B累积收益率)RS3(GSRS)=ln(1+A累积收益率)-ln(1+B累积收益率)对生成的RS序列,通过技术分析指标,寻找趋势和拐点,进行轮动。常用技术指标:均线、MACD、布林线、KDJ尽管有多种“变形”,我们必须强调相对强弱方法的某些基本特性。内容目录行业轮动方法的综述比较1核聚类方法的介绍与应用2寻找A股行业轮动的两个核3轮动效果与模型稳定性检验4后续研究:从恒星到行星和流星5传统的聚类分析方法变量之间的聚类即R型聚类,常用相似系数衡量变量间的亲疏关系。样本之间的聚类即Q型聚类,常用空间距离衡量样本间的亲疏关系。对距离的定义,必须满足以下条件:成立;和对一切都成立;和对一切的成立;当且仅当成立;和对一切的jijiji0ji0kjikijjiijijijddddddd常用的距离衡量方法:欧式距离、杰式距离、兰式距离、马氏距离、斜交空间距离核聚类的关键在从确定到不确定在聚类方法中,没有所谓核样本的概念。Chaudhurid在1997年《Anovelmultiseednonhierarchicaldataclusteringtechnique》中提到多中心最小生成树的概念,进行聚类。与中心聚类不同,我们这里提出的是一种以空间中某些已知具有强特性或强区分度的样本作为核,根据其他点与核样本的距离亲疏程度,化繁为简,进行快速分类的方法。在对样本空间X进行研究时,若X内样本性质未知,而Y空间样本性质已知,则可采用灰色预测的方法;若X内部分样本性质已知,则无需引入其他的样本,可直接用核聚类方法。核聚类应用:不确定概念分类问题提出:如何用量化的方法,构建新兴产业投资股票池?传统解决方案:用统计方法对主营业务收入、财务报表、公司公告等进行筛选核聚类解决方案:我们已知某些行业中的某些股票Xi,一定是新兴产业的代表。我们已知某些行业中的某些股票Yi,一定不是新兴产业范畴。分别以Xi和Yi作为样本空间中的核,计算空间其他点的亲疏距离。快速排除大部分样本后,保留的样本,则可能具有潜在的目标属性。其他应用:行业指数上涨的噪音分析,行业内部的细分与归因。内容目录行业轮动方法的综述比较1核聚类方法的介绍与应用2寻找A股行业轮动的两个核3轮动效果与模型稳定性检验4后续研究:从恒星到行星和流星5行业轮动中核的判定因素基于前述核聚类的思想,我们希望找到两个轮动效果最为明显的行业,作为观察A股行业轮动的核或称恒星,进而挖掘出围绕着恒星运动的行星,最后处理与核行业关系不稳定的流星,或本身质量极高却起着破坏星系轮动效果的“黑洞”。对于核行业选取,我们从质量(行业流通权重)、距离(欧式空间距离)、区分度(与其他行业距离的分歧)和经济含义(具有鲜明的区别)出发。从欧氏距离矩阵中寻找核金融和地产,尤其是金融是行业空间中的另类,距离所有行业都很远。医药生物的区分度最高,可作为一个固定的核,与其距离最远的是采掘。核行业累计收益率差的动量反转特性2005-2010不同采样期/持有期收益相关性统计2000-2010不同采样期/持有期收益相关性统计长期看,3个月以内采样均呈现动量效果,而5个月以上基本体现为反转。05年以来该特征尤其是反转特征更加明显,且动量有效的采样期在缩短。内容目录行业轮动方法的综述比较1核聚类方法的介绍与应用2寻找A股行业轮动的两个核3轮动效果与模型稳定性检验4后续研究:从恒星到行星和流星5医药、采掘行业的轮动规则我们无法证明最完美的轮动方法,因此把精力放在了寻找最远的核。对于收益差异极大的资产,我们倾向选用最简单的“追逐动量法”。追逐动量法:对于收益率序列差异极大的资产A和B,其相对收益应体现为动量效应。我们无法预测其动量效应的持续周期,因此会随时根据市况进行切换。以周为单位,观察过去若干周A与B的收益情况,并选择买入强的一方。对收益的度量有:区间累积收益、区间平均收益、指数移动加权收益。不可避免的,这是一个对采样期参数依赖的策略。我们希望通过医药和采掘自身极强的差异,来弥补对外围参数的依赖。这也是我们首先寻找两个核进行轮动的原因。三个月动量驱动下的医药采掘轮动轮动组合的绩效观测轮动组合的绩效分解轮动组合的绩效分解轮动组合超额收益对采样期的依赖2005-2010不同采样期轮动超额收益的比较2000-2010不同采样期轮动超额收益的比较从参数检验结果来看,三个月(12周)作为采样期进行动量追逐轮动的策略效果较好,且该结果适用于历史上几乎任意阶段。采样期指数移动加权未能提升轮动效果对采样期各周收益率序列进行指数移动加权处理,未能提升轮动效果。与GSRS+经典参数MACD轮动的比较在大多数年份中,医药VS采掘的追逐动量轮动跑赢了经典参数GSRS策略。内容目录行业轮动方法的综述比较1核聚类方法的介绍与应用2寻找A股行业轮动的两个核3轮动效果与模型稳定性检验4后续研究:从恒星到行星和流星5从区分度的角度,衡量恒星周围的行星确定了两颗恒星以后,我们试图将剩下的行业逐个添加进这个体系。定义一个行业k对于两个核行业i、j的区分度为它到两个核所在星系内所有行业的平均距离的差异性:其中指得是到第i个核行业及其行星行业的距离的均值。我们选出剩余未分类行业中区分度最大者,加入到某一个核的周围。再对剩余未分类行业重新计算区分度,以此类推。_ikmeandist从区分度的角度,衡量恒星周围的行星在轮动体系中增加新的行业,不会增加轮动收益,反而均造成收益的快速下降。小行业间同质化严重,而占沪深300指数权重最高的几个行业则呈现出显著的特异性。在下一步的研究中,我们有必要对这些特异性的行业进行单独分析。_ikmeandist分析师焦健E-mail:jiaojian1@guosen.com.cnSAC执业证书编号:S0980210040012
本文标题:核聚类方法与寻找A股行业轮动的核
链接地址:https://www.777doc.com/doc-6313062 .html