您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > 聚类分析在股票投资分析中的应用
聚类分析在股票投资分析中的应用摘要:在证券投资中,投资者必须对股票进行基本面分析以减少投资风险。而当我们进行分析时,会遇到多个指标,且每个指标意义不同,有时很难进行决策,采用聚类分析可以帮助我们解决这一问题。关键词:聚类分析;统计分析;证券投资0.引言中国股市随着经济的迅速发展壮大是有目共睹的,随着中国的股市逐步走向完善,走向规范化,价格及其内在价值回归是未来股市发展的重要方向。股票的档次将不断拉开,成长率高的绩优股会越来越受到投资者的追捧。过去那种高投机、高市盈率、价格严重偏离其价值的现象将逐步纠正。理智的股票投资者,将会更加重视上市公司的经营业绩,重视股票自身的品质,即重视投资对象的选择。运用聚类分析模型能帮助投资者准确地了解和把握股票的总体特征,确定投资范围,并通过类的总体价格水平来预测股票价格的变动趋势,选择有利的投资时机。首先,聚类分析是建立在基础分析之上的,立足于对股票基本层面的量化分析,弥补了基础分析对影响股票价格的因素大多是定性分析的不足。作为理性的长期投资的参考依据,其目的在于从股票基本特征决定的内在价值中发掘股票真正的投资价值。其次,与现代投资组合理论相比,聚类分析法显得直观、实用,而且在应用时所受的局限小,操作性强,有一定的优越性,适合于广大投资者采用。聚类分析建立的是一种长期投资的理念,因此在我国证券市场走向成熟的过程中,提倡运用这种理性的投资分析方法,可以降低投资风险,规范投资行为。1聚类分析方法1.1聚类分析的含义聚类分析是一种新兴的多元统计方法,是当代分类学与多元分析的结合。聚类分析是将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类。通俗的讲,聚类分析就是根据事物彼此不同的属性进行辨认,将具有相似属性的事物聚为一类,使得同一类的事物具有高度的相似性。在实际研究中,既可以对样本个体进行聚类,也可以对研究变量进行聚类,对样本个体进行聚类通常称为Q型聚类,对研究变量进行的聚类称为R型聚类。在市场研究中,Q型聚类常用于市场细分研究,寻找不同目标市场及其构成者特征,R型聚类可以用于确定产品各属性的同质性。聚类分析的方法很多,常用的有系统聚类、动态聚类。动态聚类的原理是先对分类事物作一个初始的粗糙的分类,然后在根据某种原则对初始分类进行修改,直至分类被认为比较合理为止。系统聚类除了要定义事物之间的亲疏程度指标,还要定义类与类之间亲疏程度指标并且要导出求取类间亲疏指标值的递推公式。系统聚类初始,先把所有待分类事物各自看成独立的一类,求出两两之间的亲疏指标值,把关系最为亲密的两类合并成一个新类,然后计算新类与原有各类之间的亲疏指标值,再把其中关系最为密切的两类合并,如此反复进行,直到最终所有待分类事物合并成一个大类为止。最终绘成一幅系统聚类的谱系图,再根据一定的原则确定最终分类结果。1.2定义距离设有n个样品,p个指标,每个样品都有这p个指标的观察值,设第i个样品的第j个指标的观察值为ijx,把n个样品看成p维空间中的n个点,则两个样品间亲疏程度可用P维空间中两点的距离来度量。令ijd表示样品ix与jx的距离。定义距离公式,本文采用明氏距离。明氏(Minkowski)距离:qpkqjkikijxxqd11][)(当q=1时,明氏距离变为绝对距离:pkjkikijxxd1)1(当q=2时,明氏距离变为欧氏距离:2112][)2(nkjkikijxxd当q时,明氏距离变为切比雪夫距离:pkjkikijxxd1)1(设ijx表示第i种股票第j个指标的值。ijd表示第i种股票与第j种股票的距离,我们定义距离越近表示两种股票的性质越接近,可以归为一类。1.3聚类分析步骤聚类分析的职能是建立一种分类方法,它是将一批样品或变量,按照他们在性质上的亲疏程度进行分类。凡是具有数值特征的变量和样品都可以采用系统聚类方法,选择不同的距离和聚类方法可以获得满意的数值分类效果。聚类分析法是把个体逐个的合并成一些子集,直至整个总体都在一个集合之内为止。其分类步骤如下:1.3.1聚类前先对数据进行变换处理1.3.2聚类分析处理的开始是各样品自成一类(n个样品一共有n类),计算各样品之间的距离,并将距离最近的两个样品并成一类。1.3.3选择并计算类与类之间的距离,并将距离最近的两类合并,如果类的个数大于1,则继续并类,直至所有样品归为一类为止。1.3.4最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。2.应用实例本文选取了江西省35家上市企业去除因停牌等原因2家,选取33家上市企业,根据2014年年度报告中的数据和信息,选取每股收益,每股净资产,净资产收益率,每股资本公积金4项财务指标,采用系统聚类方法对这些公司股票进行了分析,将它们进行分类,为股票的分析和选择提供决策依据。数据见附录,资料来源上市公司中期报告(同花顺)。2.1指标聚类分析利用SPSS2.0软件,通过计算机的运算,聚类分析结果,将上市公司主要分为三类。第一类:恒大高新;洪都航空;仁和药业;联创光电;赣能股份;博雅生物;洪城水业;江中药业;九鼎投资;赣粤高速;章源钨业;昌九生化;凤凰光学;新钢股份;富祥股份;正邦科技第二类:赣锋锂业;华伍股份;中文传媒;三川股份;泰豪科技;万年青;黑猫股份;诚志股份;江西铜业;安源煤业第三类:世龙实业;三鑫医疗;煌上煌;华意压缩;江西长运;方大特钢;江铃汽车通过聚类分析我们得到:第一类上市公司经营业绩一般长期投资者很难获利,几乎无投资价值,应该规避这样的公司,但是江西省这样的公司比例最大,数量最多。其中二类每股收益,每股净资产以及净资产收益率较高,说明这类公司经营良好,业绩优良具有较高的投资价值,在资本市场中,机构和基金偏爱这样的投资品种。第三类上市公司具有较高的获利能力和较强的资本累计能力,属于成长型最快的潜力股,是投资的最佳选择。2.2聚类谱系图聚类谱系图直观地显示了聚类的过程,从图上可以清楚的看出各种股票的归属。根据选择距离的不同我们可以根据图形对股票进行新的分类,另外根据聚类谱系图可以清晰地看出每一种股票的原始分类及其聚类过程,从中我们可以了解各种股票的亲疏关系程度。参考文献[1]管宇.实用多元统计分析.浙江大学出版社[M],2011.[2]于秀林,任雪.松多元统计分折[M].北京:中国统计出版社,1999.[3]方开泰,实用多元统计分析[M].上海:华东师范大学出版社,1989.[4]卢纹岱,spssforwindows统计分析[M].北京:电子工业出版社,2000.[5]陶冶,马健.基于聚类分析和判别分析方法的股票投资分析,财经理论与实践,2005(10)45-48.[6]王君博,杨义群,聚类分析在证券投资中的分析.商业研究.[7]狄明明,孙德山.聚类分析和支持向量机在股票研究中的应用,计算机技术与发展,2008(7):181-246.[8]冯伟,孙德山.聚类分析在金融投资分析中的应用.辽宁师范大学学报.2008(3)43-45.附录:江西省上市公司及2014年年报财务信息序号股票名称股票代码每股收益每股净资产净资产收益率每股资本公积金1赣锋锂业SZ0024600.21.051.590.072华伍股份SZ3000950.372.9412.560.773中文传媒SH6003730.112.165.130.524三川股份SZ3000660.122.325.220.185恒大高新SZ0025910.093.552.671.516世龙实业SZ0027480.965.1318.772.077三鑫医疗SZ3004530.536.77.884.148洪都航空SH6003160.043.281.352.259仁和药业SZ0006500.022.830.771.4110泰豪科技SH6005900.232.2910.050.811联创光电SH6003630.053.041.511.8112赣能股份SZ0008990.364.198.612.2413博雅生物SZ3002940.12.613.961.1614煌上煌SZ0026950.693.718.61.4615洪城水业SH6004610.114.92.163.1716江中药业SH6007500.244.255.642.1217九鼎投资SH6000530.162.825.711.1318华意压缩SZ0004040.874.2620.490.8419万年青SZ0007890.131.1810.660.2220黑猫股份SZ0020680.32.4212.220.7621诚志股份SZ0009900.333.2810.140.5322赣粤高速SH6002690.032.311.281.6823章源钨业SZ0023780.073.61.971.9324江西长运SH6005610.63.4217.531.0425江西铜业SH6003620.122.44.920.8226昌九生化SH6002280.033.420.772.2727方大特钢SH6005070.562.9419.110.7728安源煤业SH6003970.342.3214.630.9429江铃汽车SZ0005500.644.3214.931.2330凤凰光学SH6000710.073.142.280.8831新钢股份SH6007820.253.187.81.4832富祥股份SZ3004970.113.463.111.3233正邦科技SZ0021570.053.921.252.38
本文标题:聚类分析在股票投资分析中的应用
链接地址:https://www.777doc.com/doc-5853690 .html