1. 中央财经大学信息学院 北京 100081
2. 上海浦东发展银行昆明分行 昆明 650000
[ "海沫,女,博士,中央财经大学信息学院副教授,CCF高级会员,主要研究领域为分布式系统、大数据处理和分析。" ]
[ "牛怡晗,女,就职于上海浦东发展银行昆明分行,主要研究领域为大数据分析。" ]
[ "张悦今,女,中央财经大学信息学院讲师,主要研究领域为数据挖掘及其应用、知识管理、互联网金融。" ]
网络首发:2015-11,
纸质出版:2015-11-20
移动端阅览
海沫, 牛怡晗, 张悦今. 面向大数据的并行聚类算法在股票板块划分中的应用[J]. 大数据, 2015,1(4):1-9.
Mo Hai, Yihan Niu, Yuejin Zhang. Application of Parallel Clustering Algorithms for Big Data in the Division of Stock[J]. BIG DATA RESEARCH, 2015, 1(4): 1-9.
海沫, 牛怡晗, 张悦今. 面向大数据的并行聚类算法在股票板块划分中的应用[J]. 大数据, 2015,1(4):1-9. DOI: 10.11959/j.issn.2096-0271.2015036.
Mo Hai, Yihan Niu, Yuejin Zhang. Application of Parallel Clustering Algorithms for Big Data in the Division of Stock[J]. BIG DATA RESEARCH, 2015, 1(4): 1-9. DOI: 10.11959/j.issn.2096-0271.2015036.
上市公司的经营业绩在一定程度上反映股票的投资价值,因此以反映上市公司盈利能力、偿债能力、成长能力、资产管理质量及股东获利能力5个方面共15项财务指标作为股票投资价值的衡量指标,首次尝试使用面向大数据的并行聚类算法Mahout中的K-means聚类算法和模糊K-means聚类算法对中国A股市场约2 600支股票依据其财务指标进行聚类,以便进行股票板块的划分,并比较两种算法在不同距离度量方式下的迭代次数、执行时间、聚类间密度和聚类内密度。实验结果表明,谷本距离度量方式下的K-means算法聚类效果最好,因此可将该实验结果作为最终股票板块划分结果进行分析,从而为投资决策提供参考。
For the operating performance of listed corporations reflects the value of stock investment to a certain extent
financial index reflecting the operating performance of listed corporations was taken as the evaluation index of stock investment value
and for the first time the parallel clustering algorithms for big data both K-means and fuzzy K-means of Mahout were used to cluster nearly 2 600 stock of China’s A shares market according to their financial index
afterwards the clustering results of these two algorithms under different distance metrics were compared.Experimental results show that the clustering quality of K-means algorithm adopting Tanimoto distance metric is the best.Therefore
this result can be used as the final result of the division of stock
which can provide a reference for the investment decision.
周鑫 . 我国股票市场板块效应实证研究(硕士学位论文) . 成都: 西南交通大学 , 2012
Zhou X . Empirical research on plate effect of Chinese stock market (master dissertation) . Chengdu: Southwest Jiaotong University , 2012
周焯华 , 陈文南 , 张宗益 . 聚类分析在证券投资中的应用 . 重庆大学学报 ( 自然科学版 ), 2002 , 25 ( 7 ): 122 ~ 126
Zhou Z H , Chen W N , Zhang Z Y . Application of cluster analysis in stock investment . Journal of Chongqing University ( Natural Science Edition ), 2002 , 25 ( 7 ): 122 ~ 126
劳兰珺 , 邵玉敏 . 中国股票市场行业收益率序列动态聚类分析 . 财经研究 , 2004 , 30 ( 11 ): 75 ~ 82
Lao L J , Shao Y M . Dynamic clustering analysis of return series of industrial indexes in Chinese stock market . Journal of Finance and Economics , 2004 , 30 ( 11 ): 75 ~ 82
李云飞 , 李鹏雁 . 基于模糊聚类技术的股票投资价值评价指标选择 . 燕山大学学报 , 2008 , 32 ( 6 ): 551 ~ 556
Li Y F , Li P Y . Evaluation indexes selection of stocks’ investment value based on fuzzy clustering . Journal of Yanshan University , 2008 , 32 ( 6 ): 551 ~ 556
孙磊平 . 数据挖掘方法在股票分析中的应用与研究(硕士学位论文) . 成都: 西南财经大学 , 2013
Sun L P . The application and research of data mining in stock analysis (master dissertation) . Chengdu: Southwestern University of Finance and Economics , 2013
邓秀勤 . 聚类分析在股票市场板块分析中的应用 . 数理统计与管理 , 1999 , 18 ( 5 ): 1 ~ 4
Deng X Q . Application of cluster analysis in stock market board analysis . Journal of Applied of Statistics and Management , 1999 , 18 ( 5 ): 1 ~ 4
杨富勇 . 数据挖掘技术在股票投资中的应用(硕士学位论文) . 长沙: 湖南大学 , 2010
Yang F Y . Application of data mining in stock investment (master dissertation) . Changsha: Hunan University , 2010
张传琦 . 基于蚁群聚类算法的股票板块分类研究(硕士学位论文) . 上海: 复旦大学 , 2012
Zhang C Q . Research on Stock plate classification based on ant colony clustering algorithm (master dissertation) . Shanghai: Fudan University , 2012
Owen S , Anile R , Dunning T , et al . Mahout in Action . Greenwich: Manning Publications Co , 2012
0
浏览量
586
下载量
0
CSCD
关联资源
相关文章
相关作者
相关机构
京公网安备11010802024621