摘要:随着数据挖掘技术的不断发展成熟以及人们对股票投资意识的不断提高,数据挖掘技术应用在股票市场已成为一种趋势。海量的历史交易数据背后隐藏着潜在的价值和联系,可以指导投资,实现收益的最大化。本文采用的挖掘技术有聚类分析、分类预测、时间序列、关联规则。首先利用聚类分析技术对750只股票进行定性分类。接着基于分类预测,利用决策树对各项财务指标进行分析,提供具体量化的选股意见。然后利用时间序列技术对中国平安的历史交易数据进行分析预测,为投资者提供单只股票的未来走势情况。最后,利用关联规则挖掘技术对所选股票进行关联分析,挖掘其内在的联系,指导投资者进行投资组合。
关键词:股票投资组合;数据挖掘;聚类分析;决策树;时间序列;关联规则
目录
摘要
Abstract
1 引 言-1
1.1 研究背景与目的-1
1.2 研究意义-1
1.3 研究思路-2
1.4 创新之处-2
2 文献综述-2
2.1 股票市场相关理论方法-2
2.1.1 主流的股票市场分析方法-2
2.1.2 股票投资组合管理-3
2.2 国内外数据挖掘研究现状-3
2.2.1 国外研究现状-3
2.2.2 国内研究现状-3
3 数据挖掘概述-4
3.1 数据挖掘方法论-4
3.2 模型简述-5
3.2.1 聚类分析-5
3.2.2 决策树模型-5
3.2.3 ARIMA模型-6
3.2.4 关联规则-6
4 数据挖掘过程-6
4.1 聚类分析的研究应用-6
4.1.1 数据的选取-6
4.1.2 数据读入-7
4.1.3 数据审核-8
4.1.4 聚类过程-9
4.1.5 聚类结果分析-10
4.2 分类预测的研究应用-13
4.2.1 数据的选取-13
4.2.2 数据质量分析-13
4.2.3 CHAID模型实现过程-14
4.2.4 CHAID模型结果分析-14
4.3 时间序列分析预测的研究应用-18
4.3.1 数据的选取-18
4.3.2 ARIMA模型的实现过程-18
4.3.3 ARIMA模型结果分析-22
4.4 关联规则的研究应用-23
4.4.1 数据的选取与预处理-23
4.4.2 关联规则分析实现过程-24
4.4.3 Apriori模型运行结果分析-26
5 总结与展望-27
5.1 结论与评价-27
5.2 不足和展望-28
参考文献-29
附录A 股票名单-30
附录B 财务指标及说明-42