摘要:证监会公布的数据显示,2016年年底中国股票市场投资者数量已超过1.18亿,中国股民数量庞大,并存在继续增长的趋势。由于股票市场的尚未完善,股市20多年来的平均投资率回报为负,投资者理性投资股票成为了必然要求。现实中,投资者投资资本有限且股票数量较大,帮助投资者从众多股票中选择出值得投资的股票有重要意义。本文基于国信证券工程师焦健等人提出的六因子量化选股模型及相关国内外研究文献,以股票回报率高于平均值作为是否优秀的标准,适当加入其他变量,生成新的综合性的选股模型指标体系。再使用随机森林算法,构建选股模型,解决选择优质股票的实际问题。最终预测准确率达到了85.02%,说明随机森林方法可以较好的应用在选择股票当中。
关键词:随机森林;决策树;股票投资;数据挖掘
目录
摘要
Abstract
1-绪 论-1
1.1选题背景-1
1.2研究意义-1
1.2.1理论意义-1
1.2.2实际意义-1
1.3写作提纲与研究过程-2
1.3.1写作提纲-2
1.3.2研究过程-2
1.4研究方法-3
1.4.1抽样调查-3
1.4.2决策树-3
1.4.3随机森林-3
2-国内外研究现状-4
2.1国外研究现状-4
2.2国内研究现状-4
2.3拟创新之处-5
3-模型构建-6
3.1决策树-6
3.1.1信息熵与信息增益-6
3.1.2信息增益率-7
3.1.3集成学习与Bagging-7
3.2随机森林-8
4-实证检验分析-9
4.1样本及变量确定-9
4.2股票收益概况-10
4.3结论与分析-12
4.3.1模型结果-12
4.3.2模型对比-14
4.3.3结论及分析-14
5-建议与展望-15
5.1建议-15
5.2不足与展望-16
参考文献-18
致 谢-19
附 录A-20