摘要:2016年称为机器学习,人工智能的拉开序幕的一年,而2017年则被誉为是大数据转为商业化和产品化应用的一年。大数据让机器学习变得更加智慧,可以对很多事物进行预测。与此同时,世界头号运动的足球一直备受关注。足球彩票有着悠久的历史,多样的玩法,且中奖率高于其他彩票,备受广大彩民的喜爱。
实验采用的语言是当下十分流行的 python语言,运用了 python里的 numpy, sklearn, pandas模块,对数据集进行了读取,再数据集进行了划分,划分为训练集和测试集,接着用线性回归算法、决策树算法和随机森林算法构建了三个分类器,实现了对足彩比赛赔率的预测。
论文主要介绍了预测程序设计的主要流程,以及线性回归算法、决策树算法和随机森林算法分类器的构建,主要的编码,和实验后的误差分析,以及三种分类器的比较。
关键词:大数据、机器学习、足彩、预测、python
目录
摘要
Abstract
第1章-绪论-1
1.1-研究背景-1
1.1.1-大数据的背景-1
1.1.2-足球彩票的时代背景-2
1.2-研究的意义-2
1.3-毕业设计所完成工作-2
1.4-本文组织结构-4
第2章-机器学习与数据处理-5
2.1机器学习的介绍- 5
2.1.1机器学习背景-5
2.1.2为什么可以用于足彩赔率预测-5
2.2-数据集介绍-5
2.2.1-数据集背景-5
2.2.2-基本数据-6
2.3-数据清洗-8
2.4-读取数据-8
2.4.1-CSV逗号分隔符-8
2.4.2-Pandas库-8
2.5-小结-8
第3章-分类模型-9
3.1-分类问题综述-9
3.2 sklearn模块-9
3.3划分训练集和测试集-9
3.4构造分类器-9
3.4.1线性回归分类器-10
3.4.2决策树分类器-11
3.4.3随机森林分类器-11
第4章-实验及测试-13
4.1实验环境-13
4.2足彩的玩法-13
4.3误差分析-13
4.3.1选用MSE均方误差-13
4.3.2-线性回归算法的赔率预测结果-13
4.3.3-决策树算法的赔率预测结果-14
4.3.4随机森林算法的赔率预测结果-15
4.4结论-16
第5章-总结-17
参考文献-18
致 谢-19