摘要:随着网络的普及,网络呼叫出行已成为国人出行首选。中国人口众多,高频出行给车辆合理调度带来了难题。滴滴出行占据了网络呼叫出行市场,平台每天产生大量数据,这些出行数据有着巨大价值,要确保高频出行的车辆均衡运输需要解决供需预测问题。供需预测就是精确预测出给定区域在将来某时间段的出行需求量及需求满足量。目前对滴滴出行数据的供需预测分析尚处于起步阶段。本文提出基于集成学习的滴滴出行供需预测方法。首先根据特定区域某时间段的订单数据,通过数据探索的方法进行特征选择,然后采用五种个体学习器训练模型,最后通过组合策略对模型进行集成,从而做出最终预测。通过在滴滴出行真实数据上的实验结果表明,集成学习器的效果好于单个个体学习器效果。
该论文有图13幅,表3个,参考文献27篇。
关键词:集成学习 特征选择 滴滴出行 供需预测
目录
摘要
Abstract
1 绪论-1
1.1 研究背景-1
1.2 研究的目的与意义-1
1.2.1 研究目的-1
1.2.2 研究意义-2
1.3 国内外研究现状-2
1.3.1 集成学习研究现状-2
1.3.2 滴滴出行供需预测研究现状-3
1.4 论文的主要研究内容-4
1.5 论文的组织结构-5
2 相关介绍与理论概述-6
2.1 滴滴出行供需预测问题介绍-6
2.2 集成学习方法-6
2.2.1 Boosting方法-6
2.2.2 Bagging方法-7
2.2.3 Stacking方法-8
2.3 特征选择方法-8
2.4 本章小结-9
3 基于集成学习的供需预测分析-10
3.1 基于集成学习的供需预测分析流程-10
3.2 特征选择-11
3.2.1时间片与供需差值-11
3.2.2起始地与供需差值-11
3.2.3订单数与供需差值-12
3.2.4价格与供需差值-12
3.2.5 特征字段说明-13
3.2.6 组合特征-13
3.3 个体学习器-14
3.3.1 Ridge-14
3.3.2 Bagging-15
3.3.3 GBDT-15
3.4.4 Adaboost-16
3.4.5 Random Forest-17
3.5 集成学习器-17
3.6 本章小结-17
4 基于集成学习的供需预测的代码实现-18
4.1 特征选择-18
4.2 建模与优化-19
4.2.1 训练模型-19
4.2.2 优化训练模型-22
4.2.3 交叉验证-23
4.3 本章小结-23
5 实验与分析-24
5.1 评价指标-24
5.2 结果分析-24
5.2.1 个体学习器训练结果-24
5.2.2 集成学习器训练结果-24
5.3 本章小结-25
6 总结与展望-26
6.1 总结-26
6.2 展望-26
参考文献-27
致谢-29