摘要:随着数字化时代的发展,互联网及大数据作为代表正带领着人们开启了一个全新的数据时代。互联网的高速发展,也带动着互联网金融。而在互联网金融产品中,微贷借款依靠其服务对象的特殊性,被认为是风险最高的领域,于是便需要通过数据挖掘技术来分析申请借款用户的信用状况,以分析用户是否将会逾期还款。
本文研究了基于融360公司的借款数据的用户人品预测的方法。该方法首先对融360公司的数据进行了预处理,对用户的特征进行分析,包括用户的年龄,性别,经济状况等,然后构建模型。再将数据其分成训练集和测试集,在训练集上进行模拟训练,而后在测试集上测试模型拟合效果,从而构建了用户人品预测研究的模型,并且采用了xgboost和svm机器学习算法实现了对该方法的研究,为微贷公司降低风险提供了保障。
关键词:数据挖掘;微贷借款;机器学习;用户人品
目录
摘要
Abstract
1绪论-1
1.1研究背景及意义-1
1.2国内外研究现状-1
1.3本文主要研究内容-2
2相关技术-3
2.1数据挖掘-3
2.1.1数据挖掘简介-3
2.1.2数据挖掘的流程-3
2.2信用评估与数据挖掘的关系-4
2.3本章小结-4
3特征工程-6
3.1排序特征-6
3.2特征离散-6
3.3计数特征-6
3.4类别特征处理-7
3.5交叉特征-7
3.6特征选择-7
3.7本章小结-8
4数据分析与模型构建-9
4.1数据分析-9
4.1.1数据来源-9
4.1.2数据分析-9
4.1.3数据预处理-10
4.2模型构建-13
4.2.1算法准备-13
4.2.2单模型-13
4.2.3组合特征模型-14
4.2.4半监督学习-16
4.3本章小结-16
5结果分析-17
5.1实验结果-17
5.2本章小节-18
参考文献-20
附录A-21
致谢-23