摘要:本文以西安房价为研究对象,使用西安市六个城区共计2240条数据,从而对西安市单位面积房价进行分析评价。首先对原始数据进行清洗筛选,删去一些无关数据,其次对指标数据做描述性统计分析,得到条形图和箱尾图,并比较各个区域的指标差异,然后通过多元线性回归模型对所有相关影响因素建模,深入了解个因素对单位面积房价的影响,最后对各变量进行主成分分析。通过对数据统计分析探究房屋面积、卧室数、厅数、学区房、临近地铁等相关因素对西安房价的影响作用,从而挖掘出影响西安房价的最主要因素,为即将准备买房的客户提供参考。
该论文有图9幅,表2个,参考文献16篇。
关键词: 箱线图 主成分分析 多元线性回归
目录
摘要
Abstract
1 绪论1
1.1选题背景及研究的目的和意义1
1.2国内研究现状-1
1.3主要研究内容-2
2 数据介绍与处理-2
2.1 数据来源和样本量3
2.2数据清洗 -3
3描述性分析3
3.1描述性统计理论知识4
3.2描述性统计分析处理4
4模型的建立8
4.1多元线性回归模型-8
4.1.1多元线性回归模型理论知识-8
4.1.2多元线性回归模型的建立9
4.1.3简单线性模型的诊断-10
5主成分分析 -11
5.1主成分分析理论知识11
5.2主成分分析步骤12
5.3影响因素的主成分分析-13
6结论-14
参考文献-15
附录-15
致谢-20