摘要: 在回归分析中,自变量之间如果存在多重共线性,则会出现许多问题,常常会使模型缺乏稳定性,不易判断每个解释变量的单独影响,使模型的误差增加,参数估计受到影响等。
本文在研究回归模型中共线性问题的研究方法的同时,还会列举出解决共线性问题的方法,比如:主成分回归分析、岭回归等方法。本文通过实例来说明各种方法的优劣势,比较各种方法的特点,使之更好地应用于实际问题。本文在已有文献的基础上,对岭回归参数k值进行了说明,还利用spss软件对每个方法分别输出。
通过实例可看出,处理多重共线性问题时,要注意对特殊点的分析和其对数据的影响。岭回归和主成分回归方法都各有优势,但不管用哪种方法,都要结合实际来分析。
关键词:回归模型;多重共线性;主成分回归;岭回归
目录
摘要
Abstract
1背景-1
2线性回归模型的简介-2
2.1线性回归模型的简介-2
2.1.1线性回归模型的原理-2
2.1.2回归系数的估计-2
2.1.3显著性检验-2
3处理多重共线性的几种方法-3
3.1多重共线性的含义及原因-3
3.1.1多重共线性的含义-3
3.1.2多重共线性形成的原因-3
3.1.3多重共线性的影响及危害-4
3.2多重共线性的经验式诊断方法-5
3.3处理多重共线性的经验式方法-5
3.3.1将一些相关的自变量从模型中剔除-5
3.3.2改变解释变量的形式-6
3.3.3增加样本信息量-6
3.4主成分回归分析-6
3.4.1主成分回归分析基本原理-6
3.4.2主成分回归分析的基本思想-6
3.4.3步骤-6
3.5岭回归-7
3.5.1岭回归背景-7
3.5.2岭回归基本原理-7
3.5.3岭参数k的选择方法-7
3.5.4岭回归性质-8
4实例研究及两种方法比较-9
4.1主成分回归-9
4.2岭回归-13
4.3两种方法比较-15
结 论-17
参 考 文 献-18
致 谢-19