摘 要:本文就样本中的异常数据提出了诊断方法和处理方法,并结合实例说明了简单回归中上述方法的具体应用.
关键词: 异常值,回归分析,诊断 ,残差,虚拟变量
对调查得到的大量原始数据进行加工处理,提取其中有用的信息,即统计整理,是进一步进行统计分析的前提.但是通常的统计整理方法往往都对样本数据有一个前提假设,即样本数据是来自同一个总体,而这个假设有时却不能成立.原因一是由客观因素造成的,如总体条件的突然变化或人们未知的某个因素的突然出现等等;二是由主观方面的因素造成的,即人为的差错如调查人员读错或抄错数据,不小心把另一些不同条件下的样本数据混杂进来.当样本中的个别数据明显的偏离样本中其余数据时,这些数据可能是来自不同的总体,我们称这样的数据为异常数据.若对混有异常数据的样本按常规进行统计整理、分析和推断,往往会得出不符合实际的结论.本文就样本中的异常数据提出了诊断方法和处理方法,并结合实例说明了简单回归中上述方法的具体应用.
目录
摘要
Abstract
1 引言 4
2 异常值的概念 4
3 异常值的诊断方法 5
3.1 F分布检验法 5
3.2 残差及残差检验异常值 7
4 异常值处理的两种方法 7
4.1采用虚拟变量消除差异值的方法 7
4.2剔除异常值的方法 8
5 实例分析 9
5.1 实例一 9
5.2 实例二 12
6 结论 16
参考文献 17
致谢 18
附录1:spss处理实例1数据 19
附录2:spss处理实例2数据 21