摘要:本文对聚类方法进行了综述,系统的解释了聚类的几个典型的方法。其中适合小规模数据的划分法,典型方法为K-means法,并找出这种方法的缺点,对此进行一下优化;“自上而下”的分解性层次聚类法和“自下而上”的聚结性层次聚类法,层次法的典型算法为CURE算法,CURE算法在孤点处理上比较良好,解决了相似大小和偏好球形问题,但对带状数据处理不满意;DBSCAN算法是经典的基于密度的聚类算法,可以发现随意大小和形状的簇,而且具有一定的去噪声能力,可是当簇之间的密度有比较大的变化时,给DBSCAN算法设置合适的参数是比较困难的;模糊聚类法比较具有代表性的是FCM法,对此方法进行了介绍和改进;智能算法介绍了粒子群聚类法,突破了传统聚类法的瓶颈;高维数据法的主成分分析法是一种无监督降维广泛使用的统计方法,在这里我们证明了对于k - means聚类来说主成分是解决离散集群成员的连续指标。
关键词:聚类方法;K-means法;层次法;优化;主成分分析
目录
摘要
Abstract
1 引言-1
2 聚类的几种方法-1
2.1 划分聚类法-1
2.1.1 划分聚类法介绍-1
2.1.2 K-means算法的根本理念-2
2.1.3K-means缺点-3
2.1.4优化初始聚类中心的K-means算法-3
2.1.5结论-3
2.1.6进行改进的Kmeans算法简介-4
2.2 层次聚类法-4
2.2.1 层次聚类法的介绍-4
2.2.2 CURE算法介绍-4
2.2.3CURE算法思想和步骤-5
2.3 密度聚类法-6
2.3.1 密度聚类法介绍-6
2.3.2 DBSCAN介绍-6
2.3.3OS-DBSCAN算法-7
2.4 模糊聚类法-7
2.4.1 模糊聚类法简介-7
2.4.2 FCM简介-8
2.4.3 FCM算法改进-8
2.4.4 结论-9
2.5 智能聚类法-9
2.5.1 粒子群聚类算法(粒子群优化算法介绍)-9
2.5.2 基本粒子群聚类算法-10
2.5.3 粒子群聚类研究现状-11
2.6 高维数据算法-12
2.6.1 高维数据算法介绍-12
2.6.2 主成份分析与K均值聚类-12
结论-19
参 考 文 献-20
致谢-22