摘 要:在聚类算法中,基于模糊划分的模糊C-均值(FCM)算法是一种重要的算法.FCM算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小.它有深厚的数学基础和完善的理论,但是它还存在一些不足之处.
本文针对传统FCM算法结果中在模糊边界上存在部分模糊点划分错误的问题,提出了一种对模糊点的二次聚类新算法.在FCM算法结果中,根据隶属度较高的清晰点,定义一种新的基于清晰半径的相似性距离,对模糊点的隶属度进行二次计算.新方法以各类中的数据分布特征为依据,对模糊点和清晰点,分别采用不同的相似性距离计算隶属度,从而能够重新确定模糊点的类别归属.这种改进算法的特点就是定义了新的清晰半径,使得对模糊点的隶属度分类更加清晰.与FCM算法的实验结果比较发现,这种方法能提高聚类的精确度,有效纠正分类错误,提高模糊点的精度,在密度差异较大的数据集上具有一定的应用潜力.
关键词:模糊聚类;模糊点;相似性距离;清晰半径;二次聚类
目录
摘要
Abstract
第1章 绪论-1
1.1 背景及意义-1
1.2 基本框架-3
第2章 基于清晰半径的模糊点二次聚类算法-5
2.1 模糊C均值聚类算法-5
2.2 基于清晰半径的模糊点二次聚类算法-5
2.3 改进FCM算法公式推导-6
第3章 程序设计-9
3.1 改进算法的步骤-9
3.2 编程思路及代码实现-9
第4章 实验结果分析-11
4.1聚类结果-11
4.2隶属度的调整分析-11
第5章 结论与展望-15
5.1 结论-15
5.2 不足之处及未来展望-15
参考文献-17
致 谢-19