摘要:近些年来随着信息化的不断深入,人们的生活中需要获取更多的数据。因此一时间数据挖掘成为信息产业界的热门话题,聚类分析是数据挖掘的基础,也是一种自学习、自适应的过程,聚类的最终目标是在没有给定任何有关知识的条件下,将各种不同的数据聚集成不同的类别。本文给出了一种基于遗传算法的聚类分析方法。采用浮点数数据的编码方式对聚类的中心进行编码,并且通过选择、交叉和变异等操作对聚类中心的编码进行优化,使得到聚类划分效果最好的聚类中心。
遗传算法是一种依据生物自然进化的模式来寻找最优解的方法,有效的利用全局搜索信息和其中的隐含并行性是它的主要优点。因此,基于遗传算法来研究聚类问题,有效的互补了聚类问题中的局部寻优能力,从而更好的解决聚类问题。本文主要工作包括:
介绍了聚类分析的概念,常见的聚类方法以及遗传算法的基本概念、研究现状等,并进行了相应的分析。
采用了基于聚类中心的浮点编码方式,对遗传算法的基本要素的设计进行了理论的分析与公式推导,对聚类数目K值确定做了相应研究,使得聚类算法具有更普遍的意义。
关键字:遗传算法;适应度函数;聚类分析;自然进化
目录
摘要
ABSTRACT
1.1 课题研究背景以及意义-1
1.2 本文研究的主要内容及安排-1
2 聚类分析-2
2.1 聚类分析的基本概念-2
2.2 聚类准则函数-2
2.2.1 类间距离准则-2
2.2.2 类间距离准则-3
2.3 常见的三种聚类方法-4
2.3.1 近邻聚类法-4
2.3.2 层次聚类法-4
2.3.3 动态聚类算法-5
3 遗传算法-7
3.1 遗传算法的基本原理-7
3.2 遗传算法的基本术语-7
3.3 遗传算法的特点-8
3.4 遗传算法的描述及流程-8
4 遗传算法的matlab实现-10
4.1 算法基本流程-10
4.2 参数的设置-10
4.3 编码的方法-11
4.4 种群的初始化-11
4.5 适应度函数的设计-11
4.6 选择操作-11
4.7 交叉操作-12
4.8 变异操作-13
5 仿真实验-14
5.1 实验环境-14
5.2 实验数据-14
5.3 实验结果和实验分析-15
6 总结与展望-19
6.1 总结-19
6.2 展望-19
致谢-21
参考文献-22