摘要:在当今科技迅猛发展,各种新颖产品的不断涌现,人们的生活水平得到了很大的提高。然而,在人们的生活品质得到提高的同时,各种各样的疾病也伴随而来。由高血压引起的心脑血管疾病已成为中国人的首位死因。而因高血压所引起的并发症也相继而来。所以,为了分析研究高血压及其并发症之间产生的关联性,我们可以采用数据挖掘中的关联规则理论。
本文采用Apriori关联规则算法针对高血压及其并发症进行采集,生成频集,产生规则。首先介绍了数据挖掘概念,然后对Apriori算法进行介绍。接下来对Apriori关联规则算法的步骤流程进行分析,将高血压与其并发症组成强关联规则。这样就能很清晰的解刨出高血压及其并发症之间所存在的关联性。最终,本文通过Python语言的编程方法得以验证Apriori算法。
关键词:高血压;Apriori;数据挖掘;Python
目录
摘要
Abstract
第一章 绪论-1
1.1课题研究的背景与意义-1
1.2课题研究的内容-1
1.3论文架构-1
第二章 高血压及其并发症和关联规则的分析研究-3
2.1高血压及其并发症的分析介绍-3
2.1.1高血压疾病的研究进展 -3
2.1.2高血压的综述介绍-3
2.2 关联规则的综述分析-4
2.2.1关联规则的介绍-4
2.2.2关联规则的的概念-4
2.3 Apriori关联规则算法过程-5
2.3.1 Apriori算法的介绍-5
2.3.2 Apriori算法的步骤流程-5
2.4 选择Apriori算法的原因-7
2.5 本章小结-8
第三章 高血压并发症关联性的算例分析-9
3.1研究需要的参数选取及其设定-9
3.1.1数据的采集及预处理-9
3.1.2参数设定-9
3.2 Apriori算法分析高血压及并发症的关联性-10
3.3 数据挖掘结果分析-12
3.4本章小结-13
第四章 Python编程代码的设计与验证-14
4.1Python相关软件安装-14
4.2用Python对Apriori算法的代码编写-17
4.3 测试结果-18
4.4 问题研究-20
4.5 本章小结-20
结束语-21
致 谢-22
参考文献-23
附录A -24