摘要:当今世界下,因特网的发展速度越来越快,网络的普及率也相当的高,网络已经是全球范围内最大最强的信息知识库了,也给人们的生活提供了很多的便利。搜索引擎作为一个重要的工具,则可以让用户快速高效的从网络上了解信息,而数据挖掘作为一项优秀技术也使搜索引擎变得更加智能化。
因此,本论文主要研究的方向是数据挖掘技术在智能搜索引擎中的应用研究。本文首先介绍了智能搜索引擎的基本知识和框架结构,其次再对数据挖掘技术概念、分类以及基本结构做了简单的概括。接着对数据挖掘技术在智能搜索引擎中的应用进行了相关性的研究,分析了搜索引擎中的内容挖掘、结构挖掘和日志挖掘起到的作用和功能,并对目前数据挖掘技术存在的问题做了更进一步的解读。本文也对Web数据挖掘中用户的行为和特征进行了相关的描述,在理论的基础上对Page Rank的算法提出了一点改进,并作了详细的分析探讨,从而增强了搜索引擎的效率和查准率、查全率。
关键词 数据挖掘;搜索引擎;pagerank算法
目录
摘要
Abstract
1 绪论-1
1.1 研究背景及意义-1
1.2 国内外研究现状-1
1.3 论文研究内容-2
2 理论知识-3
2.1 智能搜索引擎的简介-3
2.2 智能搜索引擎的框架结构-3
2.3 Web数据挖掘的概念及分类-7
2.4 Web数据挖掘的基本结构-9
3 Web数据挖掘在智能搜索引擎中的应用-11
3.1 Web文档挖掘在搜索引擎中的应用-11
3.2 Web结构挖掘在搜索引擎中的应用-13
3.3 Web日志挖掘在搜索引擎中的应用-15
3.4 数据挖掘技术面临的主要问题-16
4 对Web结构挖掘中Page Rank算法案例的研究改进-18
4.1 经典Page Rank算法介绍-18
4.2 算法的代数表达及其研究-20
4.3 基于用户访问日志的PageRank算法-22
5 结论-26
致谢-27
参考文献-28