摘要:随着计算机网络智能犯罪的组织越来越猖獗,木马在网络空间中爆发式地增长。根据McAfee实验室发布的报告,发现其捕获的8000多万个样本中,其中近一半是以前捕获到的,很多样本具有相似性。近年来,研究木马之间的相似性成为一个热点。
木马之间的相似度可用木马指纹之间的相似度来表征,可为用户提供一些数据支持来判断木马之间的相似性。本课题研究的主要内容为木马指纹检索模块,分为单指纹检索和多指纹检索两个功能。在两个功能模块中所涉及到的每个指纹间的相似度计算,均是通过编辑距离的算法或Jaccard系数计算。单指纹检索模块,通过直接计算单个指纹间的相似度值作为最后结果;多指纹检索模块,在给每个指纹赋予相应的权重之后,再根据权重计算多个指纹共同作用下的综合相似度值。
实验结果表明,对用户输入的木马指纹信息,分为单指纹和多指纹,均能够在木马指纹数据库中进行快速检索、计算,并给出一个基于相似度的排序结果推荐,能够基本完成任务书的指标要求;并且为木马指纹检索模块设计了一个界面,使得整个程序用起来更加方便且美观。
关键词:木马指纹 检索排序 相似度 MongoDB
目录
摘要
ABSTRACT
1 引言-1
1.1 研究背景-1
1.2 国内外网络安全现状-1
1.3 研究意义-2
2 需求分析-3
2.1 木马同源性的功能需求-3
2.2 指纹检索模块的技术需求-3
3 方案设计与论证-4
3.1 开发语言的选择-4
3.2 数据库的选择-5
3.3 数据库可视化工具-6
4 概要设计-8
4.1 模块的架构-8
4.2 模块的流程-8
4.3 关键数据结构-9
4.4 检索算法-10
5 详细设计-11
5.1 数据库的连接与关闭-11
5.2 功能选择界面-12
5.3 指纹信息录入-13
5.4 结果显示界面-15
5.5 木马指纹的权重-16
5.6 相似度的算法-17
6 系统测试-19
6.1 测试环境-19
6.2 测试步骤及结果-19
7 总结-23
参考文献-24
附录-25
致谢-31