摘 要:如今信息化的时代,网络在不断便捷这人们的生活,我们从提交纸质的作业到可以通过网络上传作业,教学系统也日新月异的变成适合当今网络时代的形态,但在便利的背后,就总会滋生懒惰,部分学生会选择对他人作业进行复制,或者修改后成为自己的作业,导致抄袭现象普遍,但人工检查的效率又太过低下,所以一个能对学生作业雷同度进行分析的系统变得必要起来。
不过作业的雷同度体现在多方面,包括词义,字符串,本系统将只从字符串的角度对学生作业雷同度进行分析判断。基于word学生作业雷同度分析系统,顾名思义,是针对word文档作业的分析,方便教师对学生作业雷同度进行判别,本系统是基于C/S架构的系统,借助于Windows平台,通过VS2010的MFC框架,使用SQLSERVER2008数据库,GridCtrl控件的显示,应用第三方的皮肤进行美化。本系统通过递归的算法对文档相似度进行分析。即比较文档第一个词是否相同,若是的话,则判断除去第一个词后两个文档的相似度。如果不是的话,则分别判断除去第一个文档第一个词,第二个文档第一个词,以及两个文档第一个词三个相似度,然后取得其中的最大值得出结果。在文档读取方面,通过FINDFILE函数对文件夹下文档进行遍历,也就是只需要将需要分析的文档放在文件夹下,然后通过系统指定对应路径就可以自动读取该路径下的文档。同时利用IDispatch包装类msword对word文档进行转化,成为便于读取和分析的txt文档。本文将从可行性分析,需求分析和详细设计,测试分析等方面对开发过程展开详细的阐述。
-
关键词:C/S架构,VS2010,SQLSERVER2008,FINDFILE,作业雷同度
目录
摘要
Abstract
一、引 言-1
(一)课题的背景、意义-1
(二)国内外研究现状-1
(三)课题研究的内容、目标和解决的一些相关关键问题-1
(四)可行性分析-2
1.技术可行性-2
2. 使用可行性-2
二、系统平台选择-2
(一)硬件平台选择-2
(二)系统操作平台选择-2
(三)数据库平台选择-2
1. 概述-2
2. SQLSERVER2008R2数据库引擎的特性-2
(四)使用到的第三方高级控件GridCtrl-3
GridControl-3
(五)开发工具的选择—VS2010-3
(六)C/S系统架构-3
(七)小结-3
三、系统需求分析-4
(一)设计概念和相应的处理流程-4
(二)系统功能详细划分-4
(三)系统各个功能概述-5
1. 搜索文件功能-5
2. 分析功能-6
3. 保存结果功能-6
4. 工作日志功能-6
(四)设计小结-6
四、系统详细设计-6
(一)系统数据库设计-6
1. 数据库系统的需求分析-6
2. 数据库的概念结构设计-6
3. 数据库的逻辑结构表-7
(二)系统界面设计-7
1.主界面-7
(三)预处理模块-8
1.设置工作路径功能-8
2.读取doc文件并转化为txt文档-9
(四)文字分析模块-11
(五)小结-16
五、测试分析-16
(一)时间分析-16
(二)效果分析-17
五、 总 结-19
参 考 文 献-20
致谢-21
附录(代码)-22