摘要: 满族的兴盛及统治时期形成的文本材料,即满文档案,是研究满族民族文化和清朝兴盛期间历史不可或缺的文本资料。而满文档案中的印章,对研究满族的历史发展演变和考证满族历史均具有至关重要的作用。它既是清朝统治时期政治体制的标志,又是清朝统治者对于地区管理的物证,既是联系古今历史的纽带,又是考证历史、研究历史、研究相关文献等工作的重要参考文献。
本文采用HOG特征值提取方法,结合多示例学习技术,对印章进行跟踪定位。
(1)满文档案图像数据库的构建,本文建立含有满文印章的满文档案图像250张并对图像进行预处理。
(2)特征提取方法的构建。先将图像分为多个子区域,再利用HOG算法进行特征提取,最后将提取的特征组合则构成特征描述器。
(3)多示例学习算法的构建。本文建立了基于高斯过程模型的面向标准多示例学习算法,就是通过对训练集(含有正包和负包即含有印章和不含有印章的数据集)的学习得到一个学习系统,使其尽可能正确预测测试集的标签。
关键词:印章定位;物体检测;HOG特征提取;多示例学习算法
目录
摘要
Abstract
1 绪论-1
1.1 本课题的背景及意义-1
1.2 国内外研究历史和现状-2
1.2.1 物体检测国内外研究和发展-2
1.2.2印章研究现状-2
1.3 本文研究内容-2
1.4 本文组织结构-3
2 相关技术-4
2.1 物体检测相关技术-4
2.1.1边缘特征提取-4
2.1.2 滑动窗口采样-5
2.2 图像特征提取方法-6
2.2.1 HOG特征提取-6
2.2.2 LBP特征提取-7
3 算法-9
3.1 满文档案图像数据库的构建-9
3.2 图像分割-11
3.3 HOG特征提取方法的建立-12
3.3.1 标准化gamma空间和颜色空间-12
3.3.2 计算图像梯度-13
3.3.3 为每个细胞单元构建梯度方向直方图-13
3.3.4 把细胞组合块,块内归一化梯度直方图-14
3.3.5 收集HOG特征-15
3.4多示例学习算法的构建-15
4 仿真实验-20
结 论-21
参 考 文 献-22
致 谢-23