摘要:近年来,随着宽带网络技术、新型多媒体技术和信息通信技术的飞快发展,我们步入了一个崭新的互联网时代。我们知道,视频资源中包含丰富的语义信息和视频关键内容,为此,对图像和视频中文本检测和提取成为本文研究主题。
本文在现有研究的基础上主要对视频帧图像中文字的检测、定位、识别方法和实现手段展开研究。课题研究的重点主要为视频帧的截取、图像预处理、图像文本定位、图像字符分割、字符模板库的创建和字符匹配及识别六个方面。在视频帧的提取上,采用MATLAB中相关函数对视频文件进行分帧处理,获得视频相应的帧图像序列。在图像预处理方面,一是对彩色图像进行灰度化处理和二值化处理。二是对图像进行形态学运算,包括膨胀和腐蚀。在文本定位方法的选取上,本文采用了扫描法;图像字符分割采用阈值分割算法。字符模板库的创建和字符匹配运用的是模板匹配法,该方法是图像处理中最为常用的一种。最后,本文分析了当前视频图像中字符切割算法的缺点和所存在的问题以及应用领域。
关键词:数学形态学;文本定位;自适应阈值分割;字符识别;模板匹配
目录
摘要
Abstract
1 绪论-1
1.1 研究背景及意义-1
1.2 发展历史-2
1.2.1前言-2
1.2.2发展历史-2
1.3 国内外研究现状-3
1.4 论文的主要内容-4
2 视频和图像处理-5
2.1 视频图像中文本分类和特点-5
2.1.1 视频图像中文本分类-5
2.1.2 视频图像中文本特点-6
2.2 视频载入-8
2.3 视频帧提取-9
2.4 视频图像预处理-9
2.4.1图像灰度化-9
2.4.2图像二值化-10
2.5 图像数学形态学-11
2.5.1腐蚀操作-12
2.5.2膨胀操作-12
2.5.3开运算-13
2.5.4闭运算-13
2.6 本章小结-13
3 视频图像文本定位和识别-14
3.1文本定位的基本方法-14
3.1.1 基于区域的文本定位-14
3.1.2 基于边缘的文本定位-14
3.1.3 基于纹理的文本定位-15
3.1.4 基于学习的文本定位-15
3.2 文本识别-16
3.2.1 字符切分-16
3.2.2 字符归一化-16
3.2.3 文本识别-17
3.3 本章小结-17
4 系统设计及实现-18
4.1 视频载入-18
4.1.1视频文件读取-18
4.1.2视频信息获取-19
4.1.3获取视频图像序列-20
4.2 视频帧获取-21
4.3 图像预处理-22
4.3.1图像灰度化-22
4.3.2图像二值化-22
4.3.3腐蚀运算-23
4.3.4膨胀运算-23
4.4 文本定位-24
4.4.1文本边缘区域选定-24
4.4.2字符分割-25
4.5 文本识别-26
4.6 本章小结-27
结 论-28
参 考 文 献-29
致 谢-30