摘要:近年来,随着计算机视觉的深入发展,基于深度视频的应用更加具有发展潜力。Kinect是微软2009年发布的一款体感外设,它能够方便地采集深度视频与深度图像,对相关图像研究提供了便捷。目标检测和图像增晰是计算机视觉的重要任务,它们在视频监控、机器人导航、智能交通、医药等实际领域内有着重要的应用价值。本文基于Kinect深度视频,在目标检测和图像增晰方面进行了深入研究。基于国内外现有研究,本文深入探讨了HOG/HOG框架和SSD目标检测算法,以及中值滤波、双边滤波、形态学等图像增晰方法。利用这些算法,我们采用不同的数据集进行实验与测试,并对比不同数据集的测试结果。整体测试结果显示:HOG算法与SSD方法都能理想地完成目标检测,HOG算法耗时上少于SSD算法,但SSD方法在检测精确率和召回率上优于HOG算法;利用中值滤波对RGB图像进行增晰能够有效改善图像地色彩、边缘等瑕疵,利用形态学对深度图像进行增晰,能够减少图像中噪声与晕彩。
关键词: Kinect;深度视频;目标检测;图像增晰
目录
摘要
Abstract
1 绪论-1
1.1 研究的背景及意义-1
1.2 国内外相关研究现状及发展趋势-1
1.2.1 目标检测-1
1.2.2 图像增晰-2
1.3 研究的内容及意义-2
1.4 研究的框架-3
2 相关理论基础-3
2.1 Kinect硬件结构及成像系统-3
2.2 RGB图像-4
2.3 深度图像与深度视频-5
3 目标检测与图像增晰-7
3.1目标检测-7
3.1.1 HOG框架-7
3.1.2 SSD方法-9
3.2 图像增晰-10
3.2.1 中值滤波-11
3.2.2 双边滤波-13
3.2.3形态学图像处理-15
4 实验验证-16
4.1 实验步骤与实验环境-16
4.2 图像增晰实验-17
4.2.1 使用ffmpeg工具分割视频为图片-17
4.2.2 图像增晰实验-18
4.3目标检测实验-21
4.3.1 HOG训练及目标检测-21
4.3.2SSD方法进行目标检测-24
4.4 实验结果分析-27
5 结论-32
参 考 文 献-33
致 谢-35