摘要:本文研究的是通过追踪用户在注视界面时眼球的移动轨迹来视觉监控用户的注意力,探索一种可能解决图像注释和隐性标注的方案。将用户界面的图像集与从用户在注视图像时提取出眼动数据特征相结合,以提供关于引导视觉注意的目标模板的隐性信息,并将这些隐性信息与图像集相结合完成对图像半自动标注。利用由 Olsson 提出的分类算法作为提取注视点的默认定义算法。此算法与I-VT算法大致相同,即使用滑动平均法来检测注视点的快速变化。通过设计一种当均值改变就发出一个提示的算法,系统可以将注视点的信息以数据的形式提取出来。这样,就可以通过单个注视点的每个时间帧所包含的信息预测它的空间位置。用户注视点的变化在一定程度上则代表用户注意力的变化,根据用户的注视点信息和用户在观察图片集时带有的目标概念,就可以对图片集中的某一张或者某几张图进行标注。
关键词:眼动数据 图像标注 注视点 眼动轨迹
目录
摘要
Abstract
绪论-3
第1章 图像标注的发展概况及其应用-4
1.1 图像标注的发展与分类-4
1.2 隐性图像标注的特点-5
第2章 眼动仪及视线追踪技术-6
2.1 眼动仪及其技术参数-6
2.2眼动追踪技术及眼动数据指标-6
2.2.1 眼动追踪技术-7
2.2.2 眼动数据的主要种类-8
2.3注视点获取-9
2.3.1 注视点检测与获取-9
2.3.2注视点的持续时间-10
2.4眼动轨迹热点图-11
2.4.1 热点图的定义-11
2.4.2 Tobii Stdio获取的眼动热点图-11
第3章 图像的眼动数据特征提取-13
3.1实验准备-13
3.1.1 实验平台-13
3.1.2用户实验内容-13
3.2 眼动实验配置-14
3.2.1用户界面-14
3.2.2用户指示情景-15
3.3特征提取与评估-16
第4章 基于眼动数据和模糊推理系统的图像标注-19
4.1基于眼动数据隐性图像标注的模型设计-19
4.1.1 隐性图像标注的模型框架分析-19
4.1.2 隐性图像标注的研究方法简述-20
4.2 Takagi-Sugeno-Kang模糊推理系统的开发(TSK-FIS)-21
4.2.1 模糊逻辑系统的原理简述-21
4.2.2 基于模糊凝视系统减法聚类的TSK-FIS结构鉴定-22
第5章 图像标注的结果与参数解析-25
5.1 图像标注指标-25
5.1.1 查全率和查准率的基本定义-25
5.1.2实验数据处理-26
5.2 实验结果与分析-27
5.1.1 实验结果分析-28
5.1.2 可调阈值变量的影响-28
第6章 总结与展望-35
参考文献-36
致谢-37