摘 要:本文提出了一种采用压缩感知技术来提取信号肽特征向量的新方法.压缩感知技术能在保证信息不损失的情况下,把高维稀疏信号投影到低维空间,得到信息密度较高的特征向量.该特征向量是在传统数学理论下的稀疏信号的组合函数,具有很好的判别性.为解决每个信号肽的长度不同这个问题,文章首先将原始信号肽的符号序列转化成统一大小的Markov转移矩阵,然后用稀疏基对Markov转移矩阵所对应的向量进行展开,再用测量矩阵随机投影后得到维数较低的观测值,此观测值可作为信号肽的特征向量.在对信号肽进行识别的数值实验中,基于压缩感知技术提取的特征向量,可以实现无监督情况下的高识别率.
本文的重点在于如何运用压缩感知理论进行信号肽特征提取,也就是本文的第三章,然后就是将本文的主程序在Eukaryotes,Gram+ bacte ria,Gram- bacteria这三个数据集上运行来进行仿真实验,给出聚类结果的数据,以及聚类的效果图,并与利用氨基酸组分或尺度小波能量进行特征提取这两种方法比较,实验结果也验证了该特征表达的有效性.
关键词:压缩感知;Markov转移矩阵;信号肽;特征提取
目录
摘要
ABSTRACT
第1章 绪论-1
1.1 背景及意义-1
1.2 基本框架-2
第2章 压缩感知(CS)理论-3
2.1 压缩感知理论简介-3
2.2 压缩感知理论的核心问题-3
第3章 基于压缩感知(CS)的信号肽特征提取方法-5
3.1 构建信号肽序列的Markov转移矩阵-5
3.2 用压缩感知方法提取信号肽的特征向量-6
第4章 实验与结果分析-9
4.1 特征向量的有效性-10
4.2 特征向量的识别效果-11
4.3 信号压缩尺度分析-12
第5章 结论与展望-13
5.1 结论-13
5.2 不足之处及未来展望-13
参考文献-15
致 谢-17