摘 要:随着计算机技术的迅速发展,很多智能算法被开发应用于信号肽预测研究,目前的方法主要识别给定蛋白中是否存在信号肽以及识别信号肽的切割位点,都是以独立的蛋白序列作为识别对象,没有替换或设计新的信号肽。当外源蛋白拼接了新的信号肽以后, 蛋白质主链序列仍与原蛋白质相同, 拼接前后序列的相似程度很高, 但分泌水平可能变化很大。
本文在结构融合度(SFD)特征的基础上,进一步研究氨基酸的替换原则和转移规律,在构建氨基酸综合替代矩阵和马尔科夫转移矩阵的基础下,通过对信号肽H-区的符号序列进行编码以及定义评价替换得分的适应值函数,运用遗传算法寻找最优解,对不分泌/极低分泌的信号肽序列进行人工调整和优化设计,通过寻找信号肽中不同位置氨基酸的偏向性选取趋势,发现影响蛋白质分泌水平的关键氨基酸,从中寻找可能实现外源蛋白质高分泌表达的人工优化候选信号肽。最后通过人工序列设计的相似性分析和偏向性序列的结构分析,来验证实现外源蛋白高分泌表达的优化候选信号肽的可行性与正确性。
关键词:信号肽;马尔科夫转移矩阵;特征向量;人工优化序列;遗传算法
目录
摘要
ABSTRACT
第1章 绪论-1
1.1背景及意义-1
1.2 基本框架-1
第2章 遗传算法(GA)理论-3
2.1 遗传算法理论简介-3
第3章 基于遗传算法的人工信号肽设计研究-7
3.1 构建氨基酸综合替代矩阵-7
3.2 构建Markov转移矩阵-8
3.3 基于遗传算法的人工序列设计-9
第4章 实验与结果分析-13
4.1蛋白序列的向量化(特征提取)-13
4.2 人工序列设计的相似性分析-14
4.3 偏向性序列的结构分析-15
第5章 结论与展望-17
5.1 结论-17
5.2不足之处及未来展望-17
参考文献-18
致 谢-19
附录A: 参与科研项目情况-20