摘要:语音端点检测是语音识别中非常有效的一个手段。音频信号处理里面的端点检测技术,是指从含有语音的一段连续的信号中确定出音频信号的起始点及终点,对起始点至终点中所有的音频信号进行处理。是对不同的语音信号处理(如语音识别、讲话人识别等)的重中之重且非常重要的第一步。实际运用中,通常要求先采集系统的输入音频信号进行筛选,才能获得真正且有效并且使我们需要的音频数据,减少数据处理的占用的资源和运算量的周期,并减少程序运行时间。
论文是基于2017年较为前沿的稀疏分解算法对音频(语音)信号进行预(也就是JAVA中的构造函数)处理,也就是每段语音必须进行的操作,而后实现较好的语音检测性能。主要通过matlab仿真编程软件实现了基于稀疏分解的语音端点检测系统的实现,并较好完成了带噪语音的良好端点检测。仿真结果表明,对于带噪语音,经过稀疏分解重构可以有效抑制噪声,进而通过短时能量检测算法准确地定位语音起始点与结束点,从而实现良好的检测效果。
关键词:语音处理:稀疏分解:端点检测
目录
摘要
Abstract
1 绪论-1
1.1 研究背景和意义-1
1.2 国内外研究现状-1
1.3 主要工作内容-3
2 语音信号的时频域处理与分析-4
2.1 语音的时域特征-4
2.2 语音的频域特征-5
2.3 语音信号处理-5
2.3.1 预加重-6
2.3.2 加窗分帧-6
3 基于稀疏分解的端点检测-7
3.1 稀疏分解基本原理-7
3.2 语音信号的稀疏分解与重构-7
3.2.1 基于KSVD的语音稀疏分解-8
3.2.2 基于OMP算法的稀疏重构-9
3。3 基于短时能量的端点检测-9
4 稀疏分解算法-11
4.1 matlab GUI程序开发简介-11
4.2 稀疏分解算法仿真及分析-11
4.3 稀疏分解语音检测程序流程-13
4.4 仿真分析-14
结论-17
参考文献-18
致谢-19