摘要:目前,图书和刊物的语音化已经成为一个显著的趋势,在很多领域都有着重要的作用。“点读机”等电子语音产品大量的涌入市场,也正说明人们对于语音产品的需求量越来越大,但这些产品也存在许多不足,比如产品设计中的语音分割部分都是手动完成的,任务量大、耗时又浪费资源,而且分割还受到个人主观意识的影响,从而导致分割精度并不高。研发连续语音自动分割系统将会更好地增强系统的工作效率和分割精度。
连续语音自动分割系统,将实现自动辨识音频分割的间歇,并在分割音频后,自动进行音频播放。本文的主要研究内容有:(1)语音信号端点检测部分,首先进行语音信号的采集并同时画出频谱图。然后进行采样分帧,从语音信号中截取一段样本,一般取样点数是帧长的整倍数,分帧的主要目的是能够把样本模块中的语音样值点分成若干个语音帧。最后进行语音信号的时域分析,语音信号的时域分析即是分析并得到语音信号的时域参数,而时域取得幅度包络的方法易于实现,也可以快速检测每个音频的起点和终点。(2)在连续语音自动分割部分,建立阈值自适应分割算法的模型,完成对语音文件的有效分割。(3)基于Matlab平台实现连续语音自动分割系统,该系统能够完成对语音文件的分析和自动分割。
本文通过测试验证了连续语音自动分割系统的可行性。并通过研究制定了相应的改进方案。测试结果表明,本文采用的连续语音自动分割的算法原理上准确。
关键词:连续语音自动分割;时域分析;阈值自适应
目录
摘要
Abstract
1绪论-1
1.1课题的背景和意义-1
1.2课题的内容及要求-2
1.3本文章节安排-2
2数字语音信号处理-3
2.1数字语音信号处理的理论基础-3
2.1.1数字语音信号时域处理方法-3
2.1.2数字语音信号频域处理方法-5
2.2语音端点检测-7
3语音自动分割系统设计-9
3.1语音信号的采集与时域分析-9
3.1.1采样分帧-10
3.1.2时域参数计算-11
3.2阈值自适应分割模块-12
4基于GUI的人机界面开发-14
4.1MATLAB GUI简介-14
4.2图形用户界面设计-15
4.2.1 GUI设计模板-15
4.2.2 GUI设计窗口及基本操作-15
4.2.3 GUI界面实现的功能-15
4.3图形用户界面制作-16
5系统的改进与完善-18
结论-19
参考文献-20
附录A系统程序-21
致谢-24