摘 要:语音识别的目的主要是是让各种各样的机器能听懂人的语言,换句话说就是在任何情况下,都能准确地识别出人类说话的内容。语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。本设计从时间和频率两个角度对语音信号产生的数学模型进行分析,系统地阐述了语音识别的基本概念。借助Matlab软件中图形编写界面GUI,实现了一个可以实时录音并进行语音识别的系统。所选择的模型是隐马尔科夫模型(HMM) ,语音特征参数主要选择MEL频率倒谱系数,设计了从数字0到数字9的语音识别系统。该系统可靠性高,实时性好,正确率高。
关键词:语音识别,Matlab,隐马尔科夫模型,GUI
目录
摘要
Abstract
1 前言-4
1.2 语音识别系统的基本构成-4
2 语音信号分析-4
2.1 语音学基本知识-4
2.1.1 音素和音节-4
2.1.2 语音信号产生模型-5
2.2 声音信号的数字化和预处理-5
2.2.1 数字化-5
2.2.2 信号的预加重处理-6
2.3 语音信号的时域分析-6
2.3.1 短时能量分析-6
2.3.2 短时平均过零率-8
2.4 语音信号的频域分析-8
3 基于Matlab环境下的语音识别算法分析-10
3.1 语音端点检测-11
3.2 特征参数提取-12
3.2.1 LPCC倒谱系数-12
3.2.2 MFCC倒谱系数-12
3.3 训练和识别-13
4 基于Matlab环境下图形编写界面GUI的实现-13
4.1 函数关系-13
4.2 操作步骤及设计思路-14
5 语音识别实现过程-16
结论-20
参考文献-21
附录A:主要程序程序代码-23
附录B:GUI程序代码-26