摘 要:声纹识别就是让机器能够听懂人话,它是以语音为研究对象的,是语音信号处理的一个重要的研究方向.随着计算机技术、多媒体技术、数字信号处理技术的发展,人们对声纹音识别技术的发展寄予了更高的期望.声纹识别拥有着可观的应用背景,同时作为一个交叉学科也具有深远的理论研究价值.
论文首先介绍了声纹识别的发展历史以及现在在各方面的应用,也介绍了声纹识别的技术特点和国内外声纹研究的现状,最后阐述了研究声纹识别的困难.之后对语音信号识别的一些基本理论及算法进行了一些研究,并说明了声纹识别按不同条件的分类.第三章进入论文的主要工作,说明了在语音信号进行分析和处理之前,必须要对所采集的语音信号进行预处理.预处理阶段包括语音的采样、量化、预加重、加窗、及端点检测等.第四章是论文的主要部分,特征参数的提取算法及研究是目前声纹识别技术的关键,因为要进行说话人的识别,必须要有话者的特征参数,这部分介绍了特征参数提取的准则、分类.研究了线性预测倒谱系数(LPCC)和mel频率倒谱系数(MFCC),结合C在matlab平台进行研究.论文最后介绍了声纹模式匹配的常用模型,着重指出高斯混合模型(GMM).
关键词:声纹识别;预处理;特征提取
目录
摘要
abstract
第1章绪论-1
1.1 声纹识别的发展-1
1.2 声纹识别的应用-1
1.3 声纹识别技术的特点及研究现状-2
1.4 声纹识别研究的困难-3
第2章 声纹识别的系统组成及分类-5
2.1 声纹识别系统的组成-5
2.2 声纹识别的分类-6
第3章 声纹识别系统语音预处理-7
3.1 声纹识别的预处理-7
3.2 语音的产生机理-7
3.3 语音信号的采样与滤波-8
3.4 语音信号的预加重-8
3.5 语音信号的加窗与分帧-9
3.6 端点检测-10
第4章 声纹识别特征参数的提取-13
4.1 特征提取的准则-13
4.2 特征参数的分类-13
4.3常用的特征参数提取-14
4.3.1 基于LPCC的特征参数提取-15
4.3.2求LPCC参数源文件主程序及仿真-16
4.3.3 基于MFCC的特征提取-17
4.3.4 求MFCC参数源文件主程序及仿真-18
第5章 模式匹配-21
5.1 模式匹配方法概述-21
5.2 基于高斯混合模型(GMM)的说话人识别-22
第6章 结论与展望-25
6.1结论-25
6.2展望-25
参考文献-27
致谢-29