摘要:麦克风阵列是一组遵循一定的规则来放置的麦克风组成的[1],可以对采集到来自于不一样的空间上的声音信号做空时处理,进而实现噪声的抑制、混响去除、声源测向、人声的干扰抑制、声源的跟踪以及阵列增益等功能。
在麦克风阵列基础上的声音信号定位技术在很多领域都已经有了广泛的应用,比如车载电话,视频会议、大型会场和助听器等。麦克风阵列拥有比较好的隐蔽性、能够消除语音噪声、不容易受干扰、可以对声源进行跟踪定位等优点,因此能够在提高语音信号处理质量的同时,也具有很广泛的应用。
本文研究了一种基于树莓派的麦克风阵列声源定位系统,该系统首先实现了对声音信号的识别,对某一个特定的信号进行处理进而对该信号进行声源定位,特定的声音信号识别用到了关键词检测技术(Keyword Spotting,KWS)。在声源定位中用到了波达方向(Direction Of Arrival,DOA)中的MUSIC(Multiple Signal Classfication)算法,DOA中有很多关键技术算法,本文做了DOA中常见的技术对比并说明了MUSIC算法的优势。在PC与树莓派通信部分采用了SMB(Server Messages Block,信息服务模块)协议,PC可以通过网上文件夹直接访问到树莓派根目录下查看系统对声音信号定位的结果。
本文完成的系统可以对声音信号实现方位角估算功能,对某个特定的声音信号进行定位并能够通过LED(发光二极管)灯直观的显示出方位,该系统可以在实时定位系统中得以运用。
关键词:声源定向;声波信号;麦克风阵列;树莓派
目录
摘要
Abstract
1 绪论-1
1.1 课题研究的背景及意义-1
1.2 国内外研究现状-2
1.3 麦克风阵列声源定位技术-2
1.3.1 基于最大输出功率的可控波束形成的声源定位技术-3
1.3.2 基于TDOA的声源定位技术-3
1.3.3 基于高分辨率频谱估计的声源定位技术-4
1.4 本文主要研究内容-4
1.5 论文结构安排-4
2 麦克风阵列模型及MUSIC算法-5
2.1 麦克风阵列信号模型-5
2.1.1 远场、近场的划分-5
2.1.2 远场声源定位模型-5
2.2 麦克风阵列选择-7
2.2.1 拓扑结构-7
2.2.2 麦克风类型-8
2.2.3 阵元个数-8
2.2.4 阵元间距-8
2.3 MUSIC算法-8
2.3.1 基于协方差矩阵的特征分解-8
2.3.2 MUSIC算法基本原理-9
2.3.3 MUSIC算法实现-10
2.3.4 MUSIC 算法仿真-11
2.4 本章总结-12
3 几种DOA技术算法比较-13
3.1 DOA技术介绍-13
3.2 信号模型-13
3.3 延迟-相加算法-13
3.3.1 延迟相加算法介绍-13
3.3.2 延迟-相加算法输出功率-14
3.4 CAPON最小方差法-14
3.4.1 capon算法原理-15
3.5 bartlett算法-15
3.5.1 bartlett算法介绍-15
3.5.2 Bartlett算法存在的问题-15
3.6 本章总结-15
4 麦克风阵列声源定向系统-16
4.1 系统的组成及实现原理-17
4.2 系统的硬件设计-18
4.2.1 麦克风阵列结构设计-18
4.2.2 对声音信号进行处理-19
4.2.3 树莓派微型电脑介绍-19
4.3 DOA算法进行定位-20
4.3.1 空间谱估计的系统结构-20
4.3.2 DOA 估计的基本原理-21
4.3.3 DOA估计前景展望-21
4.4 PC通过SAMBA协议与树莓派进行通讯-21
4.4.1 调用树莓派自带wifi模块-21
4.4.2 开启树莓派SAMBA服务-22
4.5 本章总结-24
5 声源定位系统实验及结果分析-25
5.1 实验装置及声场环境-25
5.2 实验结果-25
5.2.1 实验结果测试-25
5.2.2 系统硬件图以及运行效果图-30
5.3 误差分析-31
5.4 本章小结-31
6 总结与展望-31
参考文献-32
致谢-34