- ISBN:9787121276545
- 装帧:一般轻型纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:158
- 出版时间:2021-12-01
- 条形码:9787121276545 ; 978-7-121-27654-5
本书特色
(1)学术性较强:本书力求反映当前智能语音处理领域解决音频降噪和语音增强问题的*新研究进展,书中的理论是当前音频领域研究的热点之一,内容丰富,阐述全面,能够为相关研究人员开辟新的研究方向提供启示。(2)内容新颖:给出了课题组*新的研究成果,如基于端到端深度学习的语音降噪、结合注意力机制的语音频带扩展、基于神经网络的心音分类等。(3)强化应用:书中内容面向应用,涉及了语音降噪、心音增强、语音频带扩展、声源定位等众多分支领域,力求为解决工程实际问题提供有益参考。(4)案例分析透彻。本书给出了一些深层神经网络在语音处理系统前端的应用案例,并对案例进行理论分析、过程推导、实验测试、结果分析以及应用展望,有助于读者深入理解智能语音理论基础和相关算法,为实际应用提供借鉴。
内容简介
本书是根据作者在音频降噪领域的研究成果而著,全书共分为10章,主要内容包括绪论、基于高斯混合模型的非监督在线建模噪声功率谱估计、结合优化U-Net和残差网络的单通道语音增强算法、基于差分麦克风阵列的变步长LMS语音增强算法、语音频带扩展研究综述、基于时间卷积神经网络的语音频带扩展、基于编解码器网络的语音频带扩展、基于时频感知神经网络的语音频带扩展、IMCRA-OMLSA噪声动态估计下的心音降噪、结合SVM和香农能量的HSMM心音分割方法。
目录
1.1 引言
1.2 语音增强基础
1.2.1 模型描述
1.2.2 噪声类型
1.2.3 语音质量评价方法
1.3 传统单通道语音增强技术发展
1.4 监督性单通道语音增强技术发展
1.4.1 基于浅层模型的语音增强算法
1.4.2 基于深层模型的语音增强算法
1.5 本章小结
参考文献
第2章 基于高斯混合模型的非监督在线建模噪声功率谱估计
2.1 引言
2.2 基于GMM的在线建模方法
2.3 基于极大似然的在线参数估计
2.4 基于MDL准则的在线约束
2.5 聚类方法实现
2.6 实验设置与分析
2.6.1 实验设置
2.6.2 实验结果与分析
2.7 本章小结
参考文献
第3章 结合优化U-Net和残差网络的单通道语音增强算法
3.1 引言
3.2 Residual-U-Net语音增强方法
3.2.1 自编码器结构
3.2.2 U-Net网络结构
3.2.3 残差网络
3.2.4 Residual-U-Net网络
3.3 实验设置与分析
3.3.1 数据集及参数设置
3.3.2 结果与分析
3.3.3 语谱图比较
3.4 本章小结
参考文献
第4章 基于差分麦克风阵列的变步长LMS语音增强算法
4.1 引言
4.2 双通道信号模型
4.3 算法描述
4.3.1 一阶差分麦克风阵列
4.3.2 变步长频域LMS算法
4.4 实验设置与分析
4.5 本章小结
参考文献
第5章 语音频带扩展研究综述
5.1 引言
5.2 源-滤波器模型
5.2.1 宽带激励信号生成
5.2.2 宽带谱包络估计
5.3 深度学习的端到端语音频带扩展
5.3.1 全连接神经网络
5.3.2 基于全连接神经网络的语音频带扩展
5.4 基于卷积神经网络的语音频带扩展
5.5 基于循环神经网络的语音频带扩展
5.6 基于时频神经网络的语音频带扩展
5.7 数据预处理方式及窄带语音特性
5.7.1 窄带语音产生原因
5.7.2 时域预处理方法
5.7.3 频域预处理方法
5.8 仿真与分析
5.8.1 客观评价
5.8.2 主观评价
5.8.3 语谱图
5.9 本章小结
参考文献
第6章 基于时间卷积神经网络的语音频带扩展
6.1 时间卷积网络结构
6.1.1 扩张因果卷积
6.1.2 时间卷积网络
6.2 基于TCN的语音频带扩展
6.2.1 模型架构
6.2.2 时频损失
6.3 实验设置与分析
6.3.1 实验设置
6.3.2 实验结果与分析
6.4 本章小结
参考文献
第7章 基于编解码器网络的语音频带扩展
7.1 编解码器网络模型
7.2 时频感知损失函数
7.3 实验设置与分析
7.3.1 实验设置
7.3.2 语谱图
7.3.3 客观评价
7.3.4 主观评价
7.4 本章小结
参考文献
第8章 基于时频感知神经网络的语音频带扩展
8.1 编解码器注意力模型
8.1.1 编码器结构
8.1.2 局部敏感哈希自注意力层
8.1.3 解码器结构
8.2 深度时频感知损失函数
8.3 实验设置与分析
8.3.1 实验设置
8.3.2 语谱图
8.3.3 客观评价
8.3.4 主观评价
8.4 消融对比实验
8.5 本章小结
参考文献
第9章 IMCRA-OMLSA噪声动态估计下的心音降噪
9.1 引言
9.2 算法框架
9.3 基于IMCRA-OMLSA的心音降噪
9.3.1 基于OMLSA的心音降噪
9.3.2 基于IMCRA的噪声估计
9.4 降噪结果的定性分析
9.5 降噪结果的定量评估
9.5.1 数据集与特征提取
9.5.2 分类器构建
9.5.3 评估结果及分析
9.6 本章小结
参考文献
第10章 结合SVM和香农能量的HSMM心音分割方法
10.1 引言
10.2 分割的原理与方法
10.2.1 预处理
10.2.2 LR-HSMM
10.2.3 归一化香农能量
10.2.4 支持向量机(SVM)
10.2.5 心音持续时间分布
10.2.6 Viterbi解码
10.3 分割算法流程
10.4 训练与评价指标
10.4.1 数据集
10.4.2 训练集
10.4.3 模型评估
10.5 实验设置与分析
10.5.1 实验结果
10.5.2 性能指标对比
10.6 本章小结
参考文献
主要符号缩写
作者简介
许春冬,男,博士,副教授,硕士生导师,江西理工大学人工智能系主任,江西省第四届电子信息类教学指导委员会委员。主持和参与国家级项目5项,主持省部级课题11项,授权发明专利和软件著作权各1件,公开发表核心以上学术论文30余篇。获得省部级科研二等奖励1项,地厅级科研奖励3项,主持获得学校教学成果奖2项。
-
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
落洼物语
¥8.7¥28.0 -
中国当代文学名篇选读
¥19.1¥53.0 -
中医基础理论
¥50.7¥59.0 -
北大人文课(平装)
¥13.9¥45.0 -
外国教育史-第2版
¥24.4¥40.0 -
宪法-第二版
¥12.2¥29.0 -
当代中国政府与政治 第二版
¥57.8¥68.0 -
EPLAN电气设计
¥29.9¥39.8 -
闯进数学世界――探秘历史名题
¥21.3¥32.8 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
金融学
¥29.9¥49.0 -
计算机操作系统教程(第4版)(清华大学计算机系列教材)
¥31.9¥49.0 -
三国史
¥27.5¥50.0 -
飞机总体设计
¥46.8¥78.0 -
古代汉语(第四册)
¥16.1¥35.0 -
编辑审稿实务教程
¥35.1¥45.0 -
管理学:原理与方法(第7版)(博学.大学管理类)/周三多
¥30.9¥49.0 -
(平装)北大必修课:北大口才课
¥12.2¥45.0