×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
暂无评论
图文详情
  • ISBN:9787121276545
  • 装帧:一般轻型纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:158
  • 出版时间:2021-12-01
  • 条形码:9787121276545 ; 978-7-121-27654-5

本书特色

(1)学术性较强:本书力求反映当前智能语音处理领域解决音频降噪和语音增强问题的*新研究进展,书中的理论是当前音频领域研究的热点之一,内容丰富,阐述全面,能够为相关研究人员开辟新的研究方向提供启示。(2)内容新颖:给出了课题组*新的研究成果,如基于端到端深度学习的语音降噪、结合注意力机制的语音频带扩展、基于神经网络的心音分类等。(3)强化应用:书中内容面向应用,涉及了语音降噪、心音增强、语音频带扩展、声源定位等众多分支领域,力求为解决工程实际问题提供有益参考。(4)案例分析透彻。本书给出了一些深层神经网络在语音处理系统前端的应用案例,并对案例进行理论分析、过程推导、实验测试、结果分析以及应用展望,有助于读者深入理解智能语音理论基础和相关算法,为实际应用提供借鉴。

内容简介

本书是根据作者在音频降噪领域的研究成果而著,全书共分为10章,主要内容包括绪论、基于高斯混合模型的非监督在线建模噪声功率谱估计、结合优化U-Net和残差网络的单通道语音增强算法、基于差分麦克风阵列的变步长LMS语音增强算法、语音频带扩展研究综述、基于时间卷积神经网络的语音频带扩展、基于编解码器网络的语音频带扩展、基于时频感知神经网络的语音频带扩展、IMCRA-OMLSA噪声动态估计下的心音降噪、结合SVM和香农能量的HSMM心音分割方法。

目录

第1章 绪论
1.1 引言
1.2 语音增强基础
1.2.1 模型描述
1.2.2 噪声类型
1.2.3 语音质量评价方法
1.3 传统单通道语音增强技术发展
1.4 监督性单通道语音增强技术发展
1.4.1 基于浅层模型的语音增强算法
1.4.2 基于深层模型的语音增强算法
1.5 本章小结
参考文献
第2章 基于高斯混合模型的非监督在线建模噪声功率谱估计
2.1 引言
2.2 基于GMM的在线建模方法
2.3 基于极大似然的在线参数估计
2.4 基于MDL准则的在线约束
2.5 聚类方法实现
2.6 实验设置与分析
2.6.1 实验设置
2.6.2 实验结果与分析
2.7 本章小结
参考文献
第3章 结合优化U-Net和残差网络的单通道语音增强算法
3.1 引言
3.2 Residual-U-Net语音增强方法
3.2.1 自编码器结构
3.2.2 U-Net网络结构
3.2.3 残差网络
3.2.4 Residual-U-Net网络
3.3 实验设置与分析
3.3.1 数据集及参数设置
3.3.2 结果与分析
3.3.3 语谱图比较
3.4 本章小结
参考文献
第4章 基于差分麦克风阵列的变步长LMS语音增强算法
4.1 引言
4.2 双通道信号模型
4.3 算法描述
4.3.1 一阶差分麦克风阵列
4.3.2 变步长频域LMS算法
4.4 实验设置与分析
4.5 本章小结
参考文献
第5章 语音频带扩展研究综述
5.1 引言
5.2 源-滤波器模型
5.2.1 宽带激励信号生成
5.2.2 宽带谱包络估计
5.3 深度学习的端到端语音频带扩展
5.3.1 全连接神经网络
5.3.2 基于全连接神经网络的语音频带扩展
5.4 基于卷积神经网络的语音频带扩展
5.5 基于循环神经网络的语音频带扩展
5.6 基于时频神经网络的语音频带扩展
5.7 数据预处理方式及窄带语音特性
5.7.1 窄带语音产生原因
5.7.2 时域预处理方法
5.7.3 频域预处理方法
5.8 仿真与分析
5.8.1 客观评价
5.8.2 主观评价
5.8.3 语谱图
5.9 本章小结
参考文献
第6章 基于时间卷积神经网络的语音频带扩展
6.1 时间卷积网络结构
6.1.1 扩张因果卷积
6.1.2 时间卷积网络
6.2 基于TCN的语音频带扩展
6.2.1 模型架构
6.2.2 时频损失
6.3 实验设置与分析
6.3.1 实验设置
6.3.2 实验结果与分析
6.4 本章小结
参考文献
第7章 基于编解码器网络的语音频带扩展
7.1 编解码器网络模型
7.2 时频感知损失函数
7.3 实验设置与分析
7.3.1 实验设置
7.3.2 语谱图
7.3.3 客观评价
7.3.4 主观评价
7.4 本章小结
参考文献
第8章 基于时频感知神经网络的语音频带扩展
8.1 编解码器注意力模型
8.1.1 编码器结构
8.1.2 局部敏感哈希自注意力层
8.1.3 解码器结构
8.2 深度时频感知损失函数
8.3 实验设置与分析
8.3.1 实验设置
8.3.2 语谱图
8.3.3 客观评价
8.3.4 主观评价
8.4 消融对比实验
8.5 本章小结
参考文献
第9章 IMCRA-OMLSA噪声动态估计下的心音降噪
9.1 引言
9.2 算法框架
9.3 基于IMCRA-OMLSA的心音降噪
9.3.1 基于OMLSA的心音降噪
9.3.2 基于IMCRA的噪声估计
9.4 降噪结果的定性分析
9.5 降噪结果的定量评估
9.5.1 数据集与特征提取
9.5.2 分类器构建
9.5.3 评估结果及分析
9.6 本章小结
参考文献
第10章 结合SVM和香农能量的HSMM心音分割方法
10.1 引言
10.2 分割的原理与方法
10.2.1 预处理
10.2.2 LR-HSMM
10.2.3 归一化香农能量
10.2.4 支持向量机(SVM)
10.2.5 心音持续时间分布
10.2.6 Viterbi解码
10.3 分割算法流程
10.4 训练与评价指标
10.4.1 数据集
10.4.2 训练集
10.4.3 模型评估
10.5 实验设置与分析
10.5.1 实验结果
10.5.2 性能指标对比
10.6 本章小结
参考文献
主要符号缩写
展开全部

作者简介

许春冬,男,博士,副教授,硕士生导师,江西理工大学人工智能系主任,江西省第四届电子信息类教学指导委员会委员。主持和参与国家级项目5项,主持省部级课题11项,授权发明专利和软件著作权各1件,公开发表核心以上学术论文30余篇。获得省部级科研二等奖励1项,地厅级科研奖励3项,主持获得学校教学成果奖2项。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航