- ISBN:9787302590002
- 装帧:80g胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:244
- 出版时间:2022-01-01
- 条形码:9787302590002 ; 978-7-302-59000-2
本书特色
本书将以中文首次全面介绍基于深度学习的鲁棒语音处理的发展,具体包括语音检测、单通道语音增强、多通道语音增强、语音分离、鲁棒声纹识别与鲁棒语音识别。
内容简介
语音降噪处理是信号处理的重要分支领域。近年来,该领域在人工智能与深度学习技术的驱动下取得了突破性进展。本书系统总结语音降噪处理的深度学习方法,尽可能涵盖该方法的前沿进展。全书共分8章。第 1章是绪论;第 2章介绍深度学习的基础知识和常见的深度网络模型;第 3~6章集中介绍基于深度学习的语音降噪处理前端算法,其中,第 3章介绍语音检测,第4章介绍单通道语音增强,第5章介绍多通道语音增强,第6章介绍多说话人语音分离;第7章和第 8章分别介绍基于深度学习的语音降噪处理在声纹识别和语音识别方面的应用,其中着重介绍基于深度学习的现代声纹识别、语音识别基础和前沿进展。 本书专业性较强,主要面向具备一定语音信号处理和机器学习基础、致力于从事智能语音处理相关工作的高年级本科生、研究生和专业技术人员。
目录
第1章 绪论
第2章 深度学习基础
2.1 有监督学习
2.2 单层神经网络
2.2.1 基本模型
2.2.2 激活函数
2.3 前馈深度神经网络
2.3.1 反向传播算法
2.3.2 正则化
2.4 循环神经网络
2.4.1 循环神经网络基础
2.4.2 长短时记忆网络
2.4.3 门控循环神经网络
2.4.4 深层RNN结构
2.4.5 序列数据的RNN建模框架
2.5 卷积神经网络
2.5.1 卷积神经网络基础
2.5.2 其他卷积形式
2.5.3 残差神经网络
2.5.4 时序卷积网络
2.6 神经网络中的归-化
2.6.1 批归-化
2.6.2 层归-化
2.7 神经网络中的注意力机制
2.7.1 编码器-解码器框架
2.7.2 编码器,注意力机制一解码器框架
2.7.3 单调注意力机制
2.7.4 Transformer
2.8 生成对抗网络
2.8.1 基本结构
2.8.2 模型训练
2.9 本章小结
第3章 语音检测
3.1 引言
3.2 基本知识
3.2.1 信号模型
3.2.2 评价指标
3.3 语音检测模型
3.3.1 语音检测模型的基本框架
3.3.2 基于深度置信网络的语音检测
3.3.3 基于降噪深度神经网络的语音检测
3.3.4 基于多分辨率堆栈的语音检测模型框架
3.4 语音检测模型的损失函数
3.4.1 *小化交叉熵
3.4.2 *小均方误差
3.4.3 *大化ROC曲线下面积
3.5 语音检测的声学特征
3.5.1 短时傅里叶变换的频带选择
3.5.2 多分辨率类耳蜗频谱特征
3.6 模型的泛化能力
3.7 本章小结
第4章 单通道语音增强
4.1 引言
4.2 基本知识
4.2.1 信号模型
4.2.2 评价指标
4.3 频域语音增强
……
第5章 多通道语音增强
第6章 多说话人语音分离
第7章 声纹识别
第8章 语音识别
参考文献
作者简介
张晓雷,西北工业大学教授,博士生导师。清华大学博士,美国俄亥俄州立大学博士后。入选国家与省部级青年人才计划。主要从事语音信号处理、机器学习、人工智能的研究工作。在Neural Networks、IEEE TPAMI、IEEE TASLP、IEEE TCYB、Computer Speech and Language等国际期刊和会议发表论文六十余篇。出版专著和译著各一部。主持国家和省部级项目十余项。获授权发明专利十余项。曾获国际神经网络学会与Neural Networks期刊2020年度论文奖、亚太信号与信息处理学会杰出讲者、北京市科学技术一等奖等奖项。研究成果成功应用于国内三大电信运营商和金融、交通、保险等行业的二十余家主流企业。担任Neural Networks、IEEE TASLP、EURASIP Journal on Audio, Speech,and Music Processing等国际期刊的编委,IEEE信号处理学会语音与语言技术委员会委员,中国人工智能学会模式识别专业委员会委员,中国计算机学会语音对话与听觉专业委员会委员。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
PREMIERE PRO 2023全面精通:视频剪辑+颜色调整+转场特效+字幕制作+案例实战
¥69.3¥99.0