×
暂无评论
图文详情
  • ISBN:9787302635482
  • 装帧:平装
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:336
  • 出版时间:2023-06-01
  • 条形码:9787302635482 ; 978-7-302-63548-2

本书特色

兼顾相关专业、不同层次学生对语音信号处理知识的需求,*大限度地涉及计算机学科更多更新的知识

内容简介

本书为语音信号处理领域的指导书。作者在东南大学、南京理工大学开设的本科生课程的基础上,介绍了语音信号处理的基本原理、分析方法以及该学科领域近年来取得的一些研究成果和技术,在理论和应用之间达到了极好的平衡。全书共11章,内容包括: 绪论、语音信号处理的声学理论与模型、传统语音信号分析方法、现代语音信号处理方法、语音信号的参数估计、语音编码、语音增强、语音合成、语音识别、说话人识别、语音信号中的情感信息处理。另外,在本书的每章中都加入了复习题,供读者思考。 本书可作为高等院校计算机应用、信号与信息处理、通信与信息系统等专业的高年级本科生、研究生教材,同时也可供语音信号处理等领域的工程技术人员参考。

目录


第1章绪论 1.1语音信号处理的发展历史 1.1.1经典语音信号处理技术 1.1.2新兴的语音信号处理技术 1.2语音信号处理的研究内容 1.3本书的结构 第2章语音信号处理的声学理论与模型 2.1概述 2.2语音信号处理的声学基础 2.2.1语音的产生 2.2.2语音信号的感知 2.2.3掩蔽效应 2.3语音生成的数学模型 2.3.1激励模型 2.3.2声道模型 2.3.3辐射模型 2.4语音信号的特性分析 2.4.1语音信号的时域波形和频谱特性 2.4.2语音信号的语谱图 2.4.3语音信号的统计特性 2.5语音学基本概念 2.5.1语音学 2.5.2语音的分类及其声学特征 2.5.3汉语语音学 2.6小结 复习思考题 第3章传统语音信号分析方法 3.1概述 3.2语音信号数字化和预处理 3.2.1数字化 3.2.2预处理 3.3端点检测 3.3.1双门限法 3.3.2相关法的端点检测 3.3.3能零比双门限法 3.4语音信号的时域分析 3.4.1短时能量及短时平均幅度分析 3.4.2短时过零率分析 3.4.3短时相关分析 3.4.4短时平均幅度差函数 3.5语音信号的频域分析 3.5.1利用短时傅里叶变换求语音的短时谱 3.5.2语音的短时谱的临界带特征矢量 3.6语音信号的线性预测(LPC)分析 3.6.1线性预测分析的基本原理 3.6.2线性预测方程组的求解 3.6.3LPC谱估计和LPC复倒谱 3.6.4线谱对(LSP)分析 3.7小结 复习思考题 第4章现代语音信号处理方法 4.1概述 4.2同态信号处理 4.2.1同态信号处理的基本原理 4.2.2语音信号的复倒谱 4.2.3语音信号两个卷积分量的复倒谱 4.2.4语音信号倒谱分析实例 4.3小波变换 4.3.1小波变换的基本原理 4.3.2常用小波函数的介绍 4.3.3小波基和分解层数的选择 4.3.4语音信号小波变换分析实例 4.4Teager能量操作 4.4.1连续时间和离散时间的能量操作 4.4.2连续时间和离散时间的能量分离(ESA) 4.4.3语音信号Teager能量算子分析实例 4.5希尔伯特黄变换 4.5.1希尔伯特黄变换的起源 4.5.2经验模式分解 4.5.3希尔伯特黄变换的时频谱 4.6经验小波变换 4.6.1经验小波的定义 4.6.2傅里叶频谱划分 4.6.3窗的选取 4.6.4经验小波变换及其改进算法 4.6.5语音信号经验小波变换分析实例 4.7小结 复习思考题 第5章语音信号的参数估计 5.1概述 5.2基音周期估计 5.2.1基音周期估计分类 5.2.2基于自相关的基音周期估计 5.2.3基于平均幅度差函数(AMDF)的基音周期估计 5.2.4基于倒谱法(CEP)的基音周期估计 5.2.5基于简化的逆滤波跟踪(SIFT)的基音周期估计 5.2.6基于小波变换的基音周期估计 5.2.7基于倒谱和希尔伯特黄变换的基音周期估计 5.2.8基于系综经验模式分解的动态基音周期估计 5.2.9基于系综经验模式分解和倒谱法的基音周期估计 5.2.10基音周期估计的后处理 5.3共振峰估计 5.3.1传统的共振峰估计方法 5.3.2基于希尔伯特黄变换的汉语共振峰估计 5.4梅尔频率倒谱系数 5.4.1梅尔滤波器组 5.4.2MFCC特征参数提取 5.5小结 复习思考题 第6章语音编码 6.1概述 6.2语音信号压缩编码的原理 6.2.1语音编码分类 6.2.2语音压缩的基本原理 6.3语音编码的关键技术 6.3.1线性预测 6.3.2合成分析法(AnalysisBySynthesis) 6.3.3感觉加权滤波器 6.4语音编码的性能指标和评测方法 6.4.1主观评价 6.4.2客观评价 6.5语音信号的波形编码 6.5.1脉冲编码调制(PCM) 6.5.2自适应预测编码(APC) 6.5.3自适应增量调制(ADM) 6.5.4自适应差分脉冲编码调制(ADPCM) 6.5.5子带编码(SBC) 6.5.6自适应变换编码(ATC) 6.6语音信号的参数编码 6.6.1线性预测声码器 6.6.2LPC10编码器 6.7语音信号的混合编码 6.8现代通信中的语音信号编码方法 6.8.1EVS编码器概述 6.8.2EVS编码器设计指标 6.8.3EVS编码涉及的关键技术 6.8.4EVS编码器评价 6.9小结 复习思考题 第7章语音增强 7.1概述 7.2语音特性、人耳感知特性 7.2.1语音特性 7.2.2人耳感知特性 7.3传统语音增强技术 7.3.1基于滤波法的语音增强技术 7.3.2基于减谱法的语音增强技术 7.3.3基于Weiner滤波法的语音增强技术 7.3.4基于模型的语音增强技术 7.3.5基于听觉掩蔽的语音增强技术 7.3.6基于时域处理的语音增强技术 7.4现代语音增强技术 7.4.1基于非负矩阵分解的语音增强技术 7.4.2基于DNN频谱映射的语音增强技术 7.5小结 复习思考题 第8章语音合成 8.1概述 8.2共振峰合成法 8.3线性预测合成法 8.4神经网络语音合成法 8.5语音合成专用硬件简介 8.6PSOLA算法合成语音 8.7文语转换系统(TTS) 8.7.1文语转换系统的组成 8.7.2连读语音的韵律特性 8.7.3文本分析方法 8.7.4语音合成方法 8.7.5语音合成中的韵律控制 8.8小结 复习思考题 第9章语音识别 9.1概述 9.2语音识别原理和识别系统的组成 9.2.1预处理和参数分析 9.2.2语音识别 9.2.3语音识别系统的基本数据库 9.3动态时间规整(DTW) 9.4孤立字(词)识别系统 9.4.1基于MQDF的汉语塞音语音识别系统 9.4.2基于概率尺度DP识别方法的孤立字(词)识别系统 9.5连续语音识别系统 9.5.1声学基元模型 9.5.2系统语言模型 9.5.3句法分析和单词的预测方法 9.6连续语音识别系统的性能评测 9.6.1连续语音识别系统的评测方法以及系统复杂性和识别能力的测度 9.6.2综合评估连续语音识别系统时需要考虑的其他因素 9.7基于DNNHMM的语音识别系统 9.8小结 复习思考题 第10章说话人识别 10.1概述 10.2说话人识别方法和系统结构 10.2.1预处理 10.2.2说话人识别的特征提取 10.2.3特征参量评价方法 10.2.4模式匹配方法 10.2.5说话人识别中判别方法和阈值的选择 10.2.6说话人识别系统的评价 10.3应用DTW的说话人确认系统 10.4应用VQ的说话人识别系统 10.5应用HMM的说话人识别系统 10.5.1基于HMM的与文本有关的说话人识别 10.5.2基于HMM的与文本无关的说话人识别 10.5.3基于HMM的指定文本型说话人识别 10.5.4说话人识别HMM的学习方法 10.5.5鲁棒的HMM说话人识别技术 10.6应用GMM的说话人识别系统 10.6.1GMM模型的基本概念 10.6.2GMM模型的参数估计 10.6.3训练数据不充分的问题 10.6.4GMM模型的识别问题 10.6.5应用GMM和BP网络的说话人识别系统 10.7应用深度学习的说话人识别 10.7.1基于DNNUBM模型的说话人识别 10.7.2说话人识别中的embeddings特征 10.8说话人识别中尚需进一步探索的研究课题 10.8.1基础性的课题 10.8.2实用性的问题 10.9语种辨识的原理和应用 10.9.1语种辨识的基本原理和方法 10.9.2语种辨识的应用领域 10.10小结 复习思考题 第11章语音信号中的情感信息处理 11.1概述 11.2语言信号中的情感分类和情感特征分析 11.2.1语音情感识别系统模型 11.2.2语音信号中的情感分类 11.2.3语料库 11.2.4语音情感特征分析 11.2.5语音情感识别特征分析方法 11.3基于融合特征的语音情感识别方法 11.3.1特征提取 11.3.2分类器 11.3.3仿真实验 11.4基于LSTM的语音情感识别方法 11.4.1LSTM实现原理 11.4.2应用LSTM的语音情感识别 11.4.3仿真实验 11.5基于CNN的语音情感识别方法 11.5.1卷积神经网络(CNN) 11.5.2基于CNN的语音情感识别模型 11.5.3仿真实验 11.6小结 复习思考题 汉英名词术语对照
展开全部

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航