- ISBN:9787121455445
- 装帧:平塑
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:440
- 出版时间:2023-05-01
- 条形码:9787121455445 ; 978-7-121-45544-5
内容简介
本书系统介绍了语音信号处理的基础、原理、方法、应用、新理论、新成果与新技术、前沿领域及研究进展,以及背景知识、研究现状、应用前景和发展趋势。全书分三篇共18章。**篇语音信号处理基础,包括第1章绪论,第2章语音信号处理的基础知识;第二篇语音信号分析,包括第3章时域分析,第4章短时傅里叶分析,第5章倒谱分析与同态滤波,第6章线性预测分析,第7章语音信号的非线性分析,第8章语音声学参数检测与估计,第9章矢量量化,第10章隐马尔可夫模型;第三篇语音信号处理技术与应用,包括第11章语音编码,第12章语音合成,第13章语音识别,第14章说话人识别和语种辨识,第15章智能信息处理技术在语音信号处理中的应用,第16章语音增强,第17章麦克风阵列语音信号处理,第18章语音信息对抗。本书体系完整,结构严谨,系统性强,原理阐述透彻,内容繁简适中,丰富而新颖,联系实际应用。本书可作为高等院校信号与信息处理、通信与电子工程、电路与系统、模式识别与人工智能等专业及学科高年级本科生及研究生的教材,也可供该领域的科研及工程技术人员参考。
目录
篇 语音信号处理基础
第1章 绪论 1
1.1 语音信号处理的发展历史 1
1.2 语音信号处理的主要研究内容及
发展概况 3
1.3 本书的内容 7
思考与复习题 8
第2章 语音信号处理的基础知识 9
2.1 概述 9
2.2 语音产生的过程 9
2.3 语音信号的特性 12
2.3.1 语言和语音的基本特性 12
2.3.2 语音信号的时间波形和频谱特性 13
2.3.3 语音信号的统计特性 15
2.4 语音产生的线性模型 16
2.4.1 激励模型 17
2.4.2 声道模型 18
2.4.3 辐射模型 20
2.4.4 语音信号数字模型 20
2.5 语音产生的非线性模型 21
2.5.1 FM-AM模型的基本原理 22
2.5.2 Teager能量算子 22
2.5.3 能量分离算法 23
2.5.4 FM-AM模型的应用 24
2.6 语音感知 24
2.6.1 听觉系统 24
2.6.2 神经系统 25
2.6.3 语音感知 26
思考与复习题 29
第二篇 语音信号分析
第3章 时域分析 30
3.1 概述 30
3.2 数字化和预处理 31
3.2.1 取样率和量化字长的选择 31
3.2.2 预处理 33
3.3 短时能量分析 34
3.4 短时过零分析 36
3.5 短时相关分析 39
3.5.1 短时自相关函数 39
3.5.2 修正的短时自相关函数 40
3.5.3 短时平均幅差函数 41
3.6 语音端点检测 42
3.6.1 双门限前端检测 43
3.6.2 多门限过零率前端检测 43
3.6.3 基于FM-AM模型的端点检测 43
3.7 基于高阶累积量的语音端点检测 44
3.7.1 噪声环境下的端点检测 44
3.7.2 高阶累积量与高阶谱 44
3.7.3 基于高阶累积量的端点检测 46
思考与复习题 48
第4章 短时傅里叶分析 50
4.1 概述 50
4.2 短时傅里叶变换 50
4.2.1 短时傅里叶变换的定义 50
4.2.2 傅里叶变换的解释 51
4.2.3 滤波器的解释 54
4.3 短时傅里叶变换的取样率 55
4.4 语音信号的短时综合 56
4.4.1 滤波器组求和法 56
4.4.2 FFT求和法 58
4.5 语谱图 59
思考与复习题 61
第5章 倒谱分析与同态滤波 62
5.1 概述 62
5.2 同态信号处理的基本原理 62
5.3 复倒谱和倒谱 63
5.4 语音信号两个卷积分量复倒谱的性质 64
5.4.1 声门激励信号 64
5.4.2 声道冲激响应序列 65
5.5 避免相位卷绕的算法 66
5.5.1 微分法 67
5.5.2 小相位信号法 67
5.5.3 递推法 69
5.6 语音信号复倒谱分析实例 70
5.7 Mel频率倒谱系数 72
思考与复习题 73
第6章 线性预测分析 74
6.1 概述 74
6.2 线性预测分析的基本原理 74
6.2.1 基本原理 74
6.2.2 语音信号的线性预测分析 75
6.3 线性预测方程组的建立 76
6.4 线性预测分析的解法(1)—自相关和
协方差法 77
6.4.1 自相关法 78
6.4.2 协方差法 79
6.4.3 自相关和协方差法的比较 80
6.5 线性预测分析的解法(2)—格型法 81
6.5.1 格型法基本原理 81
6.5.2 格型法的求解 83
6.6 线性预测分析的应用—LPC谱估计和
LPC复倒谱 85
6.6.1 LPC谱估计 85
6.6.2 LPC复倒谱 87
6.6.3 LPC谱估计与其他谱分析方法的
比较 88
6.7 线谱对(LSP)分析 89
6.7.1 线谱对分析原理 89
6.7.2 线谱对参数的求解 91
6.8 极零模型 91
思考与复习题 93
第7章 语音信号的非线性分析 94
7.1 概述 94
7.2 时频分析 94
7.2.1 短时傅里叶变换的局限 95
7.2.2 时频分析 96
7.3 小波分析 97
7.3.1 概述 97
7.3.2 小波变换的定义 97
7.3.3 典型的小波函数 99
7.3.4 离散小波变换 100
7.3.5 小波多分辨分析与Mallat算法 100
7.4 基于小波的语音分析 101
7.4.1 语音分解与重构 101
7.4.2 清/浊音判断 102
7.4.3 语音去噪 102
7.4.4 听觉系统模拟 103
7.4.5 小波包变换在语音端点检测中的应用 103
7.5 混沌与分形 104
7.6 基于混沌的语音分析 105
7.6.1 语音信号的混沌性 105
7.6.2 语音信号的相空间重构 106
7.6.3 语音信号的Lyapunov指数 108
7.6.4 基于混沌的语音、噪声判别 109
7.7 基于分形的语音分析 110
7.7.1 概述 110
7.7.2 语音信号的分形特征 110
7.7.3 基于分形的语音分割 111
7.8 压缩感知 113
7.9 语音信号的压缩感知 114
7.9.1 语音信号的稀疏性 114
7.9.2 语音压缩感知的实现 114
7.9.3 需要进一步解决的问题 116
思考与复习题 117
第8章 语音声学参数检测与估计 118
8.1 基音估计 118
8.1.1 自相关法 119
8.1.2 并行处理法 121
8.1.3 倒谱法 122
8.1.4 简化逆滤波法 124
8.1.5 高阶累积量法 127
8.1.6 小波变换法 127
8.1.7 基音检测的后处理 128
8.2 共振峰估计 129
8.2.1 带通滤波器组法 129
8.2.2 DFT法 130
8.2.3 倒谱法 131
8.2.4 LPC法 133
8.2.5 FM-AM模型法 134
思考与复习题 135
第9章 矢量量化 136
9.1 概述 136
9.2 矢量量化的基本原理 137
9.3 失真测度 138
9.3.1 欧氏距离—均方误差 139
9.3.2 LPC失真测度 139
9.3.3 识别失真测度 141
9.4 矢量量化器和码本的设计 141
9.4.1 矢量量化器设计的两个条件 141
9.4.2 LBG算法 142
9.4.3 初始码书生成 142
9.5 降低复杂度的矢量量化系统 143
9.5.1 无记忆的矢量量化系统 144
9.5.2 有记忆的矢量量化系统 146
9.6 语音参数的矢量量化 148
9.7 智能信息处理在矢量量化中的应用策略 149
思考与复习题 150
第10章 隐马尔可夫模型 151
10.1 概述 151
10.2 隐马尔可夫模型的引入 152
10.3 隐马尔可夫模型的定义 154
10.4 隐马尔可夫模型三个问题的求解 155
10.4.1 概率的计算 156
10.4.2 HMM的识别 158
10.4.3 HMM的训练 159
10.4.4 EM算法 160
10.5 HMM的选取 161
10.5.1 HMM的类型选择 161
10.5.2 输出概率分布的选取 162
10.5.3 状态数的选取 162
10.5.4 初值选取 162
10.5.5 训练准则的选取 164
10.6 HMM应用与实现中的一些问题 165
10.6.1 数据下溢 165
10.6.2 多输出(观察矢量序列)情况 165
10.6.3 训练数据不足 166
10.6.4 考虑状态持续时间的HMM 167
10.7 HMM的结构和类型 169
10.7.1 HMM的结构 169
10.7.2 HMM的类型 171
10.7.3 按输出形式分类 172
10.8 HMM的相似度比较 173
思考与复习题 174
第三篇 语音信号处理技术与应用
第11章 语音编码 175
11.1 概述 175
11.2 语音信号的压缩编码原理 177
11.2.1 语音压缩的基本原理 177
11.2.2 语音通信中的语音质量 178
11.2.3 两种压缩编码方式 179
11.3 语音信号的波形编码 179
11.3.1 PCM及APCM 179
11.3.2 预测编码及自适应预测编码 182
11.3.3 ADPCM及ADM 184
11.3.4 子带编码(SBC) 186
11.3.5 自适应变换编码(ATC) 188
11.4 声码器 190
11.4.1 概述 190
11.4.2 声码器的基本结构 191
11.4.3 通道声码器 191
11.4.4 同态声码器 193
11.5 LPC声码器 194
11.5.1 LPC参数的变换与量化 195
11.5.2 LPC-10 196
11.5.3 LPC-10e 197
11.5.4 变帧率LPC声码器 198
11.6 各种常规语音编码方法的比较 198
11.6.1 波形编码的信号压缩技术 198
11.6.2 波形编码与声码器的比较 199
11.6.3 各种声码器的比较 199
11.7 基于LPC模型的混合编码 200
11.7.1 混合编码采用的技术 201
11.7.2 MPLPC 203
11.7.3 RPELPC 206
11.7.4 CELP 207
11.7.5 CELP的改进形式 210
11.7.6 基于分形码本的CELP 212
11.8 基于正弦模型的混合编码 213
11.8.1 正弦变换编码 214
11.8.2 多带激励(MBE)编码 214
11.9 极低速率语音编码 216
11.9.1 (400~1.2k)b/s数码率的声码器 216
11.9.2 识别-合成型声码器 217
11.10 语音压缩感知编码 218
11.11 语音编码的性能指标 219
11.12 语音编码的质量评价 220
11.12.1 主观评价方法 221
11.12.2 客观评价方法 222
11.12.3 主客观评价方法的结合 225
11.12.4 基于多重分形的语音质量评价 226
11.13 语音编码国际标准 227
11.14 语音编码与图像编码的关系 227
小结 228
思考与复习题 229
第12章 语音合成 230
12.1 概述 230
12.2 语音合成原理 231
12.2.1 语音合成的方法 231
12.2.2 语音合成的系统特性 233
12.3 共振峰合成 233
12.3.1 共振峰合成原理 233
12.3.2 共振峰合成实例 235
12.4 LPC合成 236
12.5 PSOLA语音合成 238
12.5.1 概述 238
12.5.2 PSOLA的原理 238
12.5.3 PSOLA的实现 239
12.5.4 PSOLA的改进 241
12.5.5 PSOLA语音合成系统的发展 241
12.6 文语转换系统 242
12.6.1 组成与结构 242
12.6.2 文本分析 242
12.6.3 韵律控制 244
12.6.4 语音合成 246
12.6.5 TTS系统的一些问题 247
12.7 基于HMM的参数化语音合成 248
12.8 语音合成的发展趋势 252
12.9 语音合成硬件简介 253
思考与复习题 254
第13章 语音识别 255
13.1 概述 255
13.2 语音识别原理 258
13.3 动态时间规整 262
13.4 基于有1
作者简介
胡航,哈尔滨工业大学电子信息学院,副教授,主要从事信号处理方面的教学、科研工作,编著出版《语音信号处理》等教材多部,
-
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
落洼物语
¥8.7¥28.0 -
中国当代文学名篇选读
¥19.1¥53.0 -
中医基础理论
¥50.7¥59.0 -
北大人文课(平装)
¥13.9¥45.0 -
外国教育史-第2版
¥24.4¥40.0 -
宪法-第二版
¥12.2¥29.0 -
当代中国政府与政治 第二版
¥57.8¥68.0 -
EPLAN电气设计
¥29.9¥39.8 -
闯进数学世界――探秘历史名题
¥21.3¥32.8 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
金融学
¥29.9¥49.0 -
计算机操作系统教程(第4版)(清华大学计算机系列教材)
¥31.9¥49.0 -
三国史
¥27.5¥50.0 -
飞机总体设计
¥46.8¥78.0 -
古代汉语(第四册)
¥16.1¥35.0 -
编辑审稿实务教程
¥35.1¥45.0 -
管理学:原理与方法(第7版)(博学.大学管理类)/周三多
¥30.9¥49.0 -
(平装)北大必修课:北大口才课
¥12.2¥45.0