×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
暂无评论
图文详情
  • ISBN:9787522619026
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:29cm
  • 页数:180页
  • 出版时间:2023-10-01
  • 条形码:9787522619026 ; 978-7-5226-1902-6

本书特色

《语音识别理论与实践(普通高等教育人工智能专业系列教材)》特色: 精选内容 系统介绍语音识别原理及相关应用,突出研究热点。 配合实战 结合语音识别模式和问答模型构建语音交互系统,理论结合实践。 配套资源 配有微课视频,读者可扫码观看学习。

内容简介

本书主要介绍语音识别原理及其相关应用。全书共9章,分为五大部分: 部分( 章)介绍语音识别的发展历史和语音识别领域常用的数据集与工具箱;第二部分(第2章)介绍在语音识别领域常用的语音信号基础知识和声学特征的提取;第三部分(第3章至第7章)详细介绍语音识别的声学模型、语言模型、解码工具,并对语音识别领域的研究热点(端到端语音识别)进行探讨;第四部分(第8章)利用语音识别开源工具包Kaldi进行语音识别实战,包括Kaldi的安装以及如何训练aishell语音识别工程;第五部分(第9章)结合序列到序列的语音识别模型和序列到序列的问答模型来构建语音交互系统。

目录

前言 第1章 绪论 1.1 语音识别简史 1.1.1 语音识别早期探索 1.1.2 概率模型一统江湖 1.1.3 神经网络异军突起 1.1.4 商业应用推波助澜 1.2 国内发展现状 1.3 语音识别框架 1.3.1 经典方法 1.3.2 概率模型 1.3.3 深度神经网络-隐马尔可夫(DNN-HMM)模型 1.3.4 端到端语音识别 1.4 开源工具与数据集 1.4.1 深度学习框架 1.4.2 开源工具 1.4.3 数据集 本章小结 课后习题 第2章 语音基础知识 2.1 语音信号基础 2.1.1 声波的特性 2.1.2 声音的采集装置 2.1.3 声音的采样 2.1.4 声音的量化 2.1.5 语音的编码 2.2 声学特征提取 2.2.1 预处理 2.2.2 傅里叶变换 2.2.3 听觉特性 2.2.4 线性预测 2.2.5 倒谱分析 2.2.6 声学特征 本章小结 课后习题 第3章 声学模型 3.1 高斯混合模型 3.1.1 概率统计 3.1.2 高斯分布 3.1.3 GMM的组成和表示 3.2 隐马尔可夫模型 3.2.1 隐马尔可夫模型基本概念 3.2.2 隐马尔可夫模型的定义 3.2.3 隐马尔可夫模型的三个基本问题 3.3 高斯混合模型-隐马尔可夫模型 3.4 基于隐马尔可夫模型的语音识别 3.4.1 建模单元 3.4.2 发音过程与隐马尔可夫模型状态 3.4.3 串接隐马尔可夫模型 本章小结 课后习题 第4章 语言模型 4.1 n-gram模型 4.2 评价指标 4.3 平滑技术 4.3.1 Good-Turing折扣法 4.3.2 Jelinek-Mercer插值法 4.3.3 Kneser-Ney插值法 4.3.4 Katz回退法 4.4 语言模型的训练 4.5 预训练语言模型 4.5.1 基于自回归语言模型的预训练技术 4.5.2 基于自编码语言模型的预训练技术 4.5.3 基于序列到序列语言模型的预训练技术 4.5.4 基于前缀语言模型的预训练技术 4.5.5 基于排列语言模型的预训练技术 4.5.6 预训练技术的改进方法 本章小结 课后习题 第5章 加权有限状态解码器 5.1 基于动态网络的Viterbi解码 5.2 加权有限状态转换器理论 5.2.1 基本概念 5.2.2 半环 5.3 HCLG构建 5.3.1 语料准备 5.3.2 构建语法模型 …… 第6章 深度神经网络模型 第7章 端到端语音识别 第8章 Kaldi实战 第9章 语音交互系统 参考文献 附录 课后习题答案
展开全部

作者简介

莫宏伟,哈尔滨工程大学自动化学院教授,2005年3月获得工学博士学位;哈尔滨工程大学自动化学院类脑计算与人工智能研究中心主任、哈尔滨工程大学人工智能研究院副院长、哈尔滨工程大学烟台研究院人工智能与海洋信息实验室主任;主要研究方向:类脑计算与人工智能、智能机器人与无人机、机器学习与机器视觉、人机融合与人体增强;2012年获得黑龙江省杰出青年基金资助,承担完成国家自然科学基金、国防预研等项目20项,发表论文80余篇,出版专著6部,教材5部,授权发明专利9项。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航