- ISBN:9787300277387
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:128开
- 页数:192
- 出版时间:2020-02-01
- 条形码:9787300277387 ; 978-7-300-27738-7
本书特色
语音技术的进步使科幻电影中人机对话的场景正在逐渐走进现实生活。我们生活中用到的智能手机、电脑、音箱以及汽车等很多设备和工具都已经配备了语音界面,我们经常在商场里看到的导购机器人或者玩具机器人,也支持人机对话,支持用户语音搜索或者下达指令。
语音界面看似简单,但其开发却蕴含着很多我们意想不到的问题和困难。《语音界面冲击》这本书将带领我们全面了解:
语音界面的历史;
语音界面的现状及未来;
语音界面的功能、优势和特点;
需要使用何种技术才能实现语音界面;
语音界面面临的课题和问题;
实现“语音交互”以及人机对话面临哪些障碍;语音技术的进步使科幻电影中人机对话的场景正在逐渐走进现实生活。我们生活中用到的智能手机、电脑、音箱以及汽车等很多设备和工具都已经配备了语音界面,我们经常在商场里看到的导购机器人或者玩具机器人,也支持人机对话,支持用户语音搜索或者下达指令。
语音界面看似简单,但其开发却蕴含着很多我们意想不到的问题和困难。《语音界面冲击》这本书将带领我们全面了解:
语音界面的历史;
语音界面的现状及未来;
语音界面的功能、优势和特点;
需要使用何种技术才能实现语音界面;
语音界面面临的课题和问题;
实现“语音交互”以及人机对话面临哪些障碍;
语音界面的商业用途;
…………
语音界面的商用前景也令人憧憬。语音经济的规模将会超过移动应用。据预测,仅仅在美国和英国,语音电商的规模就将从2018年的20亿美元增长至2022年的400亿美元。语音技术创业公司的数量和融资规模也在飞速上升。未来,我们将看到人机互动的另一种无限可能。
内容简介
语音科技——下一个颠覆者,通向人工智能时代的一把秘钥
未来10年,语音科技会成为*决定性的主题之一。人机对话能力将迎来变革性进展,语音也将成为*主要的人机互动方式。语音科技在商业上的应用,将会引领我们进入一个奇异的新世界,而我们不需要任何训练就可以完美适应。
通过语音搜索、购物、下单;
向语音助手倾诉烦恼并得到贴心的安慰;
成功时得到语音助手*真诚的祝贺;
系统可以听令行事,我们不必在键盘或触摸屏一点点输入文字;
…………
这些场景离我们并不遥远。语音界面能解放双手,用声音识别彻底改变产品搜索、购物体验,使虚拟伴侣变成现实……
语音技术也是实现人工智能的基石,它在不断地变化升级。随着语音的采集、识别、合成技术越来越先进,语音界面带给我们的未来将远远超乎想象,它将打通通往人工智能未来的又一扇大门。
目录
时代在语言中流转 / 002
哆啦 A 梦的神奇道具成为现实 / 003
语音免触成为快捷方式 / 004
Chatbot 已经开始实际应用 / 005
语音界面变身“传话游戏” / 006
不能和平时一样说话 / 007
留言电话登记的表达问题 / 007
AI 技术助力语音交互的进化 / 008
第 2 章 语音界面的历史
早期语音交互系统“VOYAGER” / 010
2011 年 iPhone 开始支持“Siri” / 011
物理 UI-CUI-GUI- 手势 UI- 语音 UI / 012
AI 和语音——剪不断的关系 / 013
智能音箱和仿生机器人的出现 / 014
语音界面走进银行和零售店 / 015
小结 / 015
第 3 章 语音界面的特点与优势
减少文字输入时间 / 019
方便快捷(减少步骤)/ 020
免触操作(同时操作)/ 022
操作姿势自由 / 023
支持附加条件指令 / 023
支持模糊表达 / 024
创造人机对话价值体验 / 025
支持反映感情和心理状况 / 026
受文化和语言差异的影响 / 027
符合人类认知水平的媒介 / 028
第 4 章 支持语音界面的商品
语音界面的六个基本功能 / 032
除六大基本功能外的其他功能 / 034
智能音箱 / 039
Alexa Skill 扩展 Echo 功能 / 043
AI 机器人 / 047
支持语音辨认功能的智能家电 / 053
游戏机 / 055
其他 / 060
小结 / 0613
第 5 章 语音界面技术
采音信号处理 / 065
语音识别 / 067
语义理解 / 069
对话应答 / 对话生成 / 073
语音合成 / 077
小结 / 078
第 6 章 语音界面面临的问题
语音界面是一场传话游戏 / 082
何时说?说什么?怎么说? / 084
不明现状的问题 / 086
尚不准确的语音识别 / 088
说话也费力 / 089
语音操作手法单一 / 090
唤醒词太俗气 / 092
不自然的自然表达问题 / 095
对发声环境的依赖 / 099
发声前间隔过长 / 100
语音输入无法处理中断和取消 / 101
小结 / 104
第 7 章 语音助手 / 机器人语音界面“对话”
“会话”和“对话”的区别 / 109
任务型和非任务型 / 1114
语音界面冲击
所谓聊天 / 113
会话的分类 / 116
报告型会话较多的原因 / 118
谈话内容无聊的原因 / 121
自然对话(谈话)必要的六大要素 / 123
会话方案 / 130
对话表现 / 132
交互作用分析 / 142
违和感:儿童角色口出术语 / 145
语音界面和对话中的语言文化差异 / 145
恐怖谷现象与对话 / 149
小结 / 151
第 8 章 语音界面商业势力图
语音识别技术开发企业 / 154
语音合成技术开发企业 / 157
语音界面解决方案供应企业 / 158
小结 / 163
第 9 章 语音界面的未来
语音界面尚在起步阶段 / 166
语音商业的未来 / 166
对话商业未来 / 172
面向自然对话时代 / 174
小结 / 175
作者简介
Neoma设计公司董事长,beyondUX设计者、创意总监和IT顾问。横滨国立大学毕业后进入索尼公司,从事用户界面、网络、空间等的研究开发。担任使用触摸、手势、语音识别人机交互开发小组组长。随后,在索尼集团内建立了首个语音UX设计团队,负责制作了PlayStation4的语音UI,也带头启动了以语音对话和AI为基础的新一代家电项目。
2014年成立Neoma 设计公司。从事语音UI/UX设计的咨询和研发工作,同时参与健身俱乐部的空间制造、主题公园人机交互,以及互动数字显示屏的设计。
-
AI绘画+AI摄影+AI短视频从入门到精通
¥45.5¥79.8 -
企业AI之旅
¥43.5¥79.0 -
乡村振兴新技术:新时代农村短视频编辑技术基础入门
¥12.8¥32.0 -
机器学习
¥59.4¥108.0 -
基于知识蒸馏的图像去雾技术
¥61.6¥88.0 -
智能算法优化及其应用
¥52.4¥68.0 -
Photoshop图像处理
¥25.5¥49.0 -
R语言医学数据分析实践
¥72.3¥99.0 -
大模型推荐系统:算法原理、代码实战与案例分析
¥62.3¥89.0 -
剪映 从入门到精通
¥25.7¥59.8 -
游戏造梦师----游戏场景开发与设计
¥67.6¥98.0 -
SAR图像处理与检测
¥35.4¥49.8 -
人工智能
¥29.4¥42.0 -
中文版PHOTOSHOP 2024+AI修图入门教程
¥59.3¥79.0 -
WPS办公软件应用
¥25.2¥36.0 -
格拉斯曼流行学习及其在图像集分类中的应用
¥13.7¥28.0 -
轻松上手AIGC:如何更好地向CHATGPT提问
¥40.3¥62.0 -
元宇宙的理想与现实:数字科技大成的赋能与治理逻辑
¥61.6¥88.0 -
云原生安全:攻防与运营实战
¥66.8¥89.0 -
生成式AI入门与AWS实战
¥69.9¥99.8