汉语口语语篇库:建构与标注:construction and annotation
- ISBN:9787520375696
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:24cm
- 页数:339页
- 出版时间:2021-03-01
- 条形码:9787520375696 ; 978-7-5203-7569-6
本书特色
语音数据库的建设是语音研究及语音识别、语音合成、口语对话系统、语音翻译、语音评测等诸多应用系统的重要基础。其中,语音数据的标注是语音数据库建设的核心。面向特定应用的语音数据的深度标注,往往体现了语音学和语言学的研究成果,是言语工程的*好结合点。本书旨在面向新一代语言认知智能技术,在语音学和语言学的研究成果基础上,对实际言语交际产生的口语语篇进行结构和功能的描述与表示,整合语音和自然语言处理领域的标注规范,建立汉语口语语篇的多层级标注规范。
内容简介
本书面向新一代语音认知智能技术,在语音学和其他语言学研究成果基础上,对口语语篇进行结构和功能的描述和表示(representation),建立汉语口语语篇的多层级标注规范,为语音研究和应用提供重要的理论和数据支撑。 本书适用于语音学、口语信息处理、语言教学等方向的学生、研究人员学习和研究,也可作为数据公司专业标注人员的参考资料。
目录
**节 语言与言语
第二节 复杂场景中口语语篇的特点
第三节 语音与语言资源建设
第四节 章节安排
第五节 致谢
第二章 术语与理论基础
**节 引用规范和基本术语
一 规范性引用文件
二 术语
第二节 语篇分析相关理论简述
一 语言学理论基础
二 互动语言学
三 言语行为理论
四 语境理论
五 话语标记
六 情感理论与情感表示
七 语调与韵律
第三节 汉语口语语篇研究
一 汉语语调
二 汉语口语语篇的多层级结构与标注体系
第四节 本章小结
第三章 语音库规范
**节 语音库的元数据
第二节 语音库制作
一 语音库规范的制定
二 语音库收集工作准备
三 语音库收集
四 后期处理
五 语音库标注
六 发音词典
七 文档
八 语料库评测
九 语音库分发
第三节 法律与伦理问题
第四节 本章小结
第四章 语音库的语音基础标注规范
**节 音字转写规范
第二节 汉语音段标注规范SAMPA
一 音段标注符号
二 音段层级标注
第三节 语音韵律标注
一 韵律标注原则
二 韵律标注系统
第四节 小结
第五章 面向自然口语语篇的依存语法标注
**节 依存语法简介
第二节 汉语依存语法相关研究
一 依存分析工具比较
二 两种标注体系比较
第三节 基于自然口语的依存语法标注
第六章 面向自然口语语篇的修辞结构标注
**节 修辞结构理论简介
一 修辞关系集定义
二 *小篇章单元的切分
三 标注工具
第二节 修辞关系集
一 英文修辞关系集
二 中文修辞关系集
第三节 基于自然口语的修辞结构标注
第四节 本章小结
第七章 基于互动意图的对话言语行为和情感标注
**节 发音人信息标注
第二节 话轮切分和话轮转换的功能标注
第三节 话语标记的功能分类与标注
第四节 功能语段切分
第五节 对话行为标注
一 对话行为标注的层级结构
二 对话行为标注格式
三 对话行为(DA)标注集
四 口语对话的应答交互行为标注规范
五 邻接对定义与标注
六 主题定义与标注
第六节 情感语音标注
第七节 标注实例
第八章 语音识别语料库RASC863
**节 背景
第二节 语音库制作过程和一般规范
第三节 方言口音普通话语音库RASC;863制作介绍
一 方言区和发音人
二 录音语料
三 录音设备和录音软件
四 数据存储
五 语料库标注规范
六 法律声明
七 语料库评价和分发规范
第四节 连续汉语语音识别语音库RASC863的朗读语料设计
一 三音子搭配模型及个数统计
二 语料挑选设计
三 挑选文本分析
第五节 RASC863语音标注规范
一 标注软件以及标注文件格式
二 语音标注内容
三 标注规范
第六节 即兴口语语言学单元统计
第七节 本章小结
第九章 具有深度言语信息标注的口语语篇库Discourse-CASS
**节 口语语篇库Discourse-CASS的基本信息
一 Discourse-CASS数据库采集方法
二 朗读语篇库(ASCCD)
三 自然口语对话库(CADCC)
四 各种真实场景对话库
第二节 基于Discourse-CASS多层级标注信息统计
一 不同场景对话语料基本信息
二 不同场景对话语料的基本语言学标注信息统计
三 不同场景对话中韵律单元统计
四 不同场景对话中各种语言学单元的时长统计
五 不同场景对话中言语行为功能与形式标注统计
六 不同场景对话情感态度标注统计
第三节 本章小结
附录
作者简介
李爱军,中国社会科学院语言研究所研究员,博士生导师。本硕、博士分别毕业于天津大学计算机系、日本北陆先端科学技术大学院大学信息科学院。现任《中国语音学报》主编,享受国务院特殊津贴,2010年被推选为“新世纪百千万人才”工程***人选,入选2019年文化名家暨“四个一批”人才。致力于跨学科的语音学研究,主持或参加了国家社科基金重大和重点项目、国家973和863项目、国家自然科学基金重点项目等。出版专著《情感语音的编码与解码:中日跨文化的多模态研究》(Encoding and Decoding of Emotional Speech: a Cross-Cultura and Multimodal Study between Chinese and Japanese,德国施普林格出版社2015年版),发表中英文论文上百篇。
-
蛤蟆先生去看心理医生
¥26.6¥38.0 -
咬文嚼字二百问
¥9.6¥32.0 -
世界尽头的咖啡馆
¥18.0¥45.0 -
字海探源
¥25.0¥78.0 -
从零开始的女性主义
¥30.3¥52.0 -
乡土中国
¥14.6¥26.0 -
与内心的恐惧对话:摆脱来自亲人的负能量
¥34.1¥48.0 -
《标点符号用法》解读
¥6.2¥15.0 -
中国人的精神
¥9.9¥29.0 -
社会学:原来这么有趣有用
¥9.1¥36.0 -
你能写出好故事-写作的诀窍.大脑的奥秘.认知的陷阱
¥9.8¥32.8 -
焦虑心理学:不畏惧、不逃避,和压力做朋友
¥11.4¥38.0 -
乌合之众:大众心理研究
¥12.1¥36.8 -
理解生命
¥10.5¥32.8 -
从白大褂到病号服:探索医疗中的人性落差
¥12.7¥39.8 -
非暴力沟通心理学 : 用非暴力沟通化解冲突
¥9.0¥36.0 -
上大演讲录(1922-1927卷)(九品)
¥14.0¥52.0 -
那时的大学
¥8.4¥28.0 -
乌合之众:群体心理研究
¥11.9¥39.8 -
始于极限:女性主义往复书简(八品)
¥22.4¥59.0