- ISBN:9787567146549
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:32开
- 页数:223
- 出版时间:2023-01-01
- 条形码:9787567146549 ; 978-7-5671-4654-9
内容简介
人类语言具有结构性,非常明显的体现是句法结构。理解语言离不开对句法结构的分析。因此,自动句法分析作为自然语言处理的基础性工作,是通往语言理解的基石,很多复杂的自然语言处理任务都需要建立在一定程度的句法分析基础之上。 自然语言处理研究认为两种名词短语有重要价值,一种是基本名词短语,一种是**名词短语。相比较而言,后者不仅长度大,所合成分与结构也更复杂多样。作为名词短语的一种动态类型,汉语**名词短语占据了一半以上的句长比例,识别出它们就可以快速地掌握句子的基本骨架,不仅有助于完全句法分析,也对机器翻译、信息抽取等多种任务具有很高的应用价值。 **名词短语识别工作虽然取得了一定的进展,但距离令人满意的效果还有不小的差距,从而对各种应用系统的支持也受到限制。目前主流的**名词短语识别方法是统计机器学习方法,通过词语位置分类和序列标注实现短语识别,大大提高了正确率和召回率,但也遇到了增长瓶颈。打破这一瓶颈,需要我们深入研究**名词短语的结构和分布规律,提出新的识别策略、方法和有效特征。 《汉语**名词短语识别研究》从理论定义、分布描写、识别方法等角度对**名词短语识别工作进行系统的探讨。首先,通过层次构造、长度约束、名词性认定和外延范围的认定,界定了一种新的多层级**名词短语。其次,从句法功能、句法结构和线性特征等角度细致地描写**名词短语的分布规律,分析了其复杂性构造和识别难点问题。*后,基于分布规律制定合适的识别策略和方法,选取有效的识别特征,并分类进行识别实验。
目录
**节 汉语自动句法分析的难点问题
第二节 多视域下的*长名词短语研究
第三节 *长名词短语研究的方法与资源
第四节 本书的主要内容与特色
第二章 名词短语识别的相关研究综述
**节 名词短语研究
第二节 组块分析研究
第三节 搭配获取研究
第三章 理论基础与*长名词短语的界定
**节 汉语短语的分类框架
第二节 语言组块理论
第三节 *长名词短语的界定
第四章 *长名词短语的分布调查与分析
**节 *长名词短语的抽取
第二节 句法功能与外部邻接
第三节 句法结构与内部构成
第四节 复杂性与MNP构造
第五节 识别策略的确定
第五章 表层*长名词短语的识别
**节 统计机器学习模型及其选用
第二节 基于基本名词短语归约的识别
第三节 基于分类器集成的识别
第六章 内层*长名词短语的识别
**节 层级构造
第二节 识别难点分析
第三节 识别策略的确定
第四节 多层级的iMNP识别
第五节 基于规则的修正
第七章 *长名词短语识别工作的反思与展望
**节 研究工作的反思
第二节 进一步的研究计划
参考文献
附录
附录1 清华汉语树库(TCT)词类标记集
附录2 清华汉语树库(TCT)句法功能标记集
附录3 清华汉语树库(TCT)句法结构标记集
附录4 CRF特征模板
附录5 动词配价词典示例
附录6 基本名词短语提升规则
-
蛤蟆先生去看心理医生
¥26.6¥38.0 -
咬文嚼字二百问
¥15.4¥32.0 -
世界尽头的咖啡馆
¥18.0¥45.0 -
字海探源
¥25.0¥78.0 -
从零开始的女性主义
¥30.3¥52.0 -
乡土中国
¥14.6¥26.0 -
与内心的恐惧对话:摆脱来自亲人的负能量
¥34.1¥48.0 -
《标点符号用法》解读
¥6.2¥15.0 -
中国人的精神
¥9.9¥29.0 -
社会学:原来这么有趣有用
¥9.1¥36.0 -
你能写出好故事-写作的诀窍.大脑的奥秘.认知的陷阱
¥16.4¥32.8 -
焦虑心理学:不畏惧、不逃避,和压力做朋友
¥11.4¥38.0 -
乌合之众:大众心理研究
¥12.1¥36.8 -
理解生命
¥10.5¥32.8 -
从白大褂到病号服:探索医疗中的人性落差
¥19.9¥39.8 -
非暴力沟通心理学 : 用非暴力沟通化解冲突
¥13.0¥36.0 -
上大演讲录(1922-1927卷)(九品)
¥14.0¥52.0 -
那时的大学
¥14.6¥28.0 -
乌合之众:群体心理研究
¥11.9¥39.8 -
始于极限:女性主义往复书简(八品)
¥40.7¥59.0