×
面向非结构化文本的知识发现-基于英汉双语平行语料库的句法级知识挖掘和抽取研究
读者评分
4分

面向非结构化文本的知识发现-基于英汉双语平行语料库的句法级知识挖掘和抽取研究

1星价 ¥28.1 (7.2折)
2星价¥28.1 定价¥39.0
图文详情
  • ISBN:9787516126035
  • 装帧:暂无
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:220
  • 出版时间:2013-06-01
  • 条形码:9787516126035 ; 978-7-5161-2603-5

本书特色

《面向非结构化文本的知识发现》从句法这一层面人手,基于面向网络获取的英汉双语平行语料这一非结构化数据。

内容简介

《面向非结构化文本的知识发现》结合自然语言处理和文本挖掘的相应技术,在情报学、语言学方法和知识的基础上,针对词汇、简单短语、复杂短语这三个句法层级上的知识挖掘和抽取问题进行了探究,揭示了词汇句法组合的呈现规律,构建了简单短语结构抽取的模型,挖掘了面向复杂短语的类别知识。

目录

**章 引言 一 课题提出 二 研究意义 三 研究方法 四 研究技术路线 五 研究创新点 六 本书结构和所用资源第二章 相关研究综述 一 面向网络获取相关英汉双语平行语料的概述 二 词汇句法功能分布的相关研究概况 三 短语结构知识抽取的相关研究综述 四 类别知识挖掘的相关研究第三章 面向网络的英汉双语平行语料库自动构建 一 确定获取语料网站和制定抓取词汇底表 二 网页的抓取和英汉双语平行语料的抽取第四章 词汇句法功能分布复杂度呈现规律的知识挖掘 一 词汇句法功能分布复杂度统计数据源简介和句法结构调整 二 词汇句法功能分布复杂度的获取 三 词汇句法功能分布复杂度的洛特卡现象揭示第五章 基于英汉双语平行语料库的短语结构知识抽取——以介宾短语结构为例 一 英汉双语介宾短语结构句法特征统计分析 二 有关介宾短语结构知识抽取模型构建的相关介绍和预处理 三 介宾短语结构知识抽取模型的确定和英汉双语介宾短语结构知识的抽取第六章 基于英汉双语平行语料库的复杂短语级类别知识挖掘 一 面向英汉双语专门复杂短语平行语料的聚类和词干或词形算法确定 二 语料的预处理和相关统计 三 面向英汉双语复杂短语平行语料的词性选择 四 基于英汉双语复杂短语平行语料的类别知识挖掘结语参考文献附录1 宾州大学英语树库的词性标记附录2 宾州大学汉语树库的词性标记附录3 清华大学树库词性标记附录4 汉语自身特征模板附录5 英语自身特征模板附录6 汉语添加特征模板附录7 英语添加特征模板附录8 中国科学院和北京大学核心词性标注集附录9 BNC统计语料样例后记
展开全部

节选

《面向非结构化文本的知识发现》从句法这一层面人手,基于面向网络获取的英汉双语平行语料这一非结构化数据。

作者简介

王东波,男,1981年生于山东省菏泽市,201 2年6月获南京大学信息管理学院情报学博士学位,现为南京农业大学信息科学技术学院讲师。近年来在国内外期刊与会议上发表学术论文35篇。研究领域主要包括自然语言处理、文本挖掘和信息计量。主持或参与南京大学研究生创新基金项目、863项目、自然科学基金项目、社会科学基金项目、教育部和其他项目八项。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航