读者评分
4分

面向非结构化文本的知识发现-基于英汉双语平行语料库的句法级知识挖掘和抽取研究

1星价 ¥28.1 (7.2折)

2星价￥28.1 定价￥39.0

作者：王东波

出版社：中国社会科学出版社

本类榜单：外语

分类：外语 > 英语专项训练 > 学习方法

买过本商品的人还买了

商品评论（1条）

wan***（三星用户）

面向非结构化文本的知识发现好资料

面向非结构化文本的知识发现好资料，印刷装帧可以

2015-09-09 09:43:43

0 0

查看全部评论

图文详情

ISBN：9787516126035
装帧：暂无
册数：暂无
重量：暂无
开本：16开
页数：220
出版时间：2013-06-01
条形码：9787516126035 ; 978-7-5161-2603-5

本书特色

《面向非结构化文本的知识发现》从句法这一层面人手,基于面向网络获取的英汉双语平行语料这一非结构化数据。

内容简介

《面向非结构化文本的知识发现》结合自然语言处理和文本挖掘的相应技术，在情报学、语言学方法和知识的基础上，针对词汇、简单短语、复杂短语这三个句法层级上的知识挖掘和抽取问题进行了探究，揭示了词汇句法组合的呈现规律，构建了简单短语结构抽取的模型，挖掘了面向复杂短语的类别知识。

**章引言一课题提出二研究意义三研究方法四研究技术路线五研究创新点六本书结构和所用资源第二章相关研究综述一面向网络获取相关英汉双语平行语料的概述二词汇句法功能分布的相关研究概况三短语结构知识抽取的相关研究综述四类别知识挖掘的相关研究第三章面向网络的英汉双语平行语料库自动构建一确定获取语料网站和制定抓取词汇底表二网页的抓取和英汉双语平行语料的抽取第四章词汇句法功能分布复杂度呈现规律的知识挖掘一词汇句法功能分布复杂度统计数据源简介和句法结构调整二词汇句法功能分布复杂度的获取三词汇句法功能分布复杂度的洛特卡现象揭示第五章基于英汉双语平行语料库的短语结构知识抽取——以介宾短语结构为例一英汉双语介宾短语结构句法特征统计分析二有关介宾短语结构知识抽取模型构建的相关介绍和预处理三介宾短语结构知识抽取模型的确定和英汉双语介宾短语结构知识的抽取第六章基于英汉双语平行语料库的复杂短语级类别知识挖掘一面向英汉双语专门复杂短语平行语料的聚类和词干或词形算法确定二语料的预处理和相关统计三面向英汉双语复杂短语平行语料的词性选择四基于英汉双语复杂短语平行语料的类别知识挖掘结语参考文献附录1 宾州大学英语树库的词性标记附录2 宾州大学汉语树库的词性标记附录3 清华大学树库词性标记附录4 汉语自身特征模板附录5 英语自身特征模板附录6 汉语添加特征模板附录7 英语添加特征模板附录8 中国科学院和北京大学核心词性标注集附录9 BNC统计语料样例后记

展开全部

节选

《面向非结构化文本的知识发现》从句法这一层面人手,基于面向网络获取的英汉双语平行语料这一非结构化数据。

作者简介

王东波,男,1981年生于山东省菏泽市,201 2年6月获南京大学信息管理学院情报学博士学位,现为南京农业大学信息科学技术学院讲师。近年来在国内外期刊与会议上发表学术论文35篇。研究领域主要包括自然语言处理、文本挖掘和信息计量。主持或参与南京大学研究生创新基金项目、863项目、自然科学基金项目、社会科学基金项目、教育部和其他项目八项。

本类五星书