×
暂无评论
图文详情
  • ISBN:9787576609417
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:26cm
  • 页数:307页
  • 出版时间:2023-11-01
  • 条形码:9787576609417 ; 978-7-5766-0941-7

内容简介

本书系统介绍R语言在自然语言处理中的应用,包括十一章内容,遵循由易到难、循序渐进的原则。**章是R语言入门,第二章介绍字符串处理。第三章介绍常见的文本统计方法,包括统计文本词数、句子数和平均长、绘制词频表以及词频分布图。第四章依据R数据包koRpus介绍与讨论文本词汇多样性测量方法,包括传统的类符形符比和平均分段类符形符比等。第五章同第四章一样利用R数据包koRpus。第六章聚焦于n元组和关键词提取方法。第七章介绍两种特殊形式的n元组,即搭配和搭配构式。第八章介绍文档或文本相似度和距离测量。第九章着重介绍基于整洁文本的自然语言处理技术。第十章介绍中文自然语言处理技术。第十一章是本书的*后一章,介绍如何对文本词汇开展词类标注和句法成分依存分析,包括数据包udpipe的安装与初试、词语共现和快速自动关键词提取等。

目录

**章 R语言基础 1.1 R简史 1.2 R软件和数据包安装 1.3 基本R对象 1.4 R循环 第二章 字符串处理 2.1 文档读取 2.2 字符串分割 2.3 正则表达式 2.4 R基础包中的正则表达式函数 2.5 字符串操作数据包stringr 2.6 语境中的关键词检索 第三章 文本基础统计 3.1 数据包koRpus的安装与调试 3.2 描述性统计 3.3 词汇密度 3.4 词频表 3.5 词频分布图 第四章 文本词汇多样性测量 4.1 传统的类符一形符比 4.2 平均分段类符一形符比 4.3 移动平均类符一形符比 4.4 Herdan's C 4.5 Guiraud's R 4.6 尤伯指数(U) 4.7 萨默指数(s) 4.8 Yule's K 4.9 Maas指数 4.10 HD 4.11 文本词汇多样性测量(MTLD) 4.12 文本词汇多样性移动平均测量(MTLD-MA) 第五章 文本可读性测量 5.1 自动化可读性指数(ARI) 5.2 科尔曼-廖指数 5.3 戴尔-乔尔可读性新公式 5.4 弗莱什阅读难易度 5.5 法尔-詹金斯-帕特森指数 5.6 弗莱什-金凯德年级水平 5.7 安德森可读性指数 5.8 复杂词词频修正指数 5.9 复杂词简单测量(SMOG) 5.10 听力难易度公式 第六章 N元组和关键词 6.1 文本数据计量分析数据包安装与初试 6.2 两个文本的二元组比较 6.3 两个文本的三元组比较 6.4 文本比较关键词提取 第七章 搭配和搭配构式 7.1 搭配和搭配构式分析方法 7.2 文本中的搭配分析案例 7.3 文本中的搭配构式分析案例 第八章 文本相似度和距离测量 8.1 词汇相似度测量 8.2 语义相似度测量 8.3 文本相似度测量举例 第九章 基于整洁文本的自然语言处理 9.1 作为新型数据框的tibble 9.2 整洁数据和数据包tidyr 9.3 管道操作和数据包dplyr 9.4 基于整洁数据的数据包tidytext 9.5 精美制图数据包ggplot2 9.6 利用整洁数据的文本情感分析 9.7 对小说《傲慢与偏见》的文本特征分析 第十章 中文自然语言处理 10.1 中文分词 10.2 文档基本描述性统计量 10.3 文本词频分布词云图 10.4 关键词检索 10.5 关键词提取 10.6 中文情感分析 第十一章 词性与句法分析 11.1 数据包udpipe的安装与初试 11.2 文本中的短语提取 11.3 句法分析 11.4 词语共现 儿.5 快速自动关键词提取 第十二章 在R中调用Python开展自然语言处理 12.1 安装Python和Python库 12.2 R数据包reticulate的安装和基础操作 12.3 利用NLTK库的自然语言处理 12.4 利用spaCy库的自然语言处理 参考文献
展开全部

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航