×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
暂无评论
图文详情
  • ISBN:9787569329889
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:330
  • 出版时间:2023-07-01
  • 条形码:9787569329889 ; 978-7-5693-2988-9

内容简介

近年来,由于互联网上社交网络、产品或服务评论、电子邮件、博客和许多论坛的大型文本数据的产生,使得用于探索这些特定类型数据的文本挖掘成为一个热门且发展迅猛的领域。例如邮件系统中耳熟能详的邮件过滤功能,这便是文本挖掘领域的应用之一。本书包括基于机器学习的文本分析介绍、R编程语言、结构化文本表示、分类及*常用的分类算法(贝叶斯分类器、*近邻、决策树、随机森林、支持向量机和深度学习)介绍、聚类算法。本书*后两章还讨论了词向量和特征选择问题。

目录

第1章 基于机器学习的文本挖掘介绍 1.1 简介 1.2 文本挖掘和数据挖掘的关系 1.3 文本挖掘过程 1.4 用于文本挖掘的机器学习 1.5 机器学习的三种基本方向 1.6 大数据 1.7 关于本书 第2章 R语言介绍 2.1 R的安装 2.2 R的运行 2.3 RStudio 2.4 编写和执行命令 2.5 变量和数据类型 2.6 R中的对象 2.7 函数 2.8 运算符 2.9 向量 2.10 矩阵与数组 2.11 列表 2.12 因子 2.13 数据帧 2.14 机器学习常用函数 2.15 流控制结构 2.16 包 2.17 图表 第3章 文本结构化表示 3.1 简介 3.2 词袋模型 3.3 词袋模型的限制 3.4 文档特征 3.5 标准化 3.6 文本编码 3.7 语种识别 3.8 分词 3.9 句子检测 3.10 停用词、常用和特殊术语的过滤 3.11 变音符号的消除 3.12 归一化 3.13 标注 3.14 词袋模型的权重计算 3.15 存储结构化数据的常用格式 3.16 一个复杂示例 第4章 分类 4.1 样本数据 4.2 分类算法 4.3 分类器效率评估 第5章 贝叶斯分类器 5.1 简介 5.2 贝叶斯定理
展开全部

作者简介

扬·茨卡,目前在机器学习和数据挖掘领域从事咨询工作。他曾经是一名系统程序员、高级软件开发员及研究员,在过去的25年中一直致力于人工智能和机器学习,特别是文本挖掘的研究。他也曾在捷克国内外的一些大学和研究机构中工作过,是大约100个国际出版物的作者和合著者。 弗朗齐歇克·达雷纳,现任布尔诺孟德尔大学商业与经济学院信息学系副教授,系统工程和信息学博士学位项目保证人,文本挖掘与自然语言处理组组长,国际期刊编委会成员,International Journal in Foundations of Computer Science & Technology主编,曾在国际科学期刊、会议论文集和专著上发表多篇文章,研究领域包括文本/数据挖掘、智能数据处理和机器学习。 阿尔诺斯特·斯沃博达汉基·沙弗里,编程专家,研究领域包括编程语言和系统,如R、Assembler、Matlab、PL/1、Cobol、Fortran、Pascal等。20年来他一直在马萨里克大学应用数学与计算机科学系担任教师和研究院,目前正在研究机器学习和数据挖掘。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航