Scala机器学习
温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口有划线标记、光盘等附件不全详细品相说明>>
- ISBN:9787111572152
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 开本:32开
- 页数:203
- 出版时间:2017-07-01
- 条形码:9787111572152 ; 978-7-111-57215-2
本书特色
Copyright ?2016 Packt Publishing. First published in the English language under the title “Mastering Scala Machine Learning”.All rights reserved.Chinese simplified language edition published by China Machine Press.Copyright ?2017 by China Machine Press.本书中文简体字版由Packt Publishing授权机械工业出版社独家出版。未经出版者书面许可,不得以任何方式复制或抄袭本书内容。
内容简介
Copyright 2016 Packt Publishing. First published in the English language under the title “Mastering Scala Machine Learning”.All rights reserved.Chinese simplified language edition published by China Machine Press.Copyright 2017 by China Machine Press.本书中文简体字版由Packt Publishing授权机械工业出版社独家出版。未经出版者书面许可,不得以任何方式复制或抄袭本书内容。
目录
译者序
前言
第1章 探索数据分析1
1.1 Scala入门2
1.2 去除分类字段的重复值2
1.3 数值字段概述4
1.4 基本抽样、分层抽样和一致抽样5
1.5 使用Scala和Spark的Note-book工作8
1.6 相关性的基础12
1.7 总结14
第2章 数据管道和建模15
2.1 影响图16
2.2 序贯试验和风险处理17
2.3 探索与利用问题21
2.4 不知之不知23
2.5 数据驱动系统的基本组件23
2.5.1 数据收集24
2.5.2 数据转换层25
2.5.3 数据分析与机器学习26
2.5.4 UI组件26
2.5.5 动作引擎28
2.5.6 关联引擎28
2.5.7 监控28
2.6 优化和交互28
2.7 总结29
第3章 使用Spark和MLlib30
3.1 安装Spark31
3.2 理解Spark的架构32
3.2.1 任务调度32
3.2.2 Spark的组件35
3.2.3 MQTT、ZeroMQ、Flume和Kafka36
3.2.4 HDFS、Cassandra、S3和Tachyon37
3.2.5 Mesos、YARN和Standa-lone38
3.3 应用38
3.3.1 单词计数38
3.3.2 基于流的单词计数41
3.3.3 Spark SQL和数据框45
3.4 机器学习库46
3.4.1 SparkR47
3.4.2 图算法:Graphx和Graph-Frames48
3.5 Spark的性能调整48
3.6 运行Hadoop的HDFS49
3.7 总结54
第4章 监督学习和无监督学习55
4.1 记录和监督学习55
4.1.1 Iirs数据集56
4.1.2 类标签点57
4.1.3 SVMWithSGD58
4.1.4 logistic回归60
4.1.5 决策树62
4.1.6 bagging和boosting:集成学习方法66
4.2 无监督学习66
4.3 数据维度71
4.4 总结73
第5章 回归和分类74
5.1 回归是什么74
5.2 连续空间和度量75
5.3 线性回归77
5.4 logistic回归81
5.5 正则化83
5.6 多元回归84
5.7 异方差84
5.8 回归树85
5.9 分类的度量87
5.10 多分类问题87
5.11 感知机87
5.12 泛化误差和过拟合90
5.13 总结90
第6章 使用非结构化数据91
6.1 嵌套数据92
6.2 其他序列化格式100
6.3 Hive和Impala102
6.4 会话化104
6.5 使用特质109
6.6 使用模式匹配110
6.7 非结构化数据的其他用途113
6.8 概率结构113
6.9 投影113
6.10 总结113
第7章 使用图算法115
7.1 图简介115
7.2 SBT116
7.3 Scala的图项目119
7.3.1 增加节点和边121
7.3.2 图约束123
7.3.3 JSON124
7.4 GraphX126
7.4.1 谁收到电子邮件130
7.4.2 连通分量131
7.4.3 三角形计数132
7.4.4 强连通分量132
7.4.5 PageRank133
7.4.6 SVD 134
7.5 总结138
第8章 Scala与R和Python的集成139
8.1 R的集成140
8.1.1 R和SparkR的相关配置140
8.1.2 数据框144
8.1.3 线性模型150
8.1.4 广义线性模型152
8.1.5 在SparkR中读取JSON文件156
8.1.6 在SparkR中写入Parquet文件157
8.1.7 从R调用Scala158
8.2 Python的集成161
8.2.1 安装Python161
8.2.2 PySpark162
8.2.3 从Java/Scala调用Python163
8.3 总结167
第9章 Scala中的NLP169
9.1 文本分析流程170
9.2 Spark的MLlib库177
9.2.1 TF-IDF177
9.2.2 LDA178
9.3 分词、标注和分块185
9.4 POS标记186
9.5 使用word2vec寻找词关系189
9.6 总结192
第10章 高级模型监控193
10.1 系统监控194
10.2 进程监控195
10.3 模型监控201
10.3.1 随时间变化的性能202
10.3.2 模型停用标准202
10.3.3 A/B测试202
10.4 总结202
-
由浅入深学习SAP财务
¥67.3¥118.0 -
Excel 实战应用大全
¥15.9¥49.8 -
网络社团结构成因探究及其对网络中同步动力学行为的影响
¥32.4¥45.0 -
网络节点异质性预测研究及其对网络中信息-疾病耦合动力学行为的影响
¥32.4¥45.0 -
基于近邻思想和同步模型的聚类算法
¥46.6¥59.0 -
PYTORCH深度学习指南:编程基础 卷I
¥74.3¥99.0 -
智能图像处理技术及应用研究
¥35.8¥65.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥89.6¥128.0 -
遥感影像智能处理与分析
¥37.4¥52.0 -
人工智能+机器人入门与实战(修订版)用树莓派+Python+OpenCV制作计算
¥51.0¥69.8 -
技术之外
¥33.8¥69.0 -
系统集成项目管理工程师考试大纲(
¥12.9¥15.0 -
网络工程师教程(第2版)
¥69.3¥99.0 -
图解TCP/IP(第6版)
¥58.3¥79.8 -
PPT完美设计入门与进阶
¥68.6¥98.0 -
企业级应用开发实战
¥41.9¥59.9 -
MIDJOURNEY AI绘画艺术创作教程:关键词设置、艺术家与风格应用175例
¥56.8¥98.0 -
写给大家看的MIDJOURNEY设计书
¥48.9¥69.8 -
TensorFlow机器学习实用指南
¥65.5¥119.0 -
软件文化基础(第二版)
¥104.3¥149.0