- ISBN:9787121254437
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:334
- 出版时间:2015-03-01
- 条形码:9787121254437 ; 978-7-121-25443-7
本书特色
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、pagerank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。 本书是web开发者、架构师、应用工程师等的绝佳选择。
内容简介
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。 本书是Web开发者、架构师、应用工程师等的绝佳选择。
目录
前言 viii
第1章 集体智慧导言 1
什么是集体智慧 2
什么是机器学习 3
机器学习的局限 4
真实生活中的例子 5
学习型算法的其他用途 5
第2章 提供推荐 7
协作型过滤 7
搜集偏好 8
寻找相近的用户 9
推荐物品 15
匹配商品 17
构建一个基于del.icio.us的链接推荐系统 19
基于物品的过滤 22
使用movielens数据集 25
基于用户进行过滤还是基于物品进行过滤 27
练习 28
第3章 发现群组 29
监督学习和无监督学习 29
单词向量 30
分级聚类 33
绘制树状图 38
列聚类 40
k-均值聚类 42
针对偏好的聚类 44
以二维形式展现数据 49
有关聚类的其他事宜 53
练习 53
第4章 搜索与排名 54
搜索引擎的组成 54
一个简单的爬虫程序 56
建立索引 58
查询 63
基于内容的排名 64
利用外部回指链接 69
从点击行为中学习 74
练习 84
第5章 优化 86
组团旅游 87
描述题解 88
成本函数 89
随机搜索 91
爬山法 92
模拟退火算法 95
遗传算法 97
真实的航班搜索 101
涉及偏好的优化 106
网络可视化 110
其他可能的应用场合 115
练习 116
第6章 文档过滤 117
过滤垃圾信息 117
文档和单词 118
对分类器进行训练 119
计算概率 121
朴素分类器 123
费舍尔方法 127
将经过训练的分类器持久化 132
过滤博客订阅源 134
对特征检测的改进 136
使用akismet 138
替代方法 139
练习 140
第7章 决策树建模 142
预测注册用户 142
引入决策树 144
对树进行训练 145
选择*合适的拆分方案 147
以递归方式构造树 149
决策树的显示 151
对新的观测数据进行分类 153
决策树的剪枝 154
处理缺失数据 156
处理数值型结果 158
对住房价格进行建模 158
对“热度”评价进行建模 161
什么时候使用决策树 164
练习 165
第8章 构建价格模型 167
构造一个样本数据集 167
k-*近邻算法 169
为近邻分配权重 172
交叉验证 176
不同类型的变量 178
对缩放结果进行优化 181
不对称分布 183
使用真实数据——ebay api 189
何时使用k-*近邻算法 195
练习 196
第9章 高阶分类:核方法与svm 197
婚介数据集 197
数据中的难点 199
基本的线性分类 202
分类特征 205
对数据进行缩放处理 209
理解核方法 211
支持向量机 215
使用libsvm 217
基于facebook的匹配 219
练习 225
第10章 寻找独立特征 226
搜集一组新闻 227
先前的方法 231
非负矩阵因式分解 232
结果呈现 240
利用股票市场的数据 243
练习 248
第11章 智能进化 250
什么是遗传编程 250
将程序以树形方式表示 253
构造初始种群 257
测试题解 259
对程序进行变异 260
交叉 263
构筑环境 265
一个简单的游戏 268
更多可能性 273
练习 276
第12章 算法总结 277
贝叶斯分类器 277
决策树分类器 281
神经网络 285
支持向量机 289
k-*近邻 293
聚类 296
多维缩放 300
非负矩阵因式分解 302
优化 304
附录a:第三方函数库 309
附录b:数学公式 316
索引 323
作者简介
莫映,现供职于IBM中国开发实验室,在软件开发与设计领域里混迹已然10年有余,目前从事商业领域社交软件产品的研发工作。一直关注社交网络以及社交技术在不同领域里的运用,同时也积极活跃于公司内外的各种技术社区之中。
-
全图解零基础word excel ppt 应用教程
¥15.6¥48.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
情感计算
¥66.8¥89.0 -
大模型RAG实战 RAG原理、应用与系统构建
¥69.3¥99.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥48.3¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
LINUX实战——从入门到精通
¥48.3¥69.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
快速部署大模型:LLM策略与实践(基于ChatGPT等大语言模型)
¥56.9¥79.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥38.7¥79.0 -
明解C语言:实践篇
¥62.9¥89.8