×
暂无评论
图文详情
  • ISBN:9787111729860
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:154
  • 出版时间:2023-06-01
  • 条形码:9787111729860 ; 978-7-111-72986-0

内容简介

本书提供了使用Python开发机器学习应用程序的基本原理。主要内容包括:机器学习概念及其应用;数据预处理、降维;各种线性模型、集成学习方法、随机森林、提升方法;自然语言处理、深度学习等。本书跟进了机器学习的近期新研究成果,比如近几年提出的有名算法XGBoost和CatBoost,以及SHAP值。这些方法是机器学习领域中新颖且优选的模型。本书目的是向读者介绍从业人员采用的解决机器学习问题的主要现代算法,跟踪机器学习领域研究前沿,并为初学者提供使用机器学习的方法。本书覆盖面广,对所有希望在数据科学和分析任务中使用机器学习的人来说,本书既是一本很好的学习资料,同时也是一本实战教程,其中介绍了多种统计模型,并提供了大量的相应代码,以将这些概念一致地应用于实际问题。

目录

目录 译者的话 原书前言 第1章机器学习初步 1.1一个简单的监督模型:近邻法 1.2数据预处理 1.2.1数据放缩 1.2.2数据高斯化:幂变换简介 1.2.3类别变量的处理 1.2.4缺失值的处理 1.3不平衡数据的处理方法 1.3.1少数类的随机过采样 1.3.2多数类的随机欠采样 1.3.3合成少数类过采样 1.4降维:主成分分析(PCA) 1.4.1使用PCA进行降维 1.4.2特征提取 1.4.3非线性流形算法:t-SNE 第2章机器学习线性模型 2.1线性回归 2.2收缩方法 2.2.1Ridge回归(L2正则化) 2.2.2Lasso回归(L1正则化) 2.2.3弹性网络回归 2.3稳健回归 2.3.1Huber回归 2.3.2RANSAC 2.4Logistic回归 2.4.1Logistic回归为什么是线性的 2.4.2Logistic回归预测(原始模型输出)与概率(Sigmoid输出) 2.4.3Python Logistic回归 2.4.4模型性能评估 2.4.5正则化 2.5线性支持向量机 2.6逾越线性:核模型 2.6.1核技巧 2.6.2实际分类例子:人脸识别 第3章逾越线性:机器学习集成方法 3.1引言 3.2集成方法 3.2.1自举聚合 3.2.2包外估计(Out-Of-Bag Estimation) 3.3随机森林 3.3.1随机森林分类 3.3.2随机森林回归 3.4提升(Boosting)方法 3.4.1AdaBoost算法 3.4.2梯度提升(Gradient Boosting)算法 3.4.3梯度提升(XGBoost)算法 3.4.4CatBoost算法 第4章现代机器学习技术 4.1自然语言处理初步 4.1.1文本数据预处理 4.1.2文本的数值表示:词袋模型 4.1.3实际例子:使用IMDB电影评论数据集进行情感分析 4.1.4单词频率—逆文本频率 4.1.5n-Grams模型 4.1.6词嵌入 4.2深度学习初步 4.2.1用神经网络处理复杂数据 4.2.2多分类 附录 附录APython速成教程 A.1Python构建块 A.1.1变量 A.1.2方法与函数 A.2Python数据结构 A.2.1列表与元组 A.2.2集合 A.2.3字典 A.3Python循环 A.3.1for循环 A.3.2while循环 A.4Python高级数据结构 A.4.1列表推导式 A.4.2Lambda函数 A.5函数概念进阶 A.5.1通配符在函数参数中的使用 A.5.2函数中的局部作用域与全局作用域 A.6面向对象编程简介 A.6.1对象、类和属性 A.6.2子类和继承 附录B词袋模型的数学原理 参考文献
展开全部

作者简介

  Andrea Giussani,意大利博科尼大学计算机科学的学术研究员,拥有机器学习领域丰富的理论知识和实战经验,长期为博科尼大学学生讲授机器学习课程。同时,他拥有统计学博士学位,并且在Journal of Applied Statistics、Statistics and Probability Letters等同行评审期刊上发表过文章。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航