Python机器学习及实践——从零开始通往Kaggle竞赛之路(2022年度版)
- ISBN:9787302614241
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:368
- 出版时间:2022-10-01
- 条形码:9787302614241 ; 978-7-302-61424-1
本书特色
该书帮助大量对机器学习、数据挖掘感兴趣的读者朋友整合时下*流行的基于Python语言的程序库:如Scikit-learn,NLTK,XGBoost,TensorFlow等,并且针对现实中遇到的数据,甚至是Kaggle竞赛(时下世界*流行的机器学习竞赛平台)中的分析任务,快速搭建有效的机器学习系统。 同时,作者力求减少读者为了理解本书,而对编程技能、数学背景的过分依赖;进而降低机器学习模型的实践门槛,让更多的兴趣爱好者体会到使用经典模型以及*新的高效方法解决实际问题的乐趣。同时,笔者对每一个关键术语都提供了标准的英文表述,也方便读者朋友更加快速查阅、理解相关的英文文献。
内容简介
本书在不涉及大量数学模型与复杂编程知识的前提下,从零开始逐步带领读者熟悉并掌握当下流行的基于Python 3的数据分析,以及支持单机、深度和分布式机器学习的开源程序库,如pandas、Scikitlearn、PyTorch、TensorFlow、PaddlePaddle、PySparkML等。全书分4部分。入门篇包括对全书核心概念的指南性介绍,以及在多种主流操作系统(Windows、macOS、Ubuntu)上配置基本编程环境的详细说明。基础篇涵盖Python 3的编程基础、基于pandas的数据分析,以及使用Scikitlearn解决大量经典的单机(单核/多核)机器学习问题。进阶篇介绍如何使用PyTorch、TensorFlow、PaddlePaddle搭建多种深度学习网络框架,以及如何基于PySpark的ML编程库完成一些常见的分布式机器学习任务。实践篇利用全书所讲授的Python编程、数据分析、机器学习知识,帮助读者挑战和参与Kaggle多种类型的竞赛实战,同时介绍如何使用Git在Gitee、GitHub平台上维护和管理日常代码与编程项目。 本书适合所有对人工智能领域,特别是机器学习、数据挖掘、自然语言处理等技术及其实践感兴趣的初学者。
目录
第1部分 入门篇
第1章 全书指南3
1.1Python编程3
1.2数据分析5
1.3机器学习6
1.3.1任务9
1.3.2经验10
1.3.3性能11
1.4Kaggle竞赛13
1.5Git代码管理14
1.6章 末小结15
第2章 基本环境搭建与配置16
2.1Windows操作系统下基本环境的搭建与配置16
2.1.1查看Windows的版本与原始配置16
2.1.2下载并安装Anaconda3(Windows)17
2.1.3使用Anaconda Navigator创建虚拟环境python_env(Windows)19
2.1.4在虚拟环境python_env下使用Anaconda Navigator安装
Jupyter Notebook与PyCharm Professional(Windows)20
2.2macOS操作系统下基本环境的搭建与配置21
2.2.1查看macOS的版本与原始配置21
2.2.2下载并安装Anaconda3(macOS)23
2.2.3使用Anaconda Navigator创建虚拟环境python_env(macOS)24
2.2.4在虚拟环境python_env下使用Anaconda Navigator安装
2.3.1查看Ubuntu的版本与原始配置26
2.3.2下载并安装Anaconda3(Ubuntu)27
2.3.3在终端中创建虚拟环境python_env(Ubuntu)28
2.3.4在虚拟环境python_env下使用conda命令安装Jupyter
Notebook(Ubuntu)29
2.4Jupyter Notebook使用简介31
2.4.1在虚拟环境python_env下启动Jupyter Notebook31
2.4.2创建一个.ipynb文件32
2.4.3试运行.ipynb文件内的Python 3程序33
2.5PyCharm使用简介34
2.5.1在虚拟环境python_env下启动PyCharm34
2.5.2基于虚拟环境python_env的Python 3.8解释器创建一个
.py文件35
2.5.3试运行.py文件内的Python 3程序35
2.6章 末小结37
第2部分 基础篇
第3章 Python编程基础41
3.1Python编程环境配置41
3.1.1基于命令行/终端的交互式编程环境41
3.1.2基于Web的交互式开发环境42
3.1.3集成式开发环境43
3.2Python基本语法44
3.2.1赋值44
3.2.2注释45
3.2.3缩进46
3.3Python数据类型46
3.4Python数据运算49
3.5Python流程控制53
3.5.1分支语句53
3.5.2循环控制55
3.6Python函数设计56
3.7Python面向对象编程57
3.8Python编程库(包)导入60
3.9Python编程综合实践62
3.10章 末小结63
第4章 pandas数据分析64
4.1pandas环境配置65
4.1.1使用Anaconda Navigator搭建和配置环境66
4.1.2使用conda命令搭建和配置环境66
4.2pandas核心数据结构67
4.2.1Series68
4.2.2DataFrame69
4.3pandas读取/写入文件数据70
4.3.1读取/写入CSV文件数据70
4.3.2读取/写入JSON文件数据73
4.3.3读取/写入Excel文件数据76
4.4pandas数据分析的常用功能80
4.4.1添加数据80
4.4.2删除数据83
4.4.3查询/筛选数据84
4.4.4修改数据86
4.4.5数据统计87
4.4.6数据排序89
4.4.7函数应用90
4.5pandas数据合并92
4.6pandas数据清洗93
4.7pandas数据分组与聚合95
4.8章 末小结97
第5章 Scikitlearn单机机器学习98
第3部分 进阶篇
第6章 PyTorch/TensorFlow/PaddlePaddle深度学习185
第7章 PySparkML分布式机器学习262
第4部分 实践篇
第8章 Kaggle竞赛实践301
第9章 Git代码管理334
后记352
-
全图解零基础word excel ppt 应用教程
¥15.6¥48.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
零信任网络:在不可信网络中构建安全系统
¥37.2¥59.0 -
硅谷之火-人与计算机的未来
¥20.3¥39.8 -
情感计算
¥66.8¥89.0 -
大模型RAG实战 RAG原理、应用与系统构建
¥69.3¥99.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥52.4¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥68.2¥89.8 -
LINUX实战——从入门到精通
¥49.0¥69.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
快速部署大模型:LLM策略与实践(基于ChatGPT等大语言模型)
¥56.9¥79.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥81.8¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
做好课题申报:AI辅助申请书写作
¥48.9¥69.8 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0