Python数据分析实战——从Excel轻松入门Pandas
- ISBN:9787302602811
- 装帧:70g胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:328
- 出版时间:2022-05-01
- 条形码:9787302602811 ; 978-7-302-60281-1
本书特色
本书是一本基础入门加实战的书籍,既有基础知识,又有丰富示例,包括详细的操作步骤,实操性强。本书对Pandas的基本概念讲解很详细,包括基本概念及代码示例。 从Excel角度学习Pandas数据分析技术,入门更轻松,学习更高效! 配套150个示例源代码,示例丰富,步骤详细,实操性强 ★现如今只会Excel已经不够了,会用Python进行数据分析的人才是*稀缺的。本书详细介绍Python中*流行的数据分析工具Pandas的使用方法,学完本书,能让你的数据处理能力事半功倍。如果学习数据分析是一件有趣的事情,则很容易坚持下来。刚好,曾老师就是这么一位幽默、有趣的老师。 ——晏艳 微软“金牌”合作双语讲师 ★相信在每个行业中一定有一位本行业的领军者。无论是教学,还是课程研发,曾老师属当之无愧的佼佼者。歌德说过:“读一本好书,就如同和一个高尚的人在交谈。”曾老师编写的《Python数据分析实战——从Excel轻松入门Pandas》,简直是办公人员的福音!本书由浅入深,从基础到实践、举一反三、边学边用,写得很详细,无论是对初学者,还是资深办公人士皆具有参考价值。 ——罗娟 Excel精英培训网高级讲师 ★如果你使用Excel做数据处理有点捉襟见肘,那么不妨考虑使用Python中的Pandas库。本书从零开始讲解Python,并且从Excel的角度学习Pandas,让初学者更易接受。学完本书后,不但可以增强你的数据处理能力,同时还可以大大提升工作效率。 ——兰瑞员 快手优秀办公讲师 ★Pandas是一个免费、开源的第三方Python库,为数据分析提供了高性能,并且易于使用的数据结构。《Python数据分析实战——从Excel轻松入门Pandas》采用通俗易懂、深入浅出的语言风格,详细地讲解了包括文件读写、表格管理、字符清洗、数据透视等重点知识,显著地降低了学习Pandas的门槛和难度,相信通过对本书的学习,你一定会收获颇丰! ——刘大洪 资深数据分析师
内容简介
本书从零开始系统讲解了使用Pandas导入Excel数据,然后使用Pandas技术对数据做整理和分析,*后导出为不同形式的Excel文件。完整实现了数据的导入、处理、输出的处理流程。 全书共10章。第1章为Pandas数据处理环境的搭建,第2章为使用Pandas对Excel数据读取与保存,第3章介绍与Pandas底层数据相关的NumPy库,第4章介绍了Pandas中DataFrame表格的增、删、改、查等常用操作,第5章介绍了对Series与DataFrame两种数据的运算、分支、遍历等处理,第6章介绍了字符串的各种清洗技术,第7章介绍时间戳与时间差数据的处理,第8章介绍Pandas中分层索引及与索引相关的操作,第9章介绍了对数据的分组处理及做数据透视表处理,第10章介绍了表格的数据结构转换,以及多表读取与保存。书中包含相应示例,不仅可以学会理论知识还可以灵活应用。 本书可作为Excel爱好者和数据分析初学者的入门书籍,以及想提高数据分析效率,拓展数据分析手段相关人员的参考书籍。
目录
目录
第1章 Pandas数据处理环境搭建
1.1 Pandas环境配置
1.1.1 安装Python发行版本Anaconda
1.1.2 程序编写工具Jupyter Notebook
1.2 Python基础操作
1.2.1 变量
1.2.2 注释
1.2.3 代码缩进
1.2.4 数据结构
1.2.5 控制语句
1.2.6 函数
第2章 Pandas中数据的存取
2.1 读取Excel文件数据
2.2 读取CSV 文件数据
2.3 保存为Excel文件格式
2.4 保存为CSV 文件格式
2.5 Pandas中表格的结构
2.5.1 DataFrame数据结构
2.5.2 Series数据结构
第3章 NumPy数据处理基石
3.1 NumPy的定义
3.2 NumPy数组的创建与转换
3.2.1 普通数组
3.2.2 序列数组
3.2.3 随机数组
3.2.4 转换数组
3.3 NumPy数组的预处理
3.3.1 类型转换
3.3.2 缺失值处理
3.3.3 重复值处理
3.4 NumPy数组维度转换…
3.4.1 数组维度转换
3.4.2 数组合并
3.5 Series数据的创建
3.6 DataFrame表格的创建
3.6.1 使用NumPy数组创建DataFrame表格
3.6.2 使用Python列表创建DataFrame表格
3.6.3 使用Python字典创建DataFrame表格
第4章 表格管理技术
4.1 表格属性获取与修改
4.1.1 表格属性的获取
4.1.2 表格属性修改
4.2 表格的切片选择
4.2.1 切片法
4.2.2 筛选法
4.2.3 loc切片法
4.2.4 iloc切片法
4.3 添加表格的行和列
4.3.1 添加行
4.3.2 添加列
4.4 删除表格的行和列
4.4.1 删除行
4.4.2 删除列
4.4.3 删除有缺失值的行和列
4.5 表格数据的修改
4.6 巩固案例
第5章 数据处理基础
5.1 数据运算处理
5.1.1 运算符与运算函数
5.1.2 Series与单值的运算
5.1.3 DataFrame与单值运算
5.1.4 Series与Series运算
5.1.5 DataFrame与DataFrame运算
5.1.6 DataFrame与Series运算
5.1.7 数据运算时的对齐特性
5.2 数据分支判断
5.2.1 条件判断处理1(mask()与where())
5.2.2 条件判断处理2(np.where())
5.3 数据遍历处理
5.3.1 遍历Series元素(map())
5.3.2 遍历DataFrame行和列(apply())
5.3.3 遍历DataFrame元素(applymap())
5.4 数据统计处理
5.4.1 聚合统计
5.4.2 逻辑统计
5.4.3 极值统计
5.4.4 排名统计
5.5 巩固案例
5.5.1 根据不同蔬菜的采购数量统计每天采购金额
5.5.2 筛选出成绩表中各科目均大于或等于100的记录
5.5.3 筛选出成绩表中各科目的和大于或等于300的记录
5.5.4 统计每个人各科目总分之和的排名
5.5.5 统计每个人所有考试科目的*优科目
第6章 字符串清洗技术
6.1 正则
6.1.1 正则表达式的导入与创建
6.1.2 正则表达式处理函数
6.1.3 正则表达式编写规则
6.2 拆分
6.2.1 普通拆分
6.2.2 正则拆分
6.2.3 拆分次数
6.2.4 拆为表格
6.2.5 实例应用
6.3 提取
6.3.1 将数据提取到列方向
6.3.2 将数据提取到行方向
6.3.3 实例应用
6.4 查找
6.4.1 查找位置
6.4.2 查找判断
6.4.3 查找数据
6.4.4 实例应用
6.5 替换
6.5.1 Series数据替换
6.5.2 DataFrame表格替换
6.5.3 实例应用
6.6 长度
6.7 重复
6.8 修剪
6.9 填充
6.9.1 元素填充
6.9.2 字符填充
6.10 去重
6.10.1 重复项判断
6.10.2 重复项删除
6.11 排序
6.11.1 单列排序
6.11.2 多列排序
6.11.3 自定义排序
6.12 合并
6.12.1 Series数据自身元素合并
6.12.2 Series数据与其他数据合并
6.13 扩展
6.14 巩固案例
6.14.1 筛选出分数中至少有3个大于或等于90分的记录…
6.14.2 两表查询合并应用
6.14.3 给关键信息加掩码
6.14.4 提取文本型单价后与数量做求和统计
6.14.5 提取不重复名单
6.14.6 对文本中的多科目成绩排序
第7章 日期和时间处理技术
7.1 时间戳
7.1.1 单个时间戳
7.1.2 时间戳序列
7.1.3 时间戳转换
7.1.4 时间戳信息获取
7.2 时间差
7.2.1 单个时间差
7.2.2 时间差序列
7.2.3 时间差信息获取
7.2.4 时间差偏移
7.3 巩固案例
7.3.1 根据出生日期计算年龄
7.3.2 将不规范日期整理为标准日期
7.3.3 根据开始时间到结束时间的时长计算金额
7.3.4 根据借书起始时间及租借天数计算归还日期
第8章 高级索引技术
8.1 Pandas索引
8.1.1 Series索引
8.1.2 DataFrame索引
8.2 分层索引的设置
8.2.1 Series的分层索引设置
8.2.2 DataFrame的分层索引设置
8.3 分层索引设置的4种方法
8.4 文件导入导出时分层索引设置
8.5 行索引与列数据的相互转换
8.5.1 列数据设置为行索引
8.5.2 行索引设置为列数据
8.6 分层索引切片
8.6.1 选择单行
8.6.2 选择单列
8.6.3 选择单值
8.6.4 选择多行多列
8.6.5 选择指定级别数据
8.6.6 筛选索引
8.7 索引的修改
8.7.1 索引重命名
8.7.2 索引重置
8.7.3 索引排序
8.7.4 索引层级交换
8.7.5 索引删除
8.8 巩固案例…
8.8.1 筛选出下半年总销量大于上半年的记录
8.8.2 对文本型数字月份排序
8.8.3 根据分数返回等级设置索引
第9章 数据汇总技术
9.1 分组处理
9.1.1 分组
9.1.2 聚合
9.1.3 转换
9.1.4 过滤
9.1.5 高级分组
9.2 数据透视表
9.2.1 指定索引方向分组聚合
9.2.2 多列执行单种聚合
9.2.3 单列执行多种聚合
9.2.4 多列执行多种聚合
9.2.5 指定列做指定聚合
9.2.6 行索引和列索引分组聚合
9.2.7 跟列数据长度相同的数组做分组
9.2.8 数据透视表缺失值处理
9.2.9 数据透视表的行和列总计设置
9.3 巩固案例
9.3.1 提取各分组的前两名记录
9.3.2 按条件筛选各分组的记录
9.3.3 提取各分组下的唯一值
9.3.4 分组批量拆分表格到Excel文件
9.3.5 将数据透视表拆分为Excel文件
第10章 表格转换技术
10.1 表格方向转换
10.1.1 列索引数据转换成行索引数据
10.1.2 将行索引数据转换成列索引数据
10.2 表格纵横拼接
10.2.1 表格纵向拼接(初级)
10.2.2 表格纵向拼接(进阶)
10.2.3 表格横向拼接(初级)
10.2.4 表格横向拼接(进阶)
10.3 表格数据存取
10.3.1 批量读取
10.3.2 批量保存
10.4 巩固案例
10.4.1 多个工作表数据合并
10.4.2 工资条制作
10.4.3 特殊的纵向表格拼接
10.4.4 多工作表合并与聚合处理
10.4.5 跨表查询后再聚合汇总
10.4.6 将汇总结果分发到不同工作表
作者简介
曾贤志,Office技术培训专家,我要自学网专家讲师,特邀技术图书作者,擅长使用VBA、SQL、Power BI、Python等技术做数据分析。著有《Power Query For Excel让工作化繁为简》《加薪不加班:174个Excel函数案例闯职场》《从Excel到Python:用Python轻松处理Excel数据》等与数据分析相关的技术图书。
-
深度学习的数学
¥43.5¥69.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥31.9¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥22.1¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥83.3¥119.0 -
Visual Basic 语言程序设计基础(第6版)
¥32.0¥45.0 -
贝叶斯推理与机器学习
¥139.3¥199.0