×
图文详情
  • ISBN:9787115411228
  • 装帧:暂无
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:310
  • 出版时间:2016-02-01
  • 条形码:9787115411228 ; 978-7-115-41122-8

本书特色

作为一种高级程序设计语言,python凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。同时,python语言的数据分析功能也逐渐为大众所认可。 本书是一本介绍如何用python进行数据分析的学习指南。全书共12章,从python程序库入门、numpy数组、matplotlib和pandas开始,陆续介绍了数据加工、数据处理和数据可视化等内容。同时,本书还介绍了信号处理、数据库、文本分析、机器学习、互操作性和性能优化等高级主题。在本书的结尾,还采用3个附录的形式为读者补充了一些重要概念、常用函数以及在线资源等重要内容。 本书示例丰富、简单易懂,非常适合对python语言感兴趣或者想要使用python语言进行数据分析的读者参考阅读。

内容简介

实用的python开源模块的大集合; 简单易懂、示例丰富的数据分析教程; 掌握数据可视化、机器学习等高端主题; 新手变身数据分析专家的上好读本;

目录

目录第1章 python程序库入门 11.1 本书用到的软件 21.1.1 软件的安装和设置 21.1.2 windows平台 21.1.3 linux平台 31.1.4 mac os x平台 41.2 从源代码安装numpy、scipy、matplotlib和ipython 61.3 用setuptools安装 71.4 numpy数组 71.5 一个简单的应用 81.6 将ipython用作shell 111.7 学习手册页 131.8 ipython notebook 141.9 从何处寻求帮助和参考资料 141.10 小结 15第2章 numpy数组 162.1 numpy数组对象 162.2 创建多维数组 182.3 选择numpy数组元素 182.4 numpy的数值类型 192.4.1 数据类型对象 212.4.2 字符码 212.4.3 dtype构造函数 222.4.4 dtype属性 232.5 一维数组的切片与索引 232.6 处理数组形状 242.6.1 堆叠数组 272.6.2 拆分numpy数组 302.6.3 numpy数组的属性 332.6.4 数组的转换 392.7 创建数组的视图和拷贝 402.8 花式索引 412.9 基于位置列表的索引方法 432.10 用布尔型变量索引numpy数组 442.11 numpy数组的广播 462.12 小结 49第3章 统计学与线性代数 503.1 numpy和scipy模块 503.2 用numpy进行简单的描述性统计计算 553.3 用numpy进行线性代数运算 573.3.1 用numpy求矩阵的逆 573.3.2 用numpy解线性方程组 593.4 用numpy计算特征值和特征向量 613.5 numpy随机数 633.5.1 用二项式分布进行博弈 633.5.2 正态分布采样 663.5.3 用scipy进行正态检验 673.6 创建掩码式numpy数组 703.7 小结 75第4章 pandas入门 764.1 pandas的安装与概览 774.2 pandas数据结构之dataframe 784.3 pandas数据结构之series 814.4 利用pandas查询数据 854.5 利用pandas的dataframe进行统计计算 894.6 利用pandas的dataframe实现数据聚合 914.7 dataframe的串联与附加操作 954.8 连接dataframes 964.9 处理缺失数据问题 994.10 处理日期数据 1024.11 数据透视表 1064.12 访问远程数据 1074.13 小结 109第5章 数据的检索、加工与存储 1105.1 利用numpy和pandas对csv文件进行写操作 1105.2 numpy.npy与pandas dataframe 1125.3 使用pytables存储数据 1155.4 pandas dataframe与hdf5仓库之间的读写操作 1185.5 使用pandas读写excel文件 1205.6 使用rest web服务和json 1235.7 使用pandas读写json 1245.8 解析rss和atom订阅 1265.9 使用beautiful soup解析html 1275.10 小结 134第6章 数据可视化 1366.1 matplotlib的子库 1376.2 matplotlib绘图入门 1376.3 对数图 1396.4 散点图 1416.5 图例和注解 1436.6 三维图 1456.7 pandas绘图 1486.8 时滞图 1506.9 自相关图 1516.10 plot.ly 1536.11 小结 155第7章 信号处理与时间序列 1567.1 statsmodels子库 1577.2 移动平均值 1577.3 窗口函数 1597.4 协整的定义 1617.5 自相关 1647.6 自回归模型 1667.7 arma模型 1707.8 生成周期信号 1727.9 傅里叶分析 1747.10 谱分析 1777.11 滤波 1777.12 小结 179第8章 应用数据库 1808.1 基于sqlite3的轻量级访问 1818.2 通过pandas访问数据库 1838.3 sqlalchemy 1858.3.1 sqlalchemy的安装和配置 1868.3.2 通过sqlalchemy填充数据库 1888.3.3 通过sqlalchemy查询数据库 1898.4 pony orm 1918.5 dataset:懒人数据库 1928.6 pymongo与mongodb 1958.7 利用redis存储数据 1968.8 apache cassandra 1978.9 小结 201第9章 分析文本数据和社交媒体 2039.1 安装nltk 2039.2 滤除停用字、姓名和数字 2069.3 词袋模型 2089.4 词频分析 2099.5 朴素贝叶斯分类 2119.6 情感分析 2149.7 创建词云 2179.8 社交网络分析 2229.9 小结 224第10章 预测性分析与机器学习 22510.1 scikit-learn概貌 22610.2 预处理 22810.3 基于逻辑回归的分类 23010.4 基于支持向量机的分类 23210.5 基于elasticnetcv的回归分析 23510.6 支持向量回归 23710.7 基于相似性传播算法的聚类分析 24010.8 均值漂移算法 24210.9 遗传算法 24410.10 神经网络 24910.11 决策树 25110.12 小结 253第11章 python生态系统的外部环境和云计算 25511.1 与matlab/octave交换信息 25611.2 installing rpy2安装rpy2 25711.3 连接r 25711.4 为java传递numpy数组 26011.5 集成swig和numpy 26111.6 集成boost和python 26411.7 通过f2py使用fortran代码 26611.8 配置谷歌应用引擎 26711.9 在pythonanywhere上运行程序 26911.10 使用wakari 27011.11 小结 271第12章 性能优化、性能分析与并发性 27212.1 代码的性能分析 27212.2 安装cython 27712.3 调用c代码 28112.4 利用multiprocessing创建进程池 28312.5 通过joblib提高for循环的并发性 28612.6 比较bottleneck函数与numpy函数 28712.7 通过jug实现mapreduce 28912.8 安装mpi for python 29212.9 ipython parallel 29212.10 小结 296附录a 重要概念 298附录b 常用函数 303附录c 在线资源 309
展开全部

相关资料

本书从一系列开源的python模块讲起,介绍了很多实用的有关数据检索、清晰、操作、可视化等知识。同时,还涉及信号处理、预测性分析、机器学习等高端主题。非常适合想要深入学习并使用python进行数据分析的读者,无论是新手还是有一定python使用基础的读者,都将快速成为一名数据分析专家。

作者简介

Ivan Idris,实验物理学硕士,学位论文侧重于应用计算机科学。毕业后,他曾经效力于多家公司,从事Java开发、数据仓库开发以及QA分析等方面的工作;目前,他的兴趣主要集中在商业智能、大数据和云计算等专业领域。 Ivan Idris以编写简洁可测试的程序代码以及撰写有趣的技术文章为乐,同时也是Packt出版社NumPy Beginner's Guide-Second Edition、NumPy Cookbook和Learning NumPy Array等书籍的作者。读者可以访问ivanidris.net获取更多关于他的信息。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航