- ISBN:9787560654607
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:26cm
- 页数:130页
- 出版时间:2019-08-01
- 条形码:9787560654607 ; 978-7-5606-5460-7
本书特色
数据的清洗是在大数据的挖掘与分析过程中的一个重要环节,由于数据类型的复杂性,采用传统的清洗脏数据的工作会辛苦和乏味。但是如果能利用好的清洗工具和适当的方法则可以让数据的清洗工作变得有趣并能达到事半功倍的效果。
本书从文件格式、数据类型、字符编码等基本概念入手,通过实例,探讨了如何提取和清洗关系型数据、网页数据,以及如何实现数据的转换与加载。每个知识点都附有案例供读者学习,通过实践让读者掌握所有的数据清洗技术。
如果您是一位数据科学家,或者从事数据科学工作,哪怕是一个对数据科学感兴趣的新手,那么很高兴本书适合您阅读。
内容简介
本书系统讲解了数据清洗的基础与理论, 分基础篇和实战篇两篇, 分别为: 数据清洗概述、数据格式类型与编码、电子表格与文本编辑器、基本技术与方法、数据抽取、数据的转换与加载、数据清洗工具介绍、基于Web的数据采集实战、基于RDBMS的数据清洗实战。
目录
作者简介
生于1980年1月,讲师/项目监理师,硕士,重庆工程学院人工智能与大数据系教师,主要从事人工智能与医疗大数据的研究。自2015年以来主持商业医疗大数据项目3项,产值千万元以上。公开发表论文7篇(EI检索1篇)、主持、参与校级自然科学基金项目1项 、主持、参与建设校级重点课程1门 、主编、参与出版教材(教学讲义)3部
-
断代(八品)
¥15.5¥42.0 -
家居设计解剖书
¥29.3¥39.0 -
当代中国政府与政治(新编21世纪公共管理系列教材)
¥30.2¥48.0 -
中医基础理论
¥50.7¥59.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
编辑审稿实务教程
¥35.1¥45.0 -
社会学概论(第二版)
¥33.0¥55.0 -
古代汉语(第四册)
¥13.3¥35.0 -
当代教育心理学(第3版)(本科教材)
¥23.8¥66.0 -
落洼物语
¥8.4¥28.0 -
EPLAN电气设计
¥29.9¥39.8 -
软件定义网络(SDN)实战教程
¥49.6¥69.8 -
[社版]大汉战神:霍去病传
¥14.0¥40.0 -
介入护理学(案例版)
¥52.4¥69.8 -
学前教育史(第二版)
¥31.2¥48.0 -
西方经济学(宏观部分·第八版)(21世纪经济学系列教材)
¥41.7¥49.0 -
西方经济学(微观部分·第八版)(21世纪经济学系列教材)
¥17.9¥56.0 -
数理经济学的基本方法(第4版)(精)
¥56.9¥79.0 -
老子道德经注校释(精)/新编诸子集成
¥30.1¥43.0 -
科技论文规范写作与编辑(第4版)
¥63.0¥75.0