×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
暂无评论
图文详情
  • ISBN:9787111607670
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:303
  • 出版时间:2018-08-01
  • 条形码:9787111607670 ; 978-7-111-60767-0

本书特色

中国科协新一代信息技术系列丛书之一,张尧学院士主编,多位清华北大等名师参编

内容简介

本书是中国科协新一代信息技术系列丛书之一。 本书重点阐述大数据的基本原理;技术;平台和不同领域的应用案例。全书共分13 章,第1 章为绪论;第2 ~ 7 章为技术章节,介绍了数据采集与治理;数据管理;数据分析;数据可视化;数据安全与隐私保护和大数据处理平台;第8 ~11 章为大数据在不同领域的应用案例,包括社会网络大数据;城市大数据;工业大数据和教育大数据;第12;13 章为数据管理章节,包括数据开放与共享和大数据的法律政策规范。 本书主要面向大学非计算机类的工科专业的高年级学生与研究生,亦可作为大数据爱好者的科普读物。 本书配有免费的电子课件,欢迎选用本书作教材的老师登录www.cmpedu.com 注册下载。

目录

目录


前 言


基 础 篇


第1 章 绪论 3


1.1 概述 3


1.1.1 数据 4


1.1.2 数据中蕴含的价值 6


1.1.3 获取数据中蕴含的价值 8


1.2 大数据的内涵和外延 9


1.2.1 大数据时代的驱动力 9


1.2.2 大数据的概念和特征 10


1.2.3 大数据带来的思维模式改变 12


1.2.4 大数据的作用和意义 13


1.3 大数据的技术挑战和科学意义 15


1.3.1 数据处理的一般过程 16


1.3.2 大数据计算面临的挑战 17


1.3.3 大数据计算的特点 18


1.3.4 大数据计算平台 19


1.3.5 大数据与云计算;人工智能的关系 20


1.4 数据科学 22


1.4.1 数据科学的提出 23


1.4.2 数据科学的范畴 23


1.4.3 数据科学对学科发展的影响 24


习题 25


参考文献及扩展阅读资料 26


技 术 篇


第2 章 数据采集与治理 29


2.1 概述 30


2.2 大数据的来源与多源数据的采集方式 30


2.2.1 大数据的来源 30


2.2.2 多源数据的采集 31


2.2.3 数据离散化 33


2.3 数据集成和跨界应用的数据集成方法 34


2.3.1 数据集成的定义与形式 34


2.3.2 传统数据集成 35


2.3.3 跨界数据集成 38


2.4 数据的预处理 40


2.4.1 数据变换 40


2.4.2 数据质量的检验与提升 41


习题 44


参考文献及扩展阅读资料 44


第3 章 数据管理 46


3.1 概述 46


3.2 关系数据库 47


3.2.1 关系数据模型 48


3.2.2 结构化查询语言 51


3.2.3 数据库事务 52


3.2.4 关系数据库管理系统 53


3.3 分布式文件系统 54


3.3.1 Hadoop 55


3.3.2 Ceph 57


3.3.3 GlusterFS 59


3.3.4 分布式文件系统对比 60


3.4 新型数据管理与查询系统 61


3.4.1 NoSQL 数据库 61


3.4.2 SQL on Hadoop 系统 65

......


展开全部

作者简介

大数据导论; 编写组 顾问: 李德毅 中国工程院院士 梅 宏 中国科学院院士 王海峰 百度高级副总裁 主编: 张尧学 中国工程院院士 执行主编: 胡春明 北京航空航天大学 参编: 王宏志 哈尔滨工业大学 唐 杰 清华大学 王建民 清华大学 袁晓如 北京大学 朱跃生 北京大学 吴中海 北京大学 吕金虎 北京航空航天大学 王 晨 清华大学 陈恩红 中国科学技术大学 刘 闯 中国科学院 王德庆 北京航空航天大学 马民虎 西安交通大学

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航