×
暂无评论
图文详情
  • ISBN:9787115638885
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:32开
  • 页数:180
  • 出版时间:2024-07-01
  • 条形码:9787115638885 ; 978-7-115-63888-5

本书特色

1.本书的一作为比尔·恩门,被誉为“数据仓库之父”,先提出数据仓库概念的学者,在数据库技术管理与数据库设计方面拥有超过35年的经验。 2.本书由国际专业的数据管理专业团体DAMA中国团队翻译。 3.本书涵盖数据湖仓的多个主题,包括基本概念、应用领域和案例分析等,内容丰富多样,语言易懂简洁,能够满足不同领域读者的需求。 4.本书不仅介绍数据湖仓构建的理论知识,而且包含非常有趣的案例分析,可以帮助读者更好地理解理论知识在实际问题中的应用。

内容简介

数据湖仓是下一代数据仓库和数据湖,旨在满足复杂多变的现代信息系统的需求。本书主要展示了如何构建作为人工智能、机器学习和数据网格的基础的数据湖仓,同时介绍了数据湖仓的缺陷和使用技巧,以*大限度地提高数据湖仓的商业价值。
在本书中,我们将深入探讨数据湖仓的核心特性及其成功的关键因素。首先,我们将认识到数据质量的重要性,并通过检查输入错误、解决键的非兼容性问题以及维护良好的文档编制来提高数据的质量和可信度。其次,我们将学习数据湖仓的不同存储类型,包括未充分利用但极具价值的大容量存储器。我们也将针对数据湖仓中的3种主要数据类型——结构化数据、文本数据和模拟/物联网数据,学习如何为人工智能、机器学习和数据网格构建坚实的基础。同时,我们将探讨如何利用针对结构化数据的数据模型、针对文本数据的本体和分类标准,以及针对模拟/物联网数据的数据蒸馏算法,来抽象化这些数据,以满足未来的业务需求。*后,我们将学习如何应用ETL技术解决数据转换问题,确保构建一个高效、满足业务需求的数据湖仓。

目录

第 1章 让数据可信 1 1.1 做一个成熟的终端用户 2 1.2 不断攀升的可信目标 5 1.3 可信数据的要素 7 1.4 小结 8 第 2章 基础数据 9 2.1 构建应用程序 9 2.2 以人工智能医疗为例 10 2.3 基础数据的组成要素 12 2.4 小结 14 第3章 如何避免不良数据 15 3.1 输入错误 16 3.2 键的问题 18 3.3 重复记录 18 3.4 拼写错误 19 3.5 兼容性 19 3.6 编制文档 21 3.7 小结 22 第4章 不同类型的数据 24 4.1 数据量 24 4.2 数据的业务价值 25 4.3 数据的访问概率 27 4.4 数据降级 29 4.5 基于大容量存储器的数据归档机制 30 4.6 小结 30 第5章 数据抽象 31 5.1 结构化数据模型 32 5.2 本体和分类标准 34 5.3 模拟/物联网数据的蒸馏算法 36 5.4 小结 37 第6章 结构化数据 39 6.1 业务交易生成的数据 40 6.2 结构化记录 40 6.3 键 42 6.4 联机事务处理 43 6.5 组织数据 45 6.6 小结 46 第7章 文本数据 48 7.1 文本数据的类型 48 7.2 使用文本数据时的语言障碍 50 7.3 多义词 51 7.4 提取业务的含义 51 7.5 小结 54 第8章 模拟/物联网数据 56 8.1 数据有用性的差异 57 8.2 摄像头 58 8.3 人工审视 59 8.4 日期分隔 60 8.5 数据筛选 61 8.6 阈值方法 61 8.7 时间排序方法 62 8.8 小结 63 第9章 大容量存储器与数据湖仓 65 9.1 大容量存储器的优缺点 66 9.2 访问概率 67 9.3 索引 70 9.4 元数据和大容量存储器 71 9.5 小结 71 第 10章 数据架构与数据工程 73 10.1 两个角色如何通力配合 74 10.2 角色与数据类型 75 10.3 小结 79 第 11章 业务价值 81 11.1 业务价值才是驱动力 81 11.2 一切都离不开钱 82 11.3 基础数据 83 11.4 难以协调 84 11.5 领域 85 11.6 小结 86 第 12章 数据需要的层次 87 12.1 数据获取 89 12.2 数据传输与存储 90 12.3 数据转换 91 12.4 数据标签、整合与汇聚 92 12.5 数据分析与机器学习 93 12.6 小结 95 第 13章 数据湖仓中的数据集成 97 13.1 不同种类数据的集成 98 13.2 自动集成 98 13.3 ETL 99 13.4 文本ETL 101 13.5 数据蒸馏算法 103 13.6 小结 104 第 14章 分析 105 14.1 结构化数据分析 105 14.2 文本数据分析 107 14.3 模拟/物联网数据分析 108 14.4 结构化数据和文本数据的结合 109 14.5 连接3个环境 111 14.6 执行分析 112 14.7 小结 113 第 15章 软数据 114 15.1 电子表格数据 115 15.2 互联网数据 116 15.3 政府数据 117 15.4 小结 117 第 16章 描述性数据 119 16.1 数据模型 121 16.2 元数据 122 16.3 结构化数据转换 123 16.4 结构化数据源 124 16.5 数据选择标准 125 16.6 数据定义语言 125 16.7 数据编码 126 16.8 数据关系 127 16.9 文本数据 128 16.10 本体 129 16.11 分类标准 131 16.12 关联 132 16.13 上下文情境 133 16.14 文本数据源 134 16.15 模拟/物联网数据 135 16.16 算法 136 16.17 阈值 136 16.18 时间排序 137 16.19 模拟/物联网数据源 138 16.20 数据血缘 138 16.21 小结 139 第 17章 数据目录 140 17.1 永久维护 141 17.2 开放 141 17.3 不同数据类型的内部结构 142 17.4 小结 143 第 18章 数据架构的演化 144 18.1 伊始 144 18.2 应用程序 145 18.3 磁带文件 146 18.4 硬盘存储 147 18.5 OLTP 148 18.6 个人计算机 149 18.7 4GL处理技术和数据抽取应用程序 150 18.8 数据仓库 152 18.9 数据集市 153 18.10 互联网和物联网数据 154 18.11 数据湖 155 18.12 数据湖仓 157 18.13 小结 158
展开全部

作者简介

比尔·恩门,被誉为“数据仓库之父”,出版了60本书并被译为多种语言,《计算机世界》将他评为计算机专业历史上具影响力的十大人物之一。 戴夫·拉皮恩,是辛辛那提大学林德纳商学院的副教授,有着超过25年的教学经验,还开发和管理了许多不同行业的大规模数据集成系统。 瓦莱丽·巴特尔特,在印第安纳大学凯利商学院获得信息系统博士学位和商业硕士学位,并且在电信学院获得了沉浸式媒介环境硕士学位。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航