- ISBN:9787115638885
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:32开
- 页数:180
- 出版时间:2024-07-01
- 条形码:9787115638885 ; 978-7-115-63888-5
本书特色
1.本书的一作为比尔·恩门,被誉为“数据仓库之父”,先提出数据仓库概念的学者,在数据库技术管理与数据库设计方面拥有超过35年的经验。 2.本书由国际专业的数据管理专业团体DAMA中国团队翻译。 3.本书涵盖数据湖仓的多个主题,包括基本概念、应用领域和案例分析等,内容丰富多样,语言易懂简洁,能够满足不同领域读者的需求。 4.本书不仅介绍数据湖仓构建的理论知识,而且包含非常有趣的案例分析,可以帮助读者更好地理解理论知识在实际问题中的应用。
内容简介
数据湖仓是下一代数据仓库和数据湖,旨在满足复杂多变的现代信息系统的需求。本书主要展示了如何构建作为人工智能、机器学习和数据网格的基础的数据湖仓,同时介绍了数据湖仓的缺陷和使用技巧,以*大限度地提高数据湖仓的商业价值。
在本书中,我们将深入探讨数据湖仓的核心特性及其成功的关键因素。首先,我们将认识到数据质量的重要性,并通过检查输入错误、解决键的非兼容性问题以及维护良好的文档编制来提高数据的质量和可信度。其次,我们将学习数据湖仓的不同存储类型,包括未充分利用但极具价值的大容量存储器。我们也将针对数据湖仓中的3种主要数据类型——结构化数据、文本数据和模拟/物联网数据,学习如何为人工智能、机器学习和数据网格构建坚实的基础。同时,我们将探讨如何利用针对结构化数据的数据模型、针对文本数据的本体和分类标准,以及针对模拟/物联网数据的数据蒸馏算法,来抽象化这些数据,以满足未来的业务需求。*后,我们将学习如何应用ETL技术解决数据转换问题,确保构建一个高效、满足业务需求的数据湖仓。
目录
作者简介
比尔·恩门,被誉为“数据仓库之父”,出版了60本书并被译为多种语言,《计算机世界》将他评为计算机专业历史上具影响力的十大人物之一。 戴夫·拉皮恩,是辛辛那提大学林德纳商学院的副教授,有着超过25年的教学经验,还开发和管理了许多不同行业的大规模数据集成系统。 瓦莱丽·巴特尔特,在印第安纳大学凯利商学院获得信息系统博士学位和商业硕士学位,并且在电信学院获得了沉浸式媒介环境硕士学位。
-
认识电竞
¥36.0¥58.0 -
物联网应用路线图
¥8.2¥39.0 -
整理优先:小改进,大回报,整洁代码设计指南
¥37.7¥49.0 -
开启创意之门 AIGC创作一本通
¥70.0¥89.8 -
生物特征识别算法研究
¥22.2¥39.0 -
计算机视觉:从感知到重建
¥108.8¥149.0 -
AI时代程序员开发之道:CHATGPT让程序员插上翅膀
¥60.0¥79.0 -
一本书玩转MIDJOURNEY:人人都可以体验AI绘画的魅力
¥102.9¥139.0 -
和秋叶一起学EXCEL(第3版)
¥76.9¥109.9 -
矩阵力量:线性代数全彩图解+微课+Python编程
¥206.4¥258.0 -
技术为径:带领公司走向卓越的工程师
¥46.6¥79.0 -
图神经网络:基础、前沿与应用
¥139.5¥178.8 -
这才是服务设计
¥123.9¥199.8 -
全国计算机等级考试一本通 二级MS Office高级应用与设计
¥54.5¥69.9 -
设计机器学习系统
¥103.5¥138.0 -
中望CAD实用教程
¥62.3¥79.9 -
软件性能测试——LoadRunner性能监控与分析实例详解
¥63.2¥79.0 -
走进智能家居
¥35.6¥44.0 -
Autodesk Fusion 360 官方标准教程
¥119.2¥149.0 -
HCIA-Datacom网络技术学习指南/华为ICT认证系列丛书
¥124.6¥159.8