- ISBN:9787302662136
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:220
- 出版时间:2024-06-01
- 条形码:9787302662136 ; 978-7-302-66213-6
本书特色
《数据科学》(第2版)为国家一流本科课程《数据科学导论》配套建设教材、中国人民大学“十四五”规划教材,作者因数据科学课程荣获北京市高等学校教学创新大赛一等奖、产学合作协同育人项目优秀案例项目、北京市优质教材、数据科学50人等多项奖励,在国内有较大的影响力。本书为作者10余年从事数据科学教学和科研一线的经验积累。
内容简介
《数据科学》(第2版)是一部系统阐述数据科学理论与实践的入门教材,内容与时俱进,联系实际,致力于将**的数据科学动 态、国内外名校的教学经验,以及当前社会对数据科学人才的需求整合到内容中,同时融入思政教育内容,彰显中国 特色。 本书共7 章,主要内容包括数据科学的术语与理念、流程与活动、方法与技术、社会及人文、产品与产业、人才 与职业发展以及应用与实践等,旨在实现理论与实践、基础知识与前沿技术、学术研究与实际应用之间的有机融合, 使之成为一部既实用又富有前瞻性的数据科学教材。 本书适合作为高等学校数据科学与大数据技术、大数据管理与应用、计算机科学与技术、统计学、工商管理、信 息管理与信息系统、商业分析等多个专业本科生数据科学课程的教材,也可供数据科学从业人员参考使用。
目录
1.1 关键术语 2
1.1.1 DIKW 模型 2
1.1.2 大数据 4
1.1.3 数据科学 7
1.2 核心理念 10
1.2.1 数据驱动型决策 10
1.2.2 数据密集型科学发现 12
1.2.3 数据分析式思维 14
1.2.4 数据科学向善 16
1.2.5 概率近似正确 19
1.2.6 数据资产化管理 19
1.3 学科特征 21
1.3.1 Drew Conway 数据科学韦恩图 21
1.3.2 Jeffrey D. Ullman 数据科学韦恩图 23
1.4 典型应用 24
1.4.1 GFT 流感趋势分析 24
1.4.2 Metromile 的汽车保险创新 25
习题 27
第2 章 数据科学的流程与活动 33
2.1 数据加工 36
2.1.1 数据大小及规范化 36
2.1.2 缺失数据及其处理 37
2.1.3 异常数据及其处理 38
2.1.4 数据维度及降维处理 42
2.2 数据管理 44
VIII 数据科学 第2 版
2.3 数据分析 46
2.3.1 数据分析方法 46
2.3.2 数据分析工具 48
2.4 数据可视化 51
2.4.1 视觉编码与视觉通道 53
2.4.2 可视分析学 56
2.4.3 常用统计图表 58
2.5 数据故事化 62
2.5.1 与数据可视化的关系 62
2.5.2 主要特征 64
2.5.3 故事金字塔模型 67
2.5.4 EEEs 模型 68
习题 70
第3 章 数据科学的方法与技术 76
3.1 人工智能 77
3.1.1 定义及特征 77
3.1.2 主要类型 78
3.1.3 与数据科学的关系 80
3.1.4 主要内容 80
3.2 机器学习 81
3.2.1 定义及特征 82
3.2.2 主要类型 83
3.2.3 与数据科学的关系 84
3.2.4 常用机器学习算法 85
3.3 深度学习 88
3.3.1 定义及特征 88
3.3.2 主要类型 88
3.3.3 与数据科学的关系 89
3.3.4 常用深度学习算法 90
3.4 大数据技术 91
3.4.1 定义与特征 91
3.4.2 主要类型 93
3.4.3 与数据科学的关系 94
目 录 IX
3.4.4 常用大数据技术 95
3.5 数据科学的编程语言 104
3.5.1 定义与特征 104
3.5.2 主要类型 105
3.5.3 与数据科学的关系 105
3.5.4 常用数据科学编程语言 106
习题 110
第4 章 数据科学的社会及人文 117
4.1 偏见及悖论 118
4.1.1 幸存者偏差 118
4.1.2 辛普森悖论 119
4.1.3 伯克森悖论 121
4.2 伦理及道德 122
4.3 隐私保护 123
4.4 A/B 测试 126
4.5 数据安全保障 128
4.5.1 数据安全法 128
4.5.2 P2DR 模型 130
4.6 解释与信任 130
习题 134
第5 章 数据科学的产品与产业 139
5.1 数据产品 140
5.1.1 数据产品研发的特征 140
5.1.2 数据柔术 141
5.2 数据能力 143
5.2.1 关键过程域 144
5.2.2 成熟度等级 146
5.2.3 成熟度评价 147
5.3 数据治理 148
5.3.1 主要内容 149
5.3.2 参考框架 150
5.4 数据科学平台 152
X 数据科学 第2 版
5.4.1 数据科学平台的类型 153
5.4.2 数据科学平台的评价 154
5.5 数据科学的产业 156
习题 158
第6 章 数据科学的人才与职业 162
6.1 数据职业的主要类型 163
6.2 数据科学家的岗位职责 166
6.2.1 以数据为中心的解决方案的提出 166
6.2.2 从海量数据中发现有价值的洞察 166
6.2.3 面向具体业务的算法/ 模型研发 167
6.2.4 假设检验与试验设计 168
6.2.5 数据治理与数据质量控制 168
6.2.6 数据产品的研发及基于数据的传统产品的创新 168
6.2.7 数据全流程的参与 169
6.2.8 跨部门和跨领域合作 169
6.3 数据科学家的能力要求 170
6.3.1 与数据科学直接相关的知识和技能 170
6.3.2 与数据科学无直接相关的能力要求 171
习题 173
第7 章 数据科学的应用与实践 178
7.1 业务理解 179
7.2 数据读入 180
7.3 数据理解 180
7.4 数据准备 181
7.5 模型构建 183
7.6 模型预测 187
7.7 模型评价 187
习题 190
参考文献 195
附录A Python 数据分析中常用的语法要点及讲解 197
附录B 例题R 语言版本代码 205
作者简介
朝乐门,1979年生,中国人民大学数据工程与知识工程教育部重点实验室、信息资源管理学院副教授,博士生导师;章鱼大数据首席数据科学家:中国计算机学会信息系统专委员会委员、ACM高级会员、国际知识管理协会正式委员、全国高校大数据教育联盟大数据教材专家指导委员会委员;获得北京市中青年骨干教师称号、国际知识管理与智力资本杰出成就奖、Emerald/EFMD国际杰出博士论文奖、国家自然科学基金项目优秀项目、中国大数据学术创新奖和中国大数据创新百人等多种奖励30余项。朝乐门是我国**部系统阐述数据科学理念、理论、方法、技术和工具的重要专著——《数据科学》(清华大学出版社,2016)的作者。
-
落洼物语
¥8.9¥28.0 -
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
中国当代文学名篇选读
¥17.0¥53.0 -
中医基础理论
¥50.7¥59.0 -
长征记忆(八品)
¥9.5¥45.0 -
北大人文课(平装)
¥12.2¥45.0 -
世界现代设计史-[第二版]
¥63.6¥120.0 -
断代(八品)
¥13.4¥42.0 -
宪法-第二版
¥20.3¥29.0 -
先进防伪技术
¥81.3¥98.0 -
当代中国政府与政治 第二版
¥57.8¥68.0 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
毛泽东思想和中国特色社会主义理论体系概论(2021年版)
¥8.5¥25.0 -
新闻学概论(第七版)(新闻与传播学系列教材(新世纪版))
¥30.0¥50.0 -
办公室工作实务(第4版)/黄海
¥27.8¥48.0 -
全国压力管道设计和审批人员培训教材(第四版)
¥160.4¥198.0 -
习近平总书记教育重要论述讲义
¥13.3¥35.0 -
无人机概论
¥37.2¥59.0 -
(平装)北大必修课:北大口才课
¥18.2¥45.0