数据科学概论(第2版)(普通高等学校应用型教材·数据科学)
- ISBN:9787300299082
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:442
- 出版时间:2022-01-01
- 条形码:9787300299082 ; 978-7-300-29908-2
内容简介
本教材的内容,分为四大模块,分别是:
(1) 数据科学基础(Fundamentals):讲述数据科学的基本概念和原则。
(2) 数据和数据上的计算(Data and Computing on Data):讲述不同的数据类型及其分析方法,数据类型包括结构化数据、非结构化数据、半结构化数据,分析方法包括统计学方法、数据挖掘方法、和机器学习方法等。
(3) 数据处理基础设施、平台和工具(Infrastructure, Platforms and Tools):讲述云计算平台、数据库、大数据平台及工具、以及编程语言 Python 等。
(4) 数据科学案例和实践(Applications and Practice):讲述大数据应用的案例;并且面向金融领域的量化交易应用,从数据采集、模型训练、预测、评价、到可视化等环节,带领读者完成数据分析处理的实践。
目录
1.1 数据科学的定义
1.2 数据科学的定位
1.3 数据科学家
1.4 表示模型:对自然和社会现象进行数字化
1.5 数据科学的基本原则
1.6 数据处理流程:时间维度的纵向视角
1.7 数据处理系统的架构:系统维度的计算视角
1.8 数据的多样性:数据类型维度的横向视角
1.9 数据价值的挖掘:价值维度的价值提升视角
第2章 OLAP与数据服务
2.1 面向OLTP应用的关系数据库技术
2.2 面向数据服务的NoSOL数据库技术
2.3 NewSQL数据库技术
第3章 OLTP与结构化数据分析
3.1 联机分析处理与结构化数据分析
3.2 高性能OLAP系统的关键技术
3.3 结构化数据分析工具介绍
第4章 数据清洗与数据集成
4.1 数据抽取、转换和装载
4.2 数据清洗
4.3 数据集成
第5章 数据的深度分析(上)
5.1 机器学习与数据挖掘简介
5.2 决策树
5.3 支持向量机
5.4 KNN算法(分类)
5.5 朴素贝叶斯算法(分类)
5.6 在二值分类器上构建多类别分类器
5.7 聚类算法
5.8 EM算法(软聚类)
5.9 线1l生回归、Logistic回归
5.10 AdaBoost算法与集成学习
5.11 关联规则分析
5.12 协同过滤推荐算法
5.13 隐马尔可夫模型
第6章 数据的深度分析(下)
6.1 神经网络与深度学习(分类/回归)
6.2 数据预处理
6.3 数据降维
6.4 特征选择
6.5 机器学)-7算法的评价指标、评价以及参数优
6.6 方差与偏差
6.7 从复杂模型到简单模型以及正则化
6.8 主流数据深度分析工具
第7章 文本分析
7.1 文本分析的意义
7.2 文本分析的任务和方法
7.3 文本分析可视化
7.4 文本分析软件和工具
第8章 社交网络分析
8.1 简介
8.2 社交网络分析的应用
8.3 社交网络分析方法
8.4 软件
第9章 语义网与知识图谱
9.1 语义网的基本概盒
9.2 语义网体系结构
9.3 语义网的关键技术
9.4 知识库与知识图谱
第1O章 数据可视化、可视分析与探索式数据分析
10.1 什么是数据可视化
10.2 可视化的强大威力
10.3 可视化的一般过程
10.4 科学可视化与信息可视化
10.5 数据可视化的原则
10.6 可视化实例
10.7 可视化的挑战和趋势
10.8 可视分析技术
10.9 探索式数据分析
10.10 探索式数据分析的作用
10.11 探索式数据分析的基本方法
10.12 可视化工具介绍
第11章 数据科学案例
11.1 谷歌流感趋势预测
11.2 塔吉特的数据分析预测案例
11.3 互联网舆情监控与管理
11.4 投资与信用
11.5 IBM沃森计算机与医疗
11.6 大数据分析技术助力奥巴马的竞选团队取得成功
11.7 数据科学与科学研究
11.8 多领域预测
11.9 用户画像与精准广告
11.10 自动短文评分
11.11 数据产品
1l.12 其他数据科学案例
作者简介
覃雄派,中国人民大学信息学院计算机系副教授。2009年毕业于中国人民大学信息学院,获得工学博士学位。目前主要从事高性能数据库、大数据分析、信息检索等方面的研究工作,主持1项国家自然科学基金面上项目,参与多项国家“863”计划、“973”计划及国家自然科学基金项目,在国内外期刊和会议上发表论文30余篇。
-
深度学习的数学
¥43.5¥69.0 -
全图解零基础word excel ppt 应用教程
¥19.0¥48.0 -
机器学习
¥59.4¥108.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥31.9¥65.0 -
DIRECTX 12 3D 游戏开发实战
¥81.4¥148.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
格拉斯曼流行学习及其在图像集分类中的应用
¥13.7¥28.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥81.8¥109.0 -
十二字节
¥41.4¥69.0 -
UG NX 12.0数控编程
¥22.1¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
基于3D打印技术的产品创新设计方法
¥45.8¥88.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥83.3¥119.0