- ISBN:9787302553731
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:240
- 出版时间:2020-08-01
- 条形码:9787302553731 ; 978-7-302-55373-1
本书特色
结构清晰、内容新颖。内容以大数据理论基础、大数据处理的实践技术方法和大数据技术的具体应用为主线,吸纳互联网大数据处理技术相关较新研究成果。 理论与实践结合。书中对大数据的概念、挖掘应用进行了系统的介绍,并且配备了相关的案例以及实际操作过程。 案例时效性强。《大数据处理技术与应用》致力于通过理论及案例讲解帮助读者理顺大数据处理及应用等方面的实战方法,以达到“真正掌握互联网大数据处理及应用实战方法”的效果。
内容简介
《大数据处理技术与应用》对大数据的概念、挖掘、应用进行了系统的介绍,并且配备了相关的案例以及实际操作过程。这种理论与实践相结合的方式能够极大地帮助读者掌握大数据领域的相关理论知识。 《大数据处理技术与应用》共分为10章,主要内容包含互联网大数据概述、互联网大数据采集与获取实战要领、做好数据预处理的实战方法、数据相关性分析与回归分析的黄金法则、如何利用关联规则进行大数据挖掘、大数据分析中的四种常见分类算法、大数据分析中的四种常见聚类算法,以及自组织神经网络算法与人工神经网络算法、互联网大数据分析应用——产品个性化推荐系统、大数据分析在具体行业中的应用等。 《大数据处理技术与应用》知识体系完善且适用,可作为高等院校大数据、人工智能等相关专业课程的教材,也可作为从事数据挖掘、机器学习工作以及其他相关工程技术工作人员的参考书。
目录
第1章 互联网大数据概述
1.1 认识大数据
1.1.1 大数据的定义
1.1.2 大数据的特征
1.1.3 未来十年大数据分析的发展趋势
1.2 常用大数据处理、分析工具介绍
1.2.1 大数据的存储工具
1.2.2 大数据的软件开发工具
1.2.3 大数据的挖掘工具
1.2.4 大数据的可视化工具
小结
第2章 互联网大数据采集与获取实战要领
2.1 互联网大数据采集与处理技术概述
2.1.1 数据采集的基本流程与关键技术
2.1.2 数据处理的基本流程与关键技术
2.2 Web页面数据获取实战方法
2.2.1 Jsoup技术与页面数据获取
2.2.2 应对特定领域的Deep Web数据获取技术
2.3 利用爬虫抓取互联网大数据实战技巧
2.3.1 Python爬虫工作原理
2.3.2 利用HtmlParser实现网页链接的提取实战
小结
第3章 做好数据预处理的实战方法
3.1 数据预处理概述
3.1.1 数据预处理的目的
3.1.2 数据预处理的方法
3.2 从问题分析到数据清洗实战策略
3.2.1 数据清洗的步骤
3.2.2 缺失值的识别与处理技巧
3.2.3 异常值的判断、检验与处理
3.3 数据集成与数据转换实战方法
3.3.1 数据集成常见方法
3.3.2 数据转换过程中的离散化
3.4 数据的特征选择
3.4.1 常用数据特征选择方法
3.4.2 Relief算法与费希尔判别法的应用
3.5 数据预处理实战案例分析
小结
第4章 数据相关性分析与回归分析的黄金法则
4.1 什么是数据集
4.1.1 数据集的概念与常见类型
4.1.2 高效进行数据度量的实战技巧
4.2 做好数据相关性分析
4.2.1 进行数据相关性分析的作用
4.2.2 常用的数据相关分析方法
4.3 做好数据回归分析实战要领
4.3.1 数据回归分析方法概述
4.3.2 数据回归分析所能解决的实际问题
小结
第5章 如何利用关联规则进行大数据挖掘
5.1 关联规则
5.1.1 什么是关联规则
5.1.2 关联规则挖掘的应用场景
5.2 关联规则挖掘实战流程分析
5.2.1 关联规则常见分类与四个基本属性
5.2.2 快速找出*大高频项目组的实战技巧
5.3 关联规则发掘中重要的Apriori算法
5.3.1 Apriori算法的基本原理
5.3.2 Apriori算法运行的基本流程
5.4 针对Apriori算法缺点的其他关联规则挖掘算法
5.4.1 Apriori算法的两大缺点
5.4.2 基于划分规则的算法
5.4.3 FP-Growth算法
小结
第6章 大数据分析中的四种常见分类算法
6.1 分类算法概述
6.1.1 有关分类算法的基本概念
6.1.2 分类算法的常见应用场景
6.2 KNN算法
6.2.1 KNN算法的工作原理与特点
6.2.2 快速找到*优k值的实用策略
6.3 决策树与随机森林算法
6.3.1 决策树算法
6.3.2 Bagging与Boosting的区别
6.3.3 随机森林分类算法的优势与应用场景
6.4 朴素贝叶斯分类算法
6.4.1 朴素贝叶斯分类算法运行原理分析
6.4.2 贝叶斯网络
6.4.3 贝叶斯决策理论
6.5 支持向量机
6.5.1 支持向量机的基本思想与特点
6.5.2 *优分类面和广义*优分类面
6.5.3 非线性支持向量机与核函数
小结
第7章 大数据分析中的四种常见聚类算法
7.1 大数据分析聚类算法概述
7.1.1 聚类分析的相关概念及应用场景
7.1.2 聚类算法运行基础:簇与距离度量
……
第8章 自组织神经网络算法与人工神经网络算法
第9章 互联网大数据分析应用产品个性化推荐系统
第10章 大数据分析在具体行业中的应用
参考文献
作者简介
彭进香,湖南应用技术学院信息工程学院院长,副教授,市级优秀教师,“十三五”校级首批重点建设学科——计算机应用技术学科建设负责人。近年来主持和参与省、市级教研、科研项目20多项,指导省大学生研究性学习和创新性实验计划项目2项,发表研究论文20多篇,主编和参编教材6部,专利1项,软件著作权2项。对互联网企业从事数据挖掘有较深的研究,在大数据挖掘、分析及实战场景应用方面具有深厚经验。
-
全图解零基础word excel ppt 应用教程
¥15.6¥48.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
机器学习
¥59.4¥108.0 -
情感计算
¥66.8¥89.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥48.3¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
LINUX实战——从入门到精通
¥48.3¥69.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥38.7¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0