- ISBN:9787563832934
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:24cm
- 页数:172页
- 出版时间:2022-04-01
- 条形码:9787563832934 ; 978-7-5638-3293-4
内容简介
本书主要围绕着“什么是数据预处理、数据预处理的作用是什么、如何进行数据预处理”展开, 主要内容包括缺失值处理、数据纠错、数据格式转化、低频分类数据处理、高偏度数据处理、异常值处理、数据配平、数据特征缩放、数据归约等。通过本书的学习, 读者可以充分理解常用数据预处理方法的精髓, 并掌握具体技术细节, 为数据分析实践打下扎实基础。
目录
目录
1大数据预处理概述()
11大数据预处理的目的和主要内容()
12本书主要使用的数据集()
2缺失值及其处理方法()
21概述()
22缺失值的填补()
23缺失值信息的提取()
本章练习()
3数据纠错与格式处理()
31概述()
32数据的逻辑纠错()
33数据的格式纠错()
34日期时间型数据特征及其应用()
本章练习()
4数据类型转换()
41概述()
42数据离散化()
43定性变量数据类型的转换()
本章练习()
5异常分布数据处理Ⅰ:低频分类数据、高偏度数据、异常值()
51概述()
52低频分类数据处理()
53高偏度数据处理()
54异常值检测与处理()
本章练习()
6异常分布数据处理Ⅱ:不平衡数据()
61概述()
62不平衡数据的配平()
63不平衡数据配平的影响()
本章练习()
7数据特征缩放()
71概述()
72数据特征缩放方法()
73数据特征缩放的效果()
本章练习()
8数据归约()
81概述()
82变量选择()
83样本归约()
84伪自变量的识别与影响()
本章练习()
作者简介
陈蕾,首都经济贸易大学财政税务学院教授、博士生导师,中央财经大学金融学博士后,美国密歇根州立大学访问学者,国际注册企业价值评估分析师(ICVS)。具有多学科背景,分别在武汉大学和中南财经政法大学获理学学士学位、法学硕士学位和经济学博士学位。兼任国务院国有资产监督管理委员会资产评估项目评审专家、中国资产评估协会国际业务专家、全国资产评估师考试教材编写组专家、北京资产评估协会教育培训委员会委员、国际企业价值评估分析师协会教育委员会委员等。主要研究领域为企业价值与无形资产评估、数字经济与数据资产、产业组织理论。 独立出版专著2部、全英文编著著作1部,参编著作7部;在《管理世界》《改革》《统计研究》等学术刊物及相关会议上发表论文90余篇;主持国家社会科学基金项目、北京市社会科学基金项目、中国博士后科学基金特别资助项目、中国博士后科学基金面上一等资助项目、中国资产评估行业青年研究项目等课题10余项。主要讲授“评估学原理(双语)”“国际评估准则(双语)”“资产评估理论与方法”“无形资产评估”等课程。
-
Excel高效办公应用于技巧大全
¥21.4¥49.8 -
计算机二级office通关秘籍
¥19.6¥28.0 -
大师谈游戏设计 创意与节奏
¥38.3¥49.8 -
全图解零基础word excel ppt 应用教程
¥14.4¥48.0 -
C++面向对象程序设计习题解答与上机指导 第2版
¥35.4¥59.0 -
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
¥24.8¥45.0 -
DAMA数据管理知识体系指南(原书第2版)
¥94.7¥128.0 -
Python数据爬取技术与实战手册
¥22.7¥59.8 -
HTML & CSS设计与构建网站
¥43.9¥79.8 -
flash经典课堂动画、游戏与多媒体制作案例教程
¥54.5¥99.0 -
推荐系统:产品与算法解析
¥62.2¥79.8 -
社交网络对齐
¥77.8¥99.8 -
大数据基础
¥22.8¥38.0 -
技术之外
¥48.3¥69.0 -
贝叶斯数据分析(第2版)
¥151.8¥199.8 -
零基础玩转STABLE DIFFUSION
¥72.9¥99.8 -
Blender超级学习手册
¥86.3¥119.9 -
高效C/C++调试
¥69.3¥99.0 -
AIGC从入门到实战:CHATGPT+MIDJOURNEY+STABLE DIFFUSION+行业应
¥48.9¥69.8 -
实战AI大模型
¥74.3¥99.0