- ISBN:9787300310633
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:264
- 出版时间:2022-11-01
- 条形码:9787300310633 ; 978-7-300-31063-3
本书特色
数据会说谎?小心那些我们在不知不觉中陷入的数据陷阱!如果你曾经分析、处理过数据,那或许有过这样的经历: 你正在进行一场重要的演讲,你的数据深入而有见地,图表无可挑剔,并符合完美标准,你做出结论的推理过程无懈可击。然而在演讲的*后一刻,有人出来踢馆,指出你所使用的数据库有着根本性的错误,瞬间拆了你的台……数据陷阱的可怕之处在于,它们可能成就或破坏我们的数据工作,而我们却时常对它们视而不见。对于数据工作者来说,根本不存在从未掉入数据陷阱之人。随着数据被越来越广泛地应用,数据陷阱的危害也日益凸显。因此,作者在本书中为我们梳理总结了数据工作者***掉入的七大数据陷阱,并给出了应对之策,教会我们如何避免在处理数据时出现尴尬、代价高昂的错误,并做到对数据细节的洞察和对数据陷阱的巧妙应对,从而使我们从数据中获得*准确可靠的信息,并*终在实践应用中实现从数据到价值的转化。
内容简介
7大数据陷阱的干货总结与避坑锦囊,教会数据工作者如何在数据陷阱中迅速恢复,避免踩雷。
数据陷阱无处不在,任何处理过数据的人都会在不知不觉中多次陷入其中。我们大多数人都还没有学会如何使用现代工具和所掌握的数据类型,从而导致了一些本可以轻易避免的常见的错误。
在本书中,作者为我们展示了以下七种在数据处理过程中常见的数据陷阱:
陷阱 1:认知误差——我们如何看待数据;
陷阱 2:技术陷阱——我们如何对数据进行处理;
陷阱 3:数学失误——我们如何对数据进行计算;
陷阱 4:统计疏忽——我们如何对数据进行比较;
陷阱 5:分析偏差——我们如何对数据进行分析;
陷阱 6:绘图乌龙——我们如何对数据进行可视化;
陷阱 7:设计风险——我们如何对数据进行修饰。
同时也向我们展示了这些数据陷阱是如何产生、如何变得如此常见的,指导我们如何从一开始就避免它们,并针对上述数据陷阱,提供了与之相对应的真实示例,以及数据可视化的实用指导。阅读本书,你将:
·深入了解随着我们对数据的依赖而增长的“数据与现实的差距”;
·了解如何使用正确的工具简化可视化过程;
·避免数据分析、可视化和演示中的常见错误;
·创建并呈现清晰、准确、有效的数据可视化。
目录
七种特定类型的数据陷阱?? / 5
避免七种数据陷阱?? / 9
“我掉进陷阱里,爬不出来了”?? / 10
第2章 陷阱 1: 认知误差????/ 13
我们如何看待数据?? / 15
陷阱 1A:数据与现实的差距?? / 16
陷阱 1B:过度依赖手工的数据?? / 26
陷阱 1C:前后矛盾的评分?? / 34
陷阱 1D:黑天鹅陷阱?? / 42
陷阱 1E:可证伪性与上帝陷阱?? / 45
避免天鹅陷阱和上帝陷阱?? / 47
第3章 陷阱 2:技术陷阱????/ 51
我们如何对数据进行处理?? / 53
陷阱 2A:脏数据?? / 54
陷阱 2B:糟糕的混合和连接?? / 73
第4章 陷阱 3:数学失误????/ 77
我们如何对数据进行计算?? / 79
陷阱 3A:多重汇总?? / 80
陷阱 3B:缺失值?? / 86
陷阱 3C:汇总数?? / 91
陷阱 3D:荒谬的百分比?? / 96
陷阱 3E:不匹配的单位?? / 102
第5章 陷阱 4:统计疏忽????/ 107
我们如何对数据进行比较?? / 109
陷阱 4A:描述性错误?? / 111
陷阱 4B:推断陷阱?? / 131
陷阱 4C:狡猾的抽样?? / 135
陷阱 4D:对样本量不敏感?? / 142
第6章 陷阱 5:分析偏差????/ 147
我们如何对数据进行分析?? / 149
陷阱 5A:错误地认为直觉和分析相互对立?? / 150
陷阱 5B:浮夸的外推?? / 158
陷阱 5C:欠考虑的插值?? / 163
陷阱 5D:不靠谱的预测?? / 166
陷阱 5E:不过脑子的衡量指标?? / 168
第7章 陷阱 6:绘图乌龙????/ 175
我们如何对数据进行可视化?? / 177
陷阱 6A:棘手的图表?? / 179
陷阱 6B:数据教条主义?? / 204
陷阱 6C:错误地认为“*优”和“满意”相互对立?? / 209
第8章 陷阱 7:设计风险????/ 215
我们如何对数据进行修饰?? / 217
陷阱 7A:令人困惑的颜色?? / 219
陷阱 7B:遗漏的机会?? / 224
陷阱 7C:可用性?? / 230
第9章 结语????/ 239
避免陷入数据陷阱的检查单?? / 245
“未被听见的声音”陷阱?? / 247
译者后记?? / 251
节选
《法句经》(The Dhammapada)即佛陀所说之法浓缩的“偈颂”,其中有这样一段经文: 若见彼智者,能指示过失,并能谴责者,当与彼为友; 犹如知识者,能指示宝藏,与彼智人友,定善而无恶。 大多数充满智慧的古代经文都劝告人们要寻找智者并汲取他们的建议。如果你认真聆听他们的话,就能避免可怕的错误,以及这些错误给你生活所带来的痛苦和不幸。我们每个人都会不时地需要一位导师、向导或专家。 不幸的是,我可能不是你要找的那个智者。我会说我更像一个在寻找这样一位智者过程中饱受挫折的普通人。因此,我更像乔恩·邦·乔维(Jon Bon Jovi)在《一鼓作乐》(Bang A Drum)中唱到的那样: 不,我不敢自称是个智者、诗人或圣人。我只是一个不断追寻更好生活的普通人。 在从事数据工作的过程中,很多次我都发现,捕捉并传达我所犯过以及我所看到的其他人犯过的错误类型,也许会有所帮助。我曾在全美各地的生产和交易环境(如工厂车间、会议室和新闻编辑室)中处理数据,也曾在东西两岸的企业会议室、虚拟聊天室以及学术大厅培训并教导人们如何处理数据。 这本书到底对哪些人有帮助呢?其实我自己就算一个。每当我在写博客、录制课程或制作演示文稿时,我发现自己一次又一次地回顾这些材料。每当我这样做时,我都会停下脚步,想想过去的我是如何比现在的我聪明这么多的,并对此表示感激。 我希望这本书也能对你有所帮助。如果你的数据之旅刚刚开始,我保证这当中大多数陷阱你都会遇到。我希望你在见到它们的那一刻就能识别出它们是什么——有时看一眼就能发现问题,而有时则需要在细节中发现。 如果你从事数据工作已经有些日子了,你会翻翻这章,看看那章,然后不由自主地点点头,低头瞥一眼跟我一起掉坑里时留下的一两个伤疤。当你读到关于其他类型陷阱的内容时,你可能会眉头一皱,心里一沉——你可能已经犯了这个错误,但还没有意识到。如果是这样,我想说我完全能够感受到你的痛苦。 不过重要的是,我们要学会振作起来,掸掉裤子上的灰尘,清理掉那些磨损的痕迹,抚平我们可能遭受的任何挫伤,然后继续前行,争取在未来避免重蹈覆辙。 同样重要的是,我们应当对他人展示出同样的宽容。犯错太容易了,而且犯错是一定会发生的。即使是专家,也经常会陷入数据陷阱。正如一条破旧的小路标示了穿越地形的*佳路线,我们越能承认并谈论自己的缺点,其他人落入我们曾经陷入过的陷阱的可能性就越小。我们将会为他们留下警告标志。 当提出并分享我们的错误时,你我可能都不得不放下曾经的骄傲,不过,我们可以将其视为留给后辈的礼物。他们可能会摇头,心想这些人怎么会搞得如此糟糕,但你我都知道,他们顺利发展的唯一原因就是我们帮他们避免了失误。 相较于维护你我的自尊而言,让人类能够进化成对地球而言快速且有效的数据劳动力才是更重要的事。我们目前还远没到那一步,甚至难以望其项背。 我想把这本书献给我的父亲理查德·琼斯(Richard Jones)。他的为人真的很棒,并且和我们一样,他一生中跌入过很多陷阱。当我让他面对那些他做过的伤害我的事情时,他都完全承认,并为此道歉。我永远不会忘记他给我的这份礼物。这让我十分释然。 从那以后,无论是个人层面还是专业层面,我在承认自己的错误方面的表现都要比以前好很多。谢谢你,爸爸,我爱你。 在他的病情恶化之前,我签了这本书的出版合同。半年后,他因恶性胶质瘤去世了,而我也失去了所有当初支撑我想要完成这本书的动力。在此期间,我的编辑和出版社团队对我非常友善。重拾写书热情的过程花了一段时间,确切地说是四年,但*终我完成了这本书。 从积极的一面来看,所有多出的时间都意味着我能发现更多的陷阱并加入到相应的章节中,而它们当中的大多数都是我曾掉进去过的陷阱。 我希望这本书对你有所帮助。愿你能警惕每个转角的陷阱,在数据之路上大步向前。愿你无论何时遇到错误都能表现出同理心,并愿你与身边的人分享经验教训。*后,愿你在这条道路上达到极高的境界,发现新的宝藏,解决急迫的问题,并解锁你从未预见过的成长。 如果你遇到了一些非常有智慧的数据专家,你可以把他们介绍给我,我会非常感激,因为我还有很多内容要向他们学习。
作者简介
◆ 作者简介 本·琼斯 Data Literacy公司创始人兼首席执行官,在华盛顿大学连续学院教授数据可视化。著有《用Tableau交流数据》(Communicating Data with Tableau)和《数据素养的17个关键特征》(17 Key Traits of Data Literacy)。凭借20多年的机械工程师、持续改进项目负责人和导师以及商业智能营销人员的工作经验,他学到很多关于处理数据时应该做什么和不应该做什么的知识。◆ 译者简介 陈天皓 工商管理和信息技术双硕士,项目管理专业人士。曾译有《商业仪表盘可视化解决方案》《人类未来进化史》等书,长期关注科技发展趋势与数据应用领域。段力鲡 香港城市大学统计学硕士,深耕大数据挖掘与分析领域,曾分别于英国保诚(亚洲总部)、平安寿险总部担任数据科学家。现就职于沃尔玛中国,担任商业分析经理。步凡 北京大学数学科学学院本科,美国杜克大学统计学博士。现任美国加州大学洛杉矶分校(UCLA)博士后研究员。主要研究方向为贝叶斯统计、随机过程模型、传染病动力模型等。
-
全图解零基础word excel ppt 应用教程
¥15.6¥48.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
机器学习
¥59.4¥108.0 -
情感计算
¥66.8¥89.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥48.3¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
LINUX实战——从入门到精通
¥48.3¥69.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥38.7¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0