×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
R统计与数据可视化:社会科学数据分析实践(全彩)

R统计与数据可视化:社会科学数据分析实践(全彩)

1星价 ¥109.9 (6.5折)
2星价¥109.9 定价¥169.0
暂无评论
图文详情
  • ISBN:9787121461910
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:504
  • 出版时间:2023-09-01
  • 条形码:9787121461910 ; 978-7-121-46191-0

本书特色

学习统计学及数据分析的艺术与实践的*好方式,就是进行数据分析。本书用大量案例辅以数据可视化,将统计学知识融汇其中,循循善诱,帮助读者避坑排雷,培养正确的数据分析思维方式。本书适合数据分析初学者,也适合有经验的数据分析人员。

内容简介

书的目的是讲解数据分析的方法、逻辑、艺术与实践。全书共17章,第1章介绍了R、RStudio和R Markdown的安装和使用,第2章介绍了数据分析的动机和四个构成要素:①描述数据并形成假设②模型的构建与估计③诊断④提出下一个问题,后续章节将按照数据分析构成要素的顺序来组织;对数据了解得越多,我们就越能够提出更好的问题,形成更好的假设,描述数据相关的概念和所需的工具,将在第3~9章中详述;模型的构建与估计是一个应该在理论和证据间来回往复迭代的过程,关于构建模型的练习将在第10~14章中进行;诊断既能帮助我们发现问题,又能帮助我们发掘有意义的关联,形成额外的解释或假设,关于诊断将会在第15章和第16章中详述;第17章将讨论许多涉及二元因变量的问题,附录将提供创建其他新假设的技巧和窍门。

目录

目录 第1章 ? 入门指南 001 概述 001 R、RStudio 和R Markdown 002 对象与函数 004 RStudio 入门 006 RStudio 的R Markdown 导览 012 R Markdown 文件与R 脚本 017 小练习 019 第2章 ? 数据分析导论 027 概述 027 数据分析的动机 028 大数据越来越大 028 数据分析是一项有市场需求的技能 029 数据分析是一种公益 030 数据分析的构成要素 031 描述数据并形成假设 033 假设一:民族语言碎片化 034 假设二:女性选举权 040 假设三:人力资本 046 假设四:政治稳定 048 模型的构建与估计 052 诊断 054 结果的稳定性 054 残差图 056 提出下一个问题 059 第3章 ? 描述数据 064 概述 064 数据集和变量 066 不同类型的变量 068 连续变量 069 分类变量 069 有序分类变量 070 描述数据可以节省时间和精力 073 数据的形状 073 数据的极差 077 辨识困惑、问题、假设和线索 079 困惑和问题:重要的区别 079 描述数据以改进问题 081 描述数据披露了更多线索 084 度量 086 有效性 086 可靠性 088 第4章 ? 集中趋势和离散程度 093 概述 093 集中趋势的度量:众数、平均数和中位数 094 众数 095 平均数 096 中位数 100 平均数与中位数 103 离散程度的度量:极差、四分位距和标准差 106 极差 107 四分位距 109 标准差 110 四分位距与标准差 116 关于方差的说明 117 第5章 ? 数据的单变量和双变量描述 123 概述 123 好的、差的和离群值 124 单变量数据的5 种视图 125 频率表 126 条形图 127 箱线图(或盒须图) 128 直方图 131 茎叶图 135 变量间是否相关 138 散点图 139 箱线图(双变量) 145 马赛克图 145 交叉表 148 气泡图 148 第6章 ? 数据变换 157 概述 157 数据变换的理论原因 158 变换数据确保符合理论 158 数据和问题都要变换以相互匹配 159 数据变换的实际原因 160 数据变换——从连续变量到分类变量 164 数据变换——改变类别 169 Box-Cox 变换 175 第7章 ? 数据展示的一些原则 186 概述 186 一些风格要素 187 消除杂乱 188 聚焦 190 整合图文 192 一图应该胜千言 195 了解你的受众 201 了解你的目的:解释性、探索性或信息性 203 故事的基本要素 208 文档(树立讲述者的可信度) 209 建立直觉(设定背景) 211 展示因果关系(旅程) 211 从因果到行动(决议) 213 第8章 ? 概率论精要 218 概述 218 总体和样本 219 样本偏差与随机样本 220 大数定律 222 大数定律的可视化 223 中心极限定理 227 平均数的抽样分布随着n 的增加而接近正态分布 228 和的抽样分布是正态的 230 从正态分布中抽取时的观测数量 231 中心极限定理的一个有用性质 232 从不同的分布中抽样 233 标准正态分布 239 标准正态分布与临界z 分数 242 第9章 ? 置信区间与假设检验 250 概述 250 大样本的置信区间 251 求总体比例 251 求总体平均数 256 小样本与t- 分布 260 自由度 263 小样本的样本标准差 264 用小样本构建置信区间 269 例子:女性薪酬与男性薪酬 270 比较两个样本的平均数 272 例子:两个群体和两种收入 273 例子:种族和对警察的看法 275 例子:收入和对特朗普的支持 275 置信水平 277 关于统计推断和因果关系的简要说明 280 第10章 ? 进行比较 285 概述 285 为什么要进行比较 286 需要比较的问题 287 比较两个分类变量 289 例子:对警察的看法 289 例子:哪些人去教堂 292 比较连续变量和分类变量 294 例子:奥巴马情感量表 294 比较两个连续变量 297 例子:性别与教育 297 例子:性别与政策制定 298 探索性数据分析:调查美国的堕胎率 301 重述要点 303 好的分析引出新的问题 308 第11章 ? 受控比较 312 概述 312 什么是受控比较 313 比较两个分类变量,同时控制第三个变量 314 例子:对警察的看法 314 例子:对移民的看法 320 比较两个连续变量,同时控制第三个变量 327 例子:婴儿死亡率 328 例子:凶杀率 331 论点与受控比较 334 第12章 ? 线性回归 340 概述 340 线性回归的优点 341 线性回归中的斜率和截距 342 对斜率和截距的解读 343 例子:选民投票率和教育 343 拟合优度(R2 统计量) 348 统计显著性 352 计算t- 比率 353 二元回归的例子 355 一个州的宗教信仰水平是否会影响堕胎率 356 宗教信仰是否会影响枪支法案 358 暴力会导致政治不稳定吗 359 收入(人均 GDP)与投票率有关吗 361 第13章 ? 多元回归 368 概述 368 什么是多元回归 369 为什么要使用多元回归 370 回归模型和论点 371 回归模型、理论和证据 372 解读多元回归中的估计值 376 实质显著性 376 统计显著性 377 拟合优度:R2 378 例子:凶杀率与教育 379 理论 379 描述数据 380 估计 384 经验蕴涵 386 讨论 389 第14章 ? 虚拟变量和交互作用 394 概述 394 什么是虚拟变量 395 加性模型与交互作用模型 396 二元虚拟变量回归 397 多元回归与虚拟变量 398 多元回归中的交互作用 398 例子:伯尼· 桑德斯,教育和收入 400 例子:外援,人均GDP 和民主 405 第15章 ? 诊断1 :普通*小二乘法是否适用 412 概述 412 回归分析中的诊断 413 统计量与估计量的性质 414 高斯- 马尔可夫假设 419 残差图 425 第16章 ? 诊断2 :残差、杠杆值与影响力的度量 438 概述 438 离群值 439 杠杆值 442 影响力的度量 448 库克距离 448 dfbeta 449 增加变量图 454 第17章 ? 逻辑回归 461 概述 461 需要逻辑回归解决的议题与难题 462 逻辑回归违反了高斯- 马尔可夫假设 463 使用对数发生比 466 使用预测概率 469 二元逻辑回归 469 多元逻辑回归 471 例子:2012 年奥巴马赢得的选举人团 472 逻辑回归模型拟合 475 例子:奥巴马,收入和教育 475 接收者操作特征曲线和曲线下面积 476 附录A ? 形成经验蕴涵 488
展开全部

相关资料

本书通过案例巧妙地运用 R 编程跳过复杂的统计学知识,并结合可视化的表达方式,把数据分析的整个过程淋漓展现。在国家数字化转型的大背景下,数据分析的人才严重缺乏,本书正好符合当下的环境需求,解决用户痛点,是一本提升数据分析师技能的优秀图书。 ——张丹 微软MVP 戴维 S·布朗(David S.Brown)教授在本书中谈到“通过做数据分析来学数据分析”,这是我极为认同的观点。从现实世界中的真实问题出发,借助工具与方法寻找背后的真相,是非常有趣且长期有益的学习方式。对于 R 的初学者,即使缺乏数学、统计学等学科背景,本书也依然可以很容易上手学习。作者以问题为导向,通过深入浅出、易于理解的表述,可以帮助读者快速掌握基本概念、使用方法和技巧。当然,对于经验丰富的读者,也能够通过“提出假设—验证—新的假设”来不断产生新的思考,在持续迭代过程中形成对数据更深层次的理解,这是大有裨益的。 ——黄小伟 R 语言中文社区创建者,有赞数据分析负责人 R在设计之初就把自身定义为面向统计计算和图形可视化的工具,市面上相关的图书琳琅满目。但是这本书能够立足于作者自身的科研经验,纳入大量实际例子,让读者在学习过程中能够形成数据思维,引导大家在数据分析的过程产生思考,这是难能可贵的。这种风格能够极大地调动读者的积极性,让读者了解不同的数据故事,并在具有趣味的故事中习得分析的技巧,非常值得借鉴。 ——黄天元 浙江财经大学数据科学学院讲师 本书通过R精心编排了初、中级统计原理,还准备了一些数学公式,帮助学生理解统计学的基本原理。书中囊括了许多优秀的社会科学案例,用非常有价值的统计学工具R,通过实践的方式传授统计学知识。我一直在寻找关于R的优秀社会科学教材,本书可能是目前比较好的一本。 ——杰弗里·D·斯通(Jeffrey D. Stone) 本书成功地以平易近人的方式介绍了使用 R 进行数据分析的方法。通过浅显易懂的例子和跨章节的概念联系,本书成为社会科学专业的本科生和研究生统计课程的绝佳选择。 ——约瑟夫·内德莱克( Joseph Nedelec) 这是一本任何学生都可以无障碍学习数据分析的书,而不论学生是否有坚实的数学背景。本书易于阅读,还有知识检验,再加上绝佳的代码示例和可视化,对学生有很大的吸引力。 ——凯瑟琳·加西亚(Catherine Garcia)

作者简介

作者简介
David S. Brown(戴维·S.布朗):科罗拉多大学博尔德分校政治学教授和社会科学系主任。获得了加利福尼亚大学洛杉矶分校的政治学博士学位,并且是科罗拉多大学博尔德分校行为科学研究所肯尼斯·博尔丁(他开辟了多个经济学和社会科学研究领域)的首届博士后研究员。在加入科罗拉多大学政治学系之前,他曾在莱斯大学担任助理教授。他研究的是比较政治学,侧重于体制及其对经济发展的影响。他的研究成果已发表在《美国政治科学评论》(American Political Science Review)、《美国政治学期刊》(American Journal of Political Science)、《英国政治学期刊》(British Journal of Political Science)和《美国地理学家协会年鉴》(Annals of the Association of American Geographers)上。

译者简介作者简介 David S. Brown(戴维·S.布朗):科罗拉多大学博尔德分校政治学教授和社会科学系主任。获得了加利福尼亚大学洛杉矶分校的政治学博士学位,并且是科罗拉多大学博尔德分校行为科学研究所肯尼斯·博尔丁(他开辟了多个经济学和社会科学研究领域)的首届博士后研究员。在加入科罗拉多大学政治学系之前,他曾在莱斯大学担任助理教授。他研究的是比较政治学,侧重于体制及其对经济发展的影响。他的研究成果已发表在《美国政治科学评论》(American Political Science Review)、《美国政治学期刊》(American Journal of Political Science)、《英国政治学期刊》(British Journal of Political Science)和《美国地理学家协会年鉴》(Annals of the Association of American Geographers)上。 译者简介 李嘉平:曾在华大基因从事生物信息分析相关工作,目前就职于广西医科大学**附属医院(广西心脑血管疾病防治精准医学重点实验室)。他是R布道师,希望能够通过翻译传播和推广R的应用与价值;亦是R铁杆用户,具有丰富的生物信息分析经验,擅长使用R和Python进行各类数据处理以及数据可视化。曾负责生物信息培训中所有R相关课程的设计与授课。对新技术始终抱有极大的热情,喜欢去体验那些目前仍不完善但有前景的新技术,并享受这个过程带来的乐趣与启发。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航