非参数统计——基于Python(基于Python的数据分析丛书)
- ISBN:9787300301495
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:312
- 出版时间:2022-06-01
- 条形码:9787300301495 ; 978-7-300-30149-5
内容简介
非参数统计是统计学和数据科学的重要分支领域。本书作为该领域的基础教材,其特点体现在以下几方面:
1.针对性强。本书针对数据分析专业的特点和需要,阐述非参数统计的基本概念、理论、方法和编程,重点从非受控观察数据对参数推断知识的需要角度出发,将统计推断知识、理论和方法与反事实复杂场景因果关系的解读与判断问题相结合,应用于稳健估计、局部模式、严格证据的信息提取任务中。
2.通用性强。适用于Python技术数据管理人才培养。增加Python技术的应用内容,编写了Python综合程序,降低了统计理论学习难度,增强了技术的可嵌入性;自主研发的准确分析求解程序,大大补充了Python中小数据推断程序的不足,计算的便利性大幅提升,适用于Python自动化测试、运维、数据分析等多种高端数据管理岗位的嵌入式学习需求。
3.内容新颖。顺应人工智能时代发展和数据分析大环境的变化,对特征工程有效降噪及控制错误发现率等方面的内容作了阐述与分析,针对深度学习对图像应用的需求增加,增加了深度学习的内容。
目录
节选
如果读者仅仅将非参数统计看成是关于数据分析的 ,那就错了 ,非参数统计更多的是展开对数据更深层的分析 ,这就需要在由精致的计算和细致的操作所构成的更大的数据科学社群平台上,增强统计思维和分析认知的基本功。在数据分析实践中 ,如果将模型根据研发的成熟度分为起步期、发展期和成熟期三个阶段,我们可以将模型里的信息分为参数信息和非参数信息。处在起步期的模型里参数信息的成分比较多 ,一般包括由样本所估计出的位置参数 (如均值 )、波动性参数 (如方差和相关度 )等信息 ,较为成熟的模型和算力中 ,非参数信息则更多一些 ,发展期的模型是由参数信息不断向非参数信息过度的过程。非参数信息能体现模型设计的功底 ,包含相容性、秩序、分位数、信噪比、对称性、稳健性、失效性、是否一致性等丰富的分析维度。如果想通过手中的数据对模型进行 “二度创作 ”使其成为独树一帜的信息提取模式 ,需要培养对数据的敏锐性、数据收集的知识、数据的分析与处理技能、利用数据进行决策、对数据的批判性思维和数据伦理等专业分析能力 ,参数统计和非参数统计的共同作用尤为重要 ,缺一不可。 Python语言在高并发场景中的运用能力、简洁可解释性的语言特点、丰富且快速生长的跨平台标准库和第三方库 ,都更有利于传递关于科学的认知与思考 ,加速与计算机进行关于人类创造和累积的文化精神财富的对话与交流。这就是我在本书中选择 Python的基本理由。在 Python里践行,以 Python取效。全书内容分为两个部分 :非参数统计推断和非参数统计模型。非参数统计推断的内容由单一变量、两变量及多组数据非参数统计估计、多重检验、分类数据的关联分析方法、定量数据的相关和稳健回归等分析方法构成 ;非参数统计模型部分包括非参数密度估计、稳健回归和非参数回归等内容。本书具有如下特点: (1)全面对接Python语言编程 ,习题和思考题中增加了具有复杂样态的一手数据和分析习题,用于提高学生对统计建模的分析能力,增强学生对复杂数据的辨析能力。 (2)有教学资源和官方网站支持。教学资源中有参考课件、程序代码、参考习题、扩展阅读、中国大学 MOOC (慕课 )国家精品课程在线学习平台等 ,教材的每一章还陪有微课精品短视频 ,点击二维码可以获取下载使用这些资源。该教材曾获得过中国人民大学**批探究性教学课程立项支持 ,受 2018, 2019年度中央高校建设世界一流大学 (学科 )和特色发展引导专项资金 (教材类 )和中国人民大学 “十三五 ”规划教材支持。教师在教学过程中可围绕相关知识从网站上获取延展性学习材料 ,比如知识点中的历史人物、重要事件理论的推证过程、相关文献、应用技术等。这些辅助学习资源也会不断更新 ,以适用于研讨型和协作型学习和教学。本书可作为高等院校统计学、经济学、管理学、生物学、信息科学、大数据分析等专业领域本科三、四年级以上学生以及相关研究人员学习非参数统计方法的教材 ,也可作为从事统计研究或数据分析工作人员的案头参考书 .本书的读者需具备初等统计学基础、概率论和数理统计的相关知识。本书的内容建议安排在一学期 54课时内完成 ,且安排 1/3左右课时用于学生上机实验。有条件的教师可以选择教材部分案例组织案例教学和课堂讨论。 2017年和 2018年连续两年 ,我们在中国人民大学统计学专业大三课堂上尝试了案例教学 ,获得了学生们的高度认可。事实证明 ,通过案例探究和团组讨论 ,学生们会形成一股深入研究、严谨辨析、开拓创新的统计学课堂新风。本书备有丰富的习题 ,理论推导、方法应用和上机实验题目 ,可灵活支持各种教学需要。
作者简介
王星 中国人民大学统计学院教授,北京师范大学数学本科与硕士,中国人民大学统计学博士。国家社科基金重点项目负责人,《中国大百科全书》第三版统计学卷编委。在《统计研究》《中国人民大学学报》《数理统计与管理》和JAMA等刊物发表多篇论文。主要研究方向包括稀疏网络挖掘模型、高维复杂数据统计学习、深度学习等。主要著作和译作包括《非参数统计》《大数据分析:方法与应用》《人文社会科学文献网络知识模型与应用》《统计学习导论一基于R应用》等。讲授课程包括非参数统计、大数据分析、机器学习方法等。曾获北京市高等教育教学成果奖二等奖、第十届全国统计科学研究优秀成果奖二等奖、全国应用统计案例大赛一等奖指导教师等学术奖励;开设非参数统计MOOC课程。
-
乡村振兴新技术:新时代农村短视频编辑技术基础入门
¥12.8¥32.0 -
AI绘画+AI摄影+AI短视频从入门到精通
¥45.5¥79.8 -
企业AI之旅
¥43.5¥79.0 -
机器学习
¥59.4¥108.0 -
基于知识蒸馏的图像去雾技术
¥61.6¥88.0 -
软件设计的哲学(第2版)
¥51.0¥69.8 -
智能算法优化及其应用
¥52.4¥68.0 -
Photoshop图像处理
¥25.5¥49.0 -
R语言医学数据分析实践
¥72.3¥99.0 -
大模型推荐系统:算法原理、代码实战与案例分析
¥62.3¥89.0 -
剪映 从入门到精通
¥25.7¥59.8 -
游戏造梦师----游戏场景开发与设计
¥67.6¥98.0 -
SAR图像处理与检测
¥35.4¥49.8 -
人工智能
¥29.4¥42.0 -
中文版PHOTOSHOP 2024+AI修图入门教程
¥59.3¥79.0 -
WPS办公软件应用
¥25.2¥36.0 -
格拉斯曼流行学习及其在图像集分类中的应用
¥13.7¥28.0 -
轻松上手AIGC:如何更好地向CHATGPT提问
¥40.3¥62.0 -
元宇宙的理想与现实:数字科技大成的赋能与治理逻辑
¥61.6¥88.0 -
云原生安全:攻防与运营实战
¥66.8¥89.0