- ISBN:9787519869618
- 装帧:一般铜版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:452
- 出版时间:2023-03-01
- 条形码:9787519869618 ; 978-7-5198-6961-8
本书特色
一句话推荐本书详细解释了被实践验证的那些强化学习方法,它们被封装形成了软件开发人员的标准库。 编辑推荐强化学习将是未来十年在人工智能领域的*大突破之一,强化学习算法能够使得智能体在环境中学习任意目标。这一令人兴奋的发展打破了传统机器学习的算法约束。这本实用的书向数据科学和人工智能专业人员展示了如何通过强化的手段使机器能够自己学习。 本书作者创办了自己名字命名的研究型公司,本书涵盖了从基本的构建模块到*先进的实践。通过本书,你将探索强化学习的当前状态、关注工业应用、学习大量算法,本书还有专门章节介绍如何将强化学习的解决方案部署到生产环节。这并不是一本随用随翻的工具书,书中包含很多数学知识,并期望读者是熟悉机器学习的。 专家推荐“强化学习出色地展示了它的技术背景、发展前景和未来机会,它将显著的推进数据科学家在其业务上的工作方式。”——David Aronchick,Kubeflow联合创始人“对于任何想要应用强化学习技术来解决现实问题的人来说,这本书都是必读的。它将以实践中的案例和细致的解释,带领读者漫游强化学习的**个定理到顶会的前沿技术。”——David Foster,应用数据科学合伙人“伟大著作!本书详细解释了被实践验证的那些强化学习方法,它们被封装形成了软件开发人员的标准库。”——Danny Lange,Unity人工智能高级副总裁 理论完备,涵盖主流经典强化学习算法和深度强化学习算法,并配套理论基础和性能分析。逐章配套Python代码,深度强化学习配套代码基于TensorFlow 2实现。在GitHub上展示全部代码和运行结果。环境丰富,包括Gym库内置环境、对Gym库自定义扩展环境和Gym库以外的环境,并全面兼容Windows、macOS和Linux三大操作系统,书中给出环境配置方法。
内容简介
本书作者创办了自己名字命名的研究型公司,本书涵盖了从基本的构建模块到*z优选的实践。通过本书,你将探索强化学习的当前状态、关注工业应用、学习大量算法,本书还有专门章节介绍如何将强化学习的解决方案部署到生产环节。这并不是一本随用随翻的工具书,书中包含很多数学知识,并期望读者是熟悉机器学习的。
本书的主要内容有:学习强化学习是什么,以及算法如何解决具体问题。掌握强化学习的基础知识,包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用优选的强化学习解决方案,如元学习、分层学习、多智能体、模仿学习等。了解*z前沿的深度强化学习算法,包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。
目录
作者简介
Phil Winder博士是一名多学科交叉的软件工程师、作家和科技顾问,同时也是温德研究所的CEO。该研究所主要提供云计算科学咨询,主营业务是帮助初创公司和大型企业改进数据流程、平台以及产品。作者于英国赫尔大学获得电子工程硕士和博士学位,现居英国约克郡。
-
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
C Primer Plus 第6版 中文版
¥62.6¥108.0 -
零信任网络:在不可信网络中构建安全系统
¥37.2¥59.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥20.3¥39.8 -
机器人的天空
¥26.9¥56.0 -
情感计算
¥66.8¥89.0 -
大模型RAG实战 RAG原理、应用与系统构建
¥74.3¥99.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥55.2¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥67.4¥89.8 -
LINUX实战——从入门到精通
¥49.0¥69.0 -
剪映AI
¥52.8¥88.0 -
快速部署大模型:LLM策略与实践(基于ChatGPT等大语言模型)
¥56.9¥79.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
实战知识图谱
¥48.3¥69.0