- ISBN:9787519870379
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:284
- 出版时间:2023-01-01
- 条形码:9787519870379 ; 978-7-5198-7037-9
本书特色
本书将帮助读者掌握强化学习算法,并通过构建自学习智能体,理解算法的实现。
内容简介
本书首先介绍在强化学习环境中工作所需的工具、库和设置,涵盖了强化学习的构成模块,深入探讨基于值的方法,如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外,在学习DDPG和TD3确定性算法之前,读者将学习策略梯度方法,如TRPO和PPO,以提高性能和稳定性。本书还介绍模仿学习的原理,以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。*后,读者将掌握探索方法,如UCB和UCB1,并开发一个名为ESBAS的元算法。
如果你是人工智能研究者、深度学习用户,或者希望从头开始学习强化学习的人,那么这本书就很适合你。如果你想了解该领域的进展,也会发现这本书很有帮助。当然,Python的基础知识是必需的。
目录
**部分 算法与环境
第1章 强化学习概貌
1.1 强化学习导论
1.1.1 比较强化学习和监督学习
1.1.2 强化学习的历史
1.1.3 深度强化学习
1.2 强化学习的要素
1.2.1 策略
1.2.2 值函数
1.2.3 回报(奖励)
1.2.4 模型
1.3 强化学习的应用
1.3.1 游戏
1.3.2 机器人与工业4.0
1.3.3 机器学习
1.3.4 经济学与金融
1.3.5 医疗健康
1.3.6 智能交通系统
1.3.7 能源优化与智能电网
1.4 本章小结
1.5 思考题
1.6 延伸阅读
第2章 强化学习过程与OpenAIGym
2.1 环境设置
2.1.1 安装OpenAIGym
2.1.2 安装Roboschool
2.2 OpenAIGym和强化学习过程
2.2.1 开发强化学习过程
2.2.2 了解空间概念
2.3 利用TesorFlow开发强化学习模型
2.3.1 张量
2.3.2 创建计算图
2.3.3 线性回归示例
2.4 TensorBoard介绍
2.5 强化学习环境
2.5.1 为什么需要不同的环境
2.5.2 开源环境
2.6 本章小结
2.7 思考题
2.8 延伸阅读
第3章 基于动态规划的问题求解
……
第二部分 无模型强化学习算法
第三部分 超越无模型算法
附录 思考题参考答案
作者简介
[美]安德里亚·隆萨(Andrea Lonza)是一名深度学习工程师,对人工智能怀有极大的热情,渴望创造出具有智能行为的机器。他通过理论性的和工业应用性的机器学习项目获得了强化学习、自然语言处理和计算机视觉方面的专业知识。他还参加过几次Kaggle比赛,并取得了很好的成绩。他总是在寻找引人入胜的挑战,并喜欢证明自己。
-
机器学习
¥59.4¥108.0 -
剪映 从入门到精通
¥25.7¥59.8 -
ANSYS WORKBENCH中文版超级学习手册
¥69.9¥99.8 -
C Primer Plus 第6版 中文版
¥59.4¥108.0 -
基于知识蒸馏的图像去雾技术
¥57.2¥88.0 -
AIGC艺术设计实战:服装设计
¥49.0¥79.0 -
基于深度学习的人体行为识别算法研究
¥34.1¥62.0 -
粒子群算法在优化选取问题中的应用研究
¥37.4¥68.0 -
智能优化算法MATLAB仿真实例
¥65.7¥90.0 -
Web前端开发基础
¥36.5¥57.0 -
网络工程师考试大纲(全国计算机技术与软件专业技术资格(水平)考试用书)
¥12.8¥15.0 -
网络工程师教程(第6版)(全国计算机技术与软件专业技术资格(水平)考试用书)
¥62.3¥89.0 -
SNS信息传播分析
¥48.3¥69.0 -
R语言医学数据分析实践
¥72.3¥99.0 -
HARMONYOS NEXT启程:零基础构建纯血鸿蒙应用
¥75.6¥108.0 -
游戏造梦师----游戏场景开发与设计
¥72.5¥98.0 -
SAR图像处理与检测
¥35.4¥49.8 -
大学信息技术基础教程(第3版)
¥50.3¥69.8 -
人工智能
¥29.4¥42.0 -
中文版PHOTOSHOP 2024+AI修图入门教程
¥60.0¥79.0