轻松上手IT技术日文译丛边做边学深度强化学习:PyTorch程序设计实践
- ISBN:9787111650140
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:228
- 出版时间:2020-04-01
- 条形码:9787111650140 ; 978-7-111-65014-0
本书特色
适读人群 :本书面向普通大众,指导读者以PyTorch为工具,在Python中实践深度强化学习。读者只需要具备一些基本的编程经验和基本的线性代数知识即可读懂书中内容,通过实现具体程序来掌握深度强化学习的相关知识。本书面向普通大众,指导读者以PyTorch为工具,在Python中实践深度强化学习。读者只需要具备一些基本的编程经验和基本的线性代数知识即可读懂书中内容,通过实现具体程序来掌握深度强化学习的相关知识。本书内容:介绍监督学习、非监督学习和强化学习的基本知识。通过走迷宫任务介绍三种不同的算法(策略梯度法、Sarsa和Q学习)。使用Anaconda设置本地PC,在倒立摆任务中实现强化学习。使用PyTorch实现MNIST手写数字分类任务。实现深度强化学习的*基本算法DQN。解释继DQN之后提出的新的深度强化学习技术(DDQN、Dueling Network、优先经验回放和A2C等)。使用GPU与AWS构建深度学习环境,采用A2C再现消砖块游戏。
内容简介
Pytorch是基于python且具备强大GPU加速的张量和动态神经网络,更是Python中优先的深度学习框架,它使用强大的 GPU 能力,提供*大的灵活性和速度。本书指导读者以Pytorch为工具在Python中学习深层强化学习(DQN)。主要内容包括:强化学习概述及分类、强化学习的算法和实施方法、在Pytorch中实施深度规划与实现。、“实施深层强化学习DQN”、理解并实施新的深层强化学习方法(Double-DQN、Dueling Network、Prioritized Experience Replay、A3C、A2C)。
目录
译者序
前言
第1章 强化学习概述1
1.1 机器学习的分类(监督学习、非监督学习、强化学习)1
1.2 强化学习、深度强化学习的历史6
1.3 深度强化学习的应用实例11
参考文献14
第2章 在走迷宫任务中实现强化学习16
2.1 Try Jupyter的使用方法16
2.2 迷宫和智能体的实现23
2.3 策略迭代法的实现31
2.4 价值迭代法的术语整理41
2.5 Sarsa的实现46
2.6 实现Q学习52
参考文献57
第3章 在倒立摆任务中实现强化学习59
3.1 在本地PC上准备强化学习的实现和执行环境59
3.2 倒立摆任务“CartPole”64
3.3 由多变量连续值表示的状态的表格表示69
3.4 Q学习的实现72
参考文献80
第4章 使用PyTorch实现深度学习81
4.1 神经网络和深度学习的历史81
4.2 深度学习的计算方法89
4.3 使用PyTorch实现MNIST手写数字分类任务94
参考文献107
第5章 深度强化学习DQN的实现108
5.1 深度强化学习DQN(深度Q网络)的说明108
5.2 实现DQN的四个要点111
5.3 实现DQN(上) 113
5.4 实现DQN(下) 123
参考文献127
第6章 实现深度强化学习的改进版128
6.1 深度强化学习算法发展图128
6.2 DDQN的实现132
6.3 Dueling Network的实现141
6.4 优先经验回放的实现145
6.5 A2C的实现157
参考文献168
第7章 在AWS GPU环境中实现消砖块游戏169
7.1 消砖块游戏“Breakout”的描述169
7.2 准备在AWS上使用GPU所需要的深度学习执行环境174
7.3 学习Breakout的四个关键思想187
7.4 A2C的实现(上) 193
7.5 A2C的实现(下) 203
参考文献212
后记214
-
深度学习的数学
¥43.5¥69.0 -
全图解零基础word excel ppt 应用教程
¥19.0¥48.0 -
机器学习
¥59.4¥108.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥31.9¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥22.1¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥83.3¥119.0 -
Visual Basic 语言程序设计基础(第6版)
¥32.0¥45.0 -
贝叶斯推理与机器学习
¥139.3¥199.0