深入浅出强化学习:编程实战

1星价 ¥56.1 (6.3折)

2星价￥56.1 定价￥89.0

作者：郭宪

出版社：电子工业出版社

本类榜单：计算机/网络

分类：计算机/网络 > 程序设计 > 其他

暂无评论

图文详情

ISBN：9787121367465
装帧：一般胶版纸
册数：暂无
重量：暂无
开本：24cm
页数：264页
出版时间：2020-03-01
条形码：9787121367465 ; 978-7-121-36746-5

本书特色

《深入浅出强化学习：编程实战》是《深入浅出强化学习：原理入门》的姐妹篇。 1 实战性强：以编程实战为主线，旨在帮助读者通过实战更清晰地理解算法并快速应用。 2 系统全面：在马尔可夫理论框架下，介绍了*基本的算法，涵盖了基于值函数的算法，直接策略搜索方法，基于模型的强化学习方法等。 3 前沿技术分析：剖析了AlphaZero强大技术背后的深度强化学习原理，并介绍了它在五子棋上的具体实现。 4 操作性强：读者可根据书中的代码直接上手，并通过修改程序中的超参数，亲自体会算法原理。

内容简介

本书分三大篇介绍了目前强化学习算法中*基本的算法。**篇为基于值函数的强化学习算法, 该篇介绍了基于两种策略评估方法 (蒙特卡洛策略评估和时间差分策略评估) 的强化学习算法, 进而介绍了如何将函数逼近的方法引入到强化学习算法中。第二篇为直接策略搜索方法, 该篇介绍了*基本的策略梯度方法、基本的AC方法、PPO方法和DDPG算法。第三篇为基于模型的强化学习方法, 该篇介绍了基于mpc的方法, AlphaZero算法基本原理及在五子棋上的具体实现细节。

作者简介

郭宪，南开大学人工智能学院讲师。2009年毕业于华中科技大学机械设计制造及自动化专业，同年保送到中国科学院沈阳自动化研究所进行硕博连读，2016年1月获得工学博士学位，并到南开大学从事博士后研究工作，2018年7月任教于南开大学至今。目前主要研究方向和兴趣是仿生机器人智能运动控制、强化学习和机器人博弈。宋俊潇，香港科技大学博士，目前就职于启元世界，担任研究科学家，专注于决策智能相关算法的研究与开发。博士期间在国际知名期刊和会议发表论文9篇。2015年，获得阿里巴巴天池大数据黄金联赛个人年度第1名(参赛队伍总计15154支)。曾就职于网易游戏，担任资深数据挖掘研究员，负责个性化推荐算法及基于深度强化学习的游戏AI技术的探索研究，三次获得公司层面的技术进步奖。方勇纯，南开大学人工智能学院院长、教授、博士生导师，国家杰出青年基金获得者(2013年)，教育部长江学者特聘教授(2017年)。1992~1994年在浙江大学混合班(尖子班)学习，获混合班荣誉证书。1996年和1999年分获浙江大学学士和硕士学位，2002年获美国克莱姆森大学(Clemson University)电机工程博士学位。2002至2003年在康乃尔大学(Cornell University)从事博士后研究。2003年底至今，任教于南开大学。目前主要研究方向为机器人视觉控制、无人机、欠驱动吊车系统和微纳米操作

本类五星书

更多>>

浏览历史

深入浅出强化学习:编程实战

郭宪

¥56.1¥89.0

本类畅销

×

深入浅出强化学习:编程实战

本书特色

内容简介

目录

作者简介

预估到手价 ×