×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
图文详情
  • ISBN:9787030477477
  • 装帧:暂无
  • 册数:暂无
  • 重量:暂无
  • 开本:24cm
  • 页数:292
  • 出版时间:2016-03-01
  • 条形码:9787030477477 ; 978-7-03-047747-7

本书特色

从与环境交互中学习是人类获取知识的主要方法,也是人类提高智能水平的基本途径。人类智能研究的一个*核心问题就是构建具有类似人类智能的系统。该系统的一个主要特征就是能够适应未知环境,并逐渐增强其自身能力。本书对连续状态空间的理论、算法及应用进行了研究和论述。主要包括:强化学习基本理论和大规模强化学习基本理论。

内容简介

本书共分六部分21章。**部分是强化学习基础 ; 第二部分是用于强化学习的值函数逼近方法 ; 第三部分是*小二乘策略迭代方法 ; 第四部分是模糊近似强化学习方法 ; 第五部分是并行强化学习方法 ; 第六部分是离策略强胺椒ā?

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航