×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
暂无评论
图文详情
  • ISBN:9787522617619
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:32开
  • 页数:184
  • 出版时间:2024-01-01
  • 条形码:9787522617619 ; 978-7-5226-1761-9

本书特色

本书读者对象:大中专院校计算机、人工智能相关专业学生,对机器学习、强化学习算法感兴趣的程序员。 ● 本书从初高中学生都熟悉的“平均值计算”的角度出发,简单易懂地解释复杂的强化学习原理。
● 使用常见的例子(多臂老虎机问题和网格世界问题)对各种算法进行比较,使它们的特点更易理解。
● 对于强化学习的核心算法,提供了Python 3和MATLAB两种类型的代码。执行代码,可直观理解“原理 → 公式 → 程序”这一系列流程。

内容简介

作为**个战胜围棋世界冠军的人工智能机器人AlphaGo,我们知道其主要工作原理是深度学习。随着AlphaGo Zero和Alpha Zero的相继发布,作为机器学习经典算法之一的强化学习,在人工智能领域受到了更多的关注。
《强化学习算法入门》使用通俗易懂的语言,按照“原理-公式-程序”的方式,对强化学习的基础知识进行了详细讲解。书中先让大家从熟悉的“平均值计算”作为切入点,学习强化学习的基本概念,然后结合实例学习了函数近似方法、深度强化学习的原理和方法等,比较了各算法的特点和应用,并用Python和MATLAB两种语言进行了编程实现。
《强化学习算法入门》内容丰富,实践性强,特别适合高校人工智能相关专业学生,机器学习、深度学习工程师等学习强化学习算法。

目录

第1章基于“平均”的强化学习的基本概念 1.0简介 1.1平均值与期望值 1.1.1平均值 1.1.2期望值 1.1.3期望值与平均值的关系 1.2平均值和价值 总结 1.3平均值和马尔可夫性 1.3.1平均值的计算公式及其变形 1.3.2逐次平均值表达和MP 1.4用平均值推导贝尔曼方程 1.4.1平均值表达和价值函数的引入 1.4.2决策型贝尔曼方程式的推导 1.4.3概率型贝尔曼方程式的推导 ……
展开全部

作者简介

[日] 曾我部东马
理学博士(物理学专业)。曾任马克斯·普朗克研究所(德国)博士研究员、剑桥大学(英国)研究员。2009年回到日本,参与创立了Grid公司,担任董事兼首席技术官。2011年起先后担任东京大学尖端科学技术研究中心特聘助理教授、特聘副教授。2016年3月起任电气通信大学副教授,同时兼任Grid公司首席技术顾问、东京大学尖端科学技术研究中心客座研究员至今。
他以开发具有“深度学习—深度强化学习—回归预测—优化”功能的跨功能机器学习框架∞ReNom而闻名,目前在开发以量子机器学习为代表的*先进量子算法∞ReNomQ的同时,还致力于使用深度强化学习的“在线优化问题”的研究。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航