×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
暂无评论
图文详情
  • ISBN:9787030700964
  • 装帧:平装
  • 册数:暂无
  • 重量:暂无
  • 开本:B5
  • 页数:256
  • 出版时间:2023-07-01
  • 条形码:9787030700964 ; 978-7-03-070096-4

内容简介

本书以智能博弈对抗理论为基础,探寻博弈强对抗环境中多智能体不接近信息动态博弈面临的各类问题及求解方法,为目前各类智能博弈对抗技术应用于人工智能AI开发设计提供实践指导。全书整体遵循着"是什么"-介绍智能博弈对抗;"为什么"-为什么要研究智能博弈对抗;"怎么办"-如何进行智能博弈对抗研究。其中基础理论篇首先着重介绍智能博弈对抗基础理论,对非接近信息博弈理论、多智能体强化学习等问题中的若干代表性方法进行剖析;方法实践篇针对当前三类典型智能博弈对抗系统,挑选几种人机对抗平台进行智能AI实现;研究展望篇对当前智能博弈对抗领域的前沿理论进行了分析,探讨了智能博弈对抗未来可能的发展方向。

目录

目录“智能科学技术著作丛书”序前言第1章 绪论 11.1 引言.11.2 智能博弈对抗内涵与意义 21.2.1 智能博弈对抗 21.2.2 相关概念 21.2.3 研究的意义 61.3 智能博弈对抗相关研究应用 71.3.1 即时策略类对抗 71.3.2 序贯策略类对抗 101.3.3 军事仿真类对抗 151.4 主要内容及章 节安排 19参考文献 21第2章 博弈论视角下的多智能体学习 232.1 引言 232.2 博弈论基础 232.2.1 博弈五要素 242.2.2 博弈论分类 252.2.3 博弈论相关概念 262.3 多智能体学习简介 272.3.1 多智能体学习系统组成 282.3.2 多智能体学习概述 292.3.3 多智能体学习研究方法分类 302.4 多智能体博弈学习框架 312.4.1 多智能体博弈基础模型及元博弈 312.4.2 均衡解概念与博弈动力学 342.4.3 多智能体博弈学习的挑战 362.5 多智能体博弈策略学习方法.392.5.1 离线博弈策略学习方法 402.5.2 在线博弈策略学习方法 492.6 前沿研究重点及方向 502.6.1 前沿研究重点 502.6.2 前沿研究方向 51参考文献 52第3章 智能博弈对抗策略学习方法基础 653.1 引言 653.2 马尔可夫决策过程 653.2.1 马尔可夫决策模型 653.2.2 马尔可夫决策过程求解方法 673.2.3 半马尔可夫决策过程 703.3 强化学习 753.3.1 强化学习简介 763.3.2 基于值函数的方法 783.3.3 基于策略梯度的方法 803.4 深度强化学习 813.4.1 无模型强化学习 813.4.2 基于模型的强化学习 843.5 分层强化学习 863.6 分布式强化学习 88参考文献 91第4章 智能博弈对抗对手建模方法 954.1 引言 954.2 对手建模基础 954.2.1 对手建模简介 954.2.2 显式对手建模方法 984.2.3 隐式对手建模方法 994.3 面向即时策略类对抗的对抗规划 1004.3.1 战术对抗规划 1004.3.2 策略对抗规划 1034.3.3 混合对抗规划 1064.3.4 未来研究重点 1094.4 面向序贯策略类对抗的对手剥削 1104.4.1 对手建模式适变 1114.4.2 对手感知式学习 1134.4.3 对手生成式搜索 1144.4.4 未来研究重点 115参考文献 116第5章 协作式即时策略博弈对抗决策智能体设计 1235.1 引言 1235.2 面向《星际争霸》的即时策略博弈对抗决策 1235.2.1 《星际争霸》游戏基础 1235.2.2 问题复杂度分析 1255.2.3 研究挑战 1255.2.4 关键技术分析 1265.3 《星际争霸》智能博弈AI构建 1355.3.1 《星际争霸》AI研究历程 1355.3.2 《星际争霸》AI环境 1385.3.3 《星际争霸》AI实现 139参考文献 142第6章 竞争式序贯博弈对抗决策智能体设计 1446.1 引言 1446.2 面向德州扑克的序贯博弈对抗决策 1446.2.1 无限注德州扑克规则 1446.2.2 问题复杂度分析 1476.2.3 关键技术分析 1486.3 德州扑克智能博弈AI构建 1556.3.1 德州扑克AI研究历程 1556.3.2 德州扑克智能博弈系统 1606.3.3 两人无限注德州扑克AI实现 1626.3.4 多人无限注德州扑克AI实现 165参考文献 166第7章 混合式序贯博弈对抗决策智能体设计 1697.1 引言 1697.2 面向斗地主的序贯博弈对抗决策 1697.2.1 斗地主规则 1697.2.2 问题复杂度分析 1707.2.3 关键技术分析 1717.3 斗地主智能博弈AI构建 1777.3.1 斗地主AI研究历程 1777.3.2 斗地主AI实现 1787.4 面向桥牌的序贯博弈对抗决策 1807.4.1 桥牌规则 1807.4.2 问题复杂度分析 1817.4.3 关键技术分析 1827.5 桥牌叫牌AI构建 1877.5.1 桥牌AI研究历程 1877.5.2 叫牌AI实现 188参考文献 190第8章 兵棋智能博弈对抗决策智能体设计1928.1 引言 1928.2 面向智能兵棋的多智能体对抗决策方法 1928.2.1 兵棋推演基础 1928.2.2 问题复杂度分析 1948.2.3 关键技术分析 1968.3 墨子兵棋AI构建 2068.3.1 兵棋AI研究历程2068.3.2 兵棋智能博弈系统 2078.3.3 兵棋AI实现 208参考文献 212第9章 智能博弈对抗元理论 2149.1 引言 2149.2 元宇宙:开放式学习环境 2149.3 元博弈:博弈的博弈理论 2179.3.1 元博弈理论 2179.3.2 开放式学习框架 2189.4 元认知:认知行为框架 2189.4.1 快与慢 2189.4.2 元认知 2199.4.3 认知行为建模 2209.5 元学习:双层优化方法 2229.5.1 度量学习方法 2229.5.2 分层优化方法 2239.5.3 贝叶斯方法 224参考文献.224第10章 智能博弈对抗前沿应用22710.1 引言.22710.2 微分博弈与视觉欺骗22710.2.1 微分博弈 22710.2.2 视觉欺骗 22810.3 攻防博弈与复杂网络攻防 23210.3.1 攻防博弈 23210.3.2 复杂网络攻防 23310.4 平均场博弈与无人机集群对抗 23410.4.1 平均场博弈 23410.4.2 无人机集群对抗 235参考文献 238
展开全部

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航