- ISBN:9787121432996
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:429
- 出版时间:2022-05-01
- 条形码:9787121432996 ; 978-7-121-43299-6
本书特色
全彩印刷,图解精致:一百余张精美彩图,详细解析数十个知识图谱前沿算法。 理论完备,应用丰富:创新提出知识图谱建模方法论——六韬法及模式设计工程模型。在理论方面,本书深入每个概念、理论和算法的本质,给出推导、解析和阐述,便于读者理解概念与算法背后的逻辑;在应用方面,完整涵盖知识计算、知识推理等方面内容,并系统梳理了三大行业应用场景。 内容全面,结构有序:全面涵盖知识图谱模式设计、构建、存储和应用技术,对应大脑学习、记忆和使用知识的模式,符合在实践中应用知识图谱的通常做法。 各章独立,主题明确:各章主题相对独立,既可以作为行业参考资料,也适合作为高校教材;读者既可以系统性地学习,也可以有选择性地学习知识图谱。
内容简介
知识图谱作为认知智能的核心技术正蓬勃发展。本书系统全面地介绍了知识图谱的核心技术,既有宏观整体的技术体系,也有关键技术和算法细节,内容包括:知识图谱模式设计的方法论——六韬法;知识图谱构建中的实体抽取和关系抽取;知识存储中的属性图模型及图数据库,重点介绍了JanusGraph分布式图数据库;知识计算中的图论基础,以及中心性、社区检测等经典图计算算法;知识推理中的逻辑推理、几何变换推理和深度学习推理,及其编程实例。*后,本书以金融、医疗和智能制造三大行业的应用场景为例,梳理了知识图谱的应用价值和应用程序形态。 本书既适合人工智能行业从业者和研究人员系统学习知识图谱,也适合一线工程师和技术人员参考使用,并可作为企业管理人员、政府人员、政策制定人员、公共政策学者的参考材料,以及高等院校计算机、金融和人工智能等相关专业师生的参考资料和培训学校的教材。
目录
第1章 知识图谱概述 0
1.1 从李白的《静夜思》开始 2
1.2 什么是知识图谱 3
1.3 DIKW模型 6
1.4 从DIKW模型到知识图谱 8
1.5 知识图谱技术体系 9
1.5.1 知识图谱模式设计与管理 11
1.5.2 知识图谱构建技术 11
1.5.3 知识图谱存储技术 13
1.5.4 知识图谱应用技术 14
1.5.5 用户接口与界面 17
1.6 知识图谱辨析 17
1.6.1 知识图谱与自然语言处理 18
1.6.2 知识图谱与图数据库 20
1.6.3 知识图谱与语义网络 20
1.6.4 知识图谱与搜索引擎 21
1.6.5 知识图谱与深度学习 21
1.7 知识图谱是人工智能进步的阶梯 22
1.7.1 明鉴历史 23
1.7.2 预见未来 26
1.8 本章小结 27
第2章 知识图谱模式设计 30
2.1 知识图谱模式 32
2.2 模式与本体 35
2.2.1 本体 35
2.2.2 模式与本体辨析 37
2.3 本体概论 38
2.3.1 本体的构成要素 39
2.3.2 本体分类 40
2.3.3 资源描述框架RDF 41
2.3.4 网络本体语言OWL 42
2.3.5 知名本体介绍 44
2.4 模式设计的三大基本原则 52
2.4.1 赋予一类事物合适的名字 53
2.4.2 建立事物间清晰的联系 54
2.4.3 明确、正式的语义表达 55
2.5 六韬法 56
2.5.1 场景 58
2.5.2 复用 59
2.5.3 事物 63
2.5.4 联系 65
2.5.5 约束 67
2.5.6 评价 71
2.6 模式设计的工程模型 72
2.6.1 瀑布模型 72
2.6.2 螺旋模型 74
2.7 本章小结 76
第3章 实体抽取 78
3.1 实体、命名实体和实体抽取 80
3.2 基于规则的实体抽取 82
3.2.1 基于词典匹配的实体抽取方法 83
3.2.2 编写正则表达式抽取实体 84
3.2.3 基于模板的实体抽取方法 85
3.3 如何评价实体抽取的效果 88
3.4 传统机器学习方法 91
3.4.1 概率图模型 92
3.4.2 朴素贝叶斯模型 93
3.4.3 *大熵模型 95
3.4.4 隐马尔可夫模型 100
3.4.5 条件随机场 102
3.4.6 标记方法 106
3.4.7 用CRF++进行实体抽取 108
3.5 深度学习方法 114
3.5.1 基于深度学习的通用实体抽取框架 114
3.5.2 BiLSTM-CRF模型 117
3.5.3 预训练模型用于实体抽取 122
3.6 弱监督学习方法 134
3.7 本章小结 136
第4章 关系抽取 138
4.1 关系和关系抽取 140
4.2 基于规则的关系抽取方法 145
4.2.1 词法分析与依存句法分析 146
4.2.2 基于语法结构的关系抽取 149
4.3 基于深度学习的关系抽取方法 154
4.3.1 关系分类 154
4.3.2 基于BERT的关系分类 158
4.4 实体-关系联合抽取的方法 161
4.4.1 实体-关系联合抽取方法 162
4.4.2 基于片段预测的实体-关系联合抽取 165
4.5 弱监督学习与关系抽取 171
4.5.1 引导法 171
4.5.2 远程监督 174
4.5.3 弱监督学习与Snorkel 176
4.5.4 Snorkel用于关系抽取 179
4.6 本章小结 184
第5章 知识存储 186
5.1 数据与知识存储 188
5.1.1 数据存储模型 188
5.1.2 知识存储极简史 189
5.2 图数据库模型 193
5.2.1 属性图模型 193
5.2.2 完整性约束 196
5.2.3 事务、ACID与BASE 200
5.2.4 查询语言 202
5.3 JanusGraph分布式图数据库 202
5.3.1 JanusGraph的存储模型 205
5.3.2 JanusGraph的属性图模式 209
5.3.3 事务和故障恢复 220
5.3.4 图查询语言Gremlin 221
5.3.5 JanusGraph和Gremlin入门指南 222
5.4 其他图数据库介绍 235
5.4.1 Neo4j 236
5.4.2 Dgraph 239
5.4.3 NebulaGraph 243
5.4.4 图数据对比一览表 246
5.5 本章小结 248
第6章 知识计算 250
6.1 知识计算及其数学基础 252
6.1.1 知识图谱与图 252
6.1.2 图论 253
6.1.3 邻接矩阵 256
6.1.4 谱图理论 257
6.2 遍历与*短路径算法 258
6.2.1 广度优先搜索 258
6.2.2 深度优先搜索 260
6.2.3 Dijkstra单源*短路径 262
6.2.4 *短路径快速算法 265
6.2.5 Floyd算法 268
6.3 中心性 270
6.3.1 度中心性 270
6.3.2 亲密中心性 272
6.3.3 中介中心性 274
6.3.4 特征向量中心性 279
6.3.5 PageRank 281
6.4 社区检测 284
6.4.1 模块度 286
6.4.2 GN社区检测算法 290
6.4.3 Louvain社区检测算法 291
6.5 知识计算工具与系统 297
6.5.1 图数据库计算框架 297
6.5.2 分布式图计算引擎 298
6.5.3 图分析工具包 298
6.6 本章小结 299
第7章 知识推理 300
7.1 知识的表示与推理 302
7.1.1 因果推理 303
7.1.2 演绎推理 303
7.1.3 归纳推理 304
7.1.4 概率推理 305
7.1.5 知识图谱的推理技术 306
7.2 基于规则和逻辑的知识推理方法 308
7.2.1 基于规则的方法 308
7.2.2 基于逻辑的方法 311
7.2.3 定性时空推理 313
7.3 几何空间嵌入的知识推理方法 316
7.3.1 欧几里得空间的平移变换方法 317
7.3.2 复数向量空间的RotatE模型 330
7.3.3 双曲空间嵌入的知识推理方法 334
7.4 知识推理的深度学习方法 353
7.4.1 卷积神经网络的知识推理方法 353
7.4.2 图神经网络模型 358
7.5 本章小结 368
第8章 知识图谱行业应用 370
8.1 行业知识图谱 372
8.1.1 行业知识图谱的特点 372
8.1.2 行业知识图谱的应用价值 376
8.2 知识图谱行业应用范式 382
8.3 共通的应用程序 385
8.3.1 数据与知识中台 385
8.3.2 可视化与交互式分析 388
8.3.3 智能问答 391
8.3.4 认知推荐 396
8.3.5 辅助决策模型 400
8.4 金融 400
8.4.1 反洗钱和反恐怖融资 400
8.4.2 个人信用评估与风险控制 402
8.4.3 企业风险识别、控制与管理 404
8.4.4 系统性金融风险 406
8.4.5 审计 407
8.4.6 证券分析与投资研究 408
8.4.7 保险 410
8.5 医疗、生物医药和卫生健康 411
8.5.1 基因知识图谱 411
8.5.2 生物医药 412
8.5.3 智慧医疗 414
8.5.4 公共卫生 416
8.5.5 中医药知识图谱 418
8.6 智能制造 418
8.6.1 设计研发 419
8.6.2 质量与可靠性工程 420
8.6.3 设备的管理、维护与维修 422
8.6.4 BOM物料清单管理 425
8.6.5 供应链管理 427
8.6.6 售后服务 428
8.7 本章小结 429
节选
序一 《知识图谱:认知智能理论与实战》一书深入浅出地介绍了知识图谱的知识,并且指出“知识图谱是人工智能发展的阶梯”。人工智能的目的在于处理知识,有知识图谱这种形式化的知识表示方式作为阶梯,人工智能当然会取得蒸蒸日上的进步。我同意王文广的这个观点。 早在1956年于美国的达特茅斯学院召开的达特茅斯会议上,学者们就提出了“人工智能”的设想,此后人工智能迅速地发展起来。自然语言处理是人工智能的重要研究领域,在自然语言处理的研究中,学者们开始构建自动推理模型对问题进行求解,提出了语义网络、框架、脚本等一系列知识描述的理论和方法。 Sowa等人在1983年提出了“概念网络”,对知识进行描述。根据符号主义的原则,学者们将实体之间的关系局限于“拥有、导致、属于”等特殊的基本关系,并定义了一些在图谱上推理的规则,希望通过逻辑推理的方式实现人工智能。 在这些知识描述理论和方法的基础上,领域专家开始使用人工的方式编写实例数据,建立知识库,这些研究在一些受限的领域获得成功。学者们开始关注知识资源的研究。 互联网出现之后,人们在与自然和社会的交互中创造了大规模的数据,人类社会进入了大数据时代,这些大数据以文字、图片、音频、视频等不同的模态存在。怎样让计算机自动识别、阅读、分析、理解这些庞杂而海量的大数据,从中挖掘出有价值的信息,为用户提供精准的信息服务,成为下一代信息服务的核心目标之一。 2001年,Tim Berners Lee提出了语义网的概念,定义了一种描述客观世界的概念化规范,通过一套统一的元数据,对互联网的内容进行详细的语义标注,从而给互联网赋予语义,把网页互联的万维网(WWW)转化为内容互联的语义网。在语义网思想的影响下,亿万网民协同构建了“维基百科”(Wikipedia),促进了知识资源的迅速增长,使知识类型、覆盖范围和数据规模都达到了空前的水平。 1972年的文献中就出现了“知识图谱”(Knowledge Graph)这个术语。2012年5月,谷歌公司明确提出了知识图谱的概念并构建了一个大规模的知识图谱,开启了知识图谱研究之先河。从此,知识图谱便在自然语言处理的研究中普及开来,成为自然语言处理研究的一个重要内容。 知识图谱用节点(Vertex)表示语义符号,用边(Edge)表示符号与符号之间的语义关系,因而构成了一种通用的语义知识形式化描述框架。在计算机中,节点和边等符号都可以通过“符号具化”(Symbol Grounding)的方式表征物理世界和认知世界中的对象,并作为不同个体对认知世界中信息和知识进行描述和交换的桥梁。知识图谱使用统一形式的知识描述框架,便于知识的分享和学习,因而受到了自然语言处理研究者的普遍欢迎。 自谷歌构建知识图谱,并在2012年发布了包含507亿个实体的大规模知识图谱以来,不少互联网公司很快跟进,纷纷构建各自的知识图谱。例如,微软建立了Probase,百度建立了“知心”,搜狗建立了“知立方”。金融、医疗、司法、教育、出版等各个行业也纷纷建立起各自垂直领域的知识图谱,大幅提高了这些行业的智能化水平。Amazon、eBay、IBM、LinkedIn、Uber等公司相继发布了开发知识图谱的公告。与此同时,学术界也开始研究构建知识图谱的理论和方法,越来越多的关于知识图谱主题的书籍和论文被出版和发表,其中包括新技术及有关知识图谱的调查。知识图谱得到了产业界和学术界的广泛认可和关注。 知识图谱技术的发展有着深厚的历史渊源,它源于对人工智能中自然语言的语义知识表示的研究,并经历了互联网信息服务不断深化需求的洗礼,现在已经发展成为互联网知识服务的核心工具。 以语义网络(Semantic Network)为代表的知识表示的相关理论研究,对互联网智能化信息处理的应用实践,以维基百科为代表的网络协同构建知识资源的创举,这些因素共同推动了知识图谱的进一步发展。 目前,大规模的知识图谱有DBpedia、YAGO、Freebase、Wikidata、NELL、Knowledge Vault等,它们用丰富的语义表示能力和灵活的结构来描述认知世界和物理世界中的信息和知识,是知识的有效载体。 《知识图谱:认知智能理论与实战》一书系统全面地介绍了知识图谱的核心技术,既有宏观整体的技术体系介绍,也深入关键技术和算法细节;既适合作为高等学校人工智能课程的参考资料,也可以作为产业界系统开发的指南。 冯志伟 中国中文信息学会会士 中国计算机学会 NLPCC杰出贡献奖获得者 2022年2月10日 序二 随着数字化日渐成熟,知识图谱的应用正在广泛渗透到C端用户生活的方方面面,比如智能搜索。实际上,“知识图谱”概念*早由谷歌在2012年提出,它能够在反馈正确结果、给出全面总结、更深入广泛探索三大方面优化搜索效果。再比如电商智能推荐,阿里巴巴从2017年开始搭建电商认知图谱,将用户需求表达为图中的节点,并将需求点和电商领域的商品、类目、电商外部的通用领域知识等关联起来,从中挖掘客户的购物偏好和潜在的感兴趣的商品,使客户与商品和场景更好地连接。此外,还有O2O领域线上线下生活场景图谱,以美团为例,美团点评从2018年开始建立基于知识图谱的美团大脑,在客户、线下店铺和商品及不同的消费场景之间构建知识关联,从而优化客户的使用体验。 在B端,知识图谱在企业关联和企业分析方向也有很好的应用。比如对企业的法人或高管、企业之间的投资关系和关联风险进行分析,呈现在图谱上会非常直观。这种方式能够使海量信息以十分有效的方式在短时间内触达使用者。 知识图谱是企业将核心业务竞争能力和隐形数字资产融合形成新发展模式并获得持续竞争优势的关键技术,其应用领域日趋广泛,尤其在金融、医疗、制造等领域应用中发挥了极其重要的作用。王文广的这本书将知识图谱核心内容与深度学习技术融合,体系合理,理论完备,实践丰富,语言深入浅出,是研究与应用知识图谱的优秀参考书。 朱琳 微软人工智能和物联网实验室前首席执行官 微软-仪电人工智能创新院总经理 2022年3月13日
作者简介
王文广,浙江大学计算机科学与技术硕士,高级工程师,知识图谱与认知智能领域知名专家。 现任达观数据副总裁,专注于自然语言处理、知识图谱、图像与语音分析、认知智能、大数据和图分析等方向的技术研究、产品开发和产业应用,为金融、智能制造、医疗与生物医药、半导体等行业提供认知智能产品和技术服务。 现为上海市人工智能技术标准化委员会委员,上海市科学技术委员会评审专家、人工智能领域标准编制专家,CCF 高级会员,CIPS语言与知识计算专委会委员,CAAI深度学习专委会委员。主导或参与过百余个人工智能科学研究和产业应用项目,曾获得国际、国内多个算法竞赛奖项,申请人工智能领域国家发明专利数十项,并参与编制人工智能领域的多个国家标准、行业标准和团体标准。
-
深度学习的数学
¥43.5¥69.0 -
全图解零基础word excel ppt 应用教程
¥19.0¥48.0 -
机器学习
¥59.4¥108.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥31.9¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥22.1¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥83.3¥119.0 -
Visual Basic 语言程序设计基础(第6版)
¥32.0¥45.0 -
贝叶斯推理与机器学习
¥139.3¥199.0