自然语言理解与行业知识图谱:概念、方法与工程落地:concepts, methods and practice
- ISBN:9787111698302
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:24cm
- 页数:16,344页
- 出版时间:2022-01-01
- 条形码:9787111698302 ; 978-7-111-69830-2
本书特色
从自然语言理解入手,详细讲解了行业知识图谱在真实项目中构建、应用、维护等阶段中的各种“坑”和“技”。
内容简介
本部分首先阐述自然语言理解的发展脉络和理解逻辑,主要围绕语言符号、处理体系、语义理解等进行探讨,引出自然语言理解的自动分析原理和方法,包括自然语言特征、统计学习、机器学习、深度学习、知识图谱等。 第1章概述自然语言发展脉络,描述了语言理解的研究现状、商业形势、认知突破口和未来预测。 第2章梳理语言理解的演变流程,介绍我们面临的各类自然语言理解任务,*后给出语言理解的研究体系框架,引出自然语言理解的基础——自然语言处理。 第3章重点介绍自然语言处理相关特征工程和文本任务对应的各类算法模型、深度学习的前沿进展。语言处理需要考虑特征构造(字、词、句、章级别)和特征表示,以利于后续自动处理。在特征表示方面,从早的符号表示到现在的张量表示,形成统计学习的基础。接下来结合统计学习框架,论述语言学习原理和语言模型,结合概率图模型和其他机器学习算法,阐述这些常规算法在自然语言处理任务中的应用和效果。然后进一步讨论深度学习的各类算法,对语言学习中的神经网络算法和新成果进行分析。*后探讨现有处理方法的发展边界,提出引入外源知识(知识图谱)来提高认知能力的必要性。 第4章系统介绍知识图谱,包括知识图谱工程和知识图谱智能。然后梳理国内外常见的通用知识图谱,并进一步总结热门行业的知识图谱发展现状。*后结合语言知识和知识图谱的搭建流程,引入语义特征,通过行业文本实例操作,帮助读者了解语义理解的本质。 行业知识图谱部分包含第5~8章。 本部分在上述基本自然语言处理方法讲解的基础上,继续阐述行业知识图谱搭建和行业应用的方法。目前从事自然语言理解的公司都将精力放在通用文本理解上,这些文本往往口语化严重、特征杂乱、信息量不足,导致算法处理形成的*终产品的用户体验不佳。考虑到行业文本往往有一定规范,相对容易取得突破口,也有利于推动行业发展,所以我们选择从行业文本出发,以专利文本实操作为样板。 第5章介绍行业知识工程实践,以专利行业为例,详细地描述了一个行业知识工程建设的过程。首先基于自然语言处理和知识图谱搭建方法,建设行业知识库,包括术语库、产品库、技术库、标准库、规则库等,进而开发行业主题分析模型、行业文本分类算法、相似度计算方法、价值评估方法和机器翻译方法。 第6章介绍知识图谱模块的搭建,包括关键词助手、语义搜索、分级管理、高级分析、推荐和问答等。结合实际应用,探讨知识图谱在提高智能性方面的能力和效果。 第7章在前面知识工程和知识图谱智能基础上搭建智能应用平台,介绍了平台的各类功能组件,描述了自下而上的软件服务封装逻辑,进一步向上封装为行业文本分析功能组件,包括检索、分析、挖掘、管理、预警、运营等。读者可以将这套思路在各行业进行实践验证,将上述组件和权限、安全板块集成为应用平台,搭建常态化文本分析运营平台,完成平台级别或各细分模块的商业产品落地。 第8章依托智能应用平台,结合实践案例给出团队的应用经验,即通过四个行业案例来验证平台的认知能力。 《自然语言理解与行业知识图谱:概念、方法与工程落地》以自然语言理解和行业知识图谱应用落地为目标,阐述了一个从0到1的行业文本理解案例。 《自然语言理解与行业知识图谱:概念、方法与工程落地》为互联网企业的智能平台构建提供了很好的案例参考,也为行业信息化从业者提供了从入门到进阶的技术指导,适合作为自然语言处理、知识图谱、计算机、人工智能等领域从业者的学习指导书,也非常适合对自然语言处理、知识图谱感兴趣的学生和创业团队阅读。
目录
作者简介
王楠,北京大学博士,“创青春-中关村U30”2020年度优胜者,先后任教于中国科学院、北京信息科技大学计算机学院。研究方向包括人工智能算法、知识图谱、自然语言处理与地球电磁学等。主持或参与国家科技重大专项、高分专项、军口预研、卫星系统、企业大数据系统等科研项目,累计获得研发经费超过千万元人民币。负责企业级“专利大数据智能分析系统”的研发,领导技术团队完成软件平台搭建、商用和优化。以作者身份发表行业内高水平论文十余篇,获得多项发明和实用新型专利,提交专利申请十余项。 赵宏宇,现就职于腾讯看点搜索团队,担任算法研究员。有多年NLP、搜索系统、推荐系统的工作经验,涉及专利、招聘和网页搜索等场景。精通PyTorch、TensorFlow等主流深度学习框架,擅长运用NLP前沿技术解决工业项目难题。在意图识别、内容推荐、相关性排序等领域有多年实战经验。曾参与千万级用户求职领域的推荐工作,作为算法主要负责人,主导全新算法落地迭代、线上算法优化以及上亿DAU网页搜索优化迭代。曾与人合著《智能搜索与推荐系统:原理、算法与应用》一书。 蔡月,清华-深圳湾实验室联合培养博士后,于2017年获得北京大学生物医学工程博士学位。曾担任东软医疗上海磁共振研发中心高级算法研究员。研究方向为数据科学、磁共振图像算法、深度学习等,擅长脑科学领域数据分析、磁共振图像加速、去噪等算法研究。曾在脑科学领域SCI期刊Neuroscience、Neurotoxicity Research上发表多篇文章,获得多项发明专利。
-
全图解零基础word excel ppt 应用教程
¥15.6¥48.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
机器学习
¥59.4¥108.0 -
情感计算
¥66.8¥89.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥48.3¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
LINUX实战——从入门到精通
¥48.3¥69.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥38.7¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0