- ISBN:9787518945948
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:208
- 出版时间:2018-07-01
- 条形码:9787518945948 ; 978-7-5189-4594-8
内容简介
《语义指纹著者姓名消歧理论及应用》提到的语义指纹是一种信息指纹,它将文献文本特征表示为固定位数(如64位或128位)的二进制指纹,保留了文本的语义特征且具有很好的降维效果。将语义指纹应用到姓名消歧是一种新的尝试,不仅可以实现良好的消歧效果,而且可以实现较高的消歧效率。 《语义指纹著者姓名消歧理论及应用》共分7章,第1章对姓名消歧进行了综述,第2章介绍了姓名消歧的主要方法,第3章介绍了姓名消歧相关国内外评测会议情况,第4章介绍了研究者标识系统,第5章介绍了语义指纹姓名消歧的相关理论,第6章介绍了基于语义指纹的著者姓名消歧,第7章介绍了基于语义指纹的专利发明人姓名消歧,第8章进行了总结和展望。 《语义指纹著者姓名消歧理论及应用》可以作为姓名消歧、科学合作网络、科技监测等研究的参考书。
目录
1.1 姓名歧义现象
1.2 姓名歧义带来的挑战
1.3 著者姓名歧义问题
1.4 研究意义
1.5 国内外研究现状
1.5.1 姓名消歧研究的来源
1.5.2 网页人名消歧的研究现状
1.5.3 著者姓名消歧的研究现状
1.6 本章小结
第2章 著者姓名消歧方法分类及研究综述
2.1 著者姓名消歧方法分类
2.2 人工著者姓名消歧方法
2.3 基于规则的著者姓名消歧方法
2.3.1 基于规则和阈值的姓名消歧方法
2.3.2 基于相似度打分表的姓名消歧方法
2.4 基于机器学习的著者姓名消歧方法
2.4.1 基于监督学习的姓名消歧方法
2.4.2 基于无监督学习的姓名消歧方法
2.4.3 基于半监督学习的姓名消歧方法
2.5 基于语义指纹的著者姓名消歧方法
2.6 基于唯一标识的著者姓名消歧方法
2.7 其他著者姓名消歧方法
2.7.1 基于社会网络的姓名消歧方法
2.7.2 基于网络知识资源的姓名消歧方法
2.8 现有方法对比分析
2.9 本章小结
第3章 姓名消歧相关的评测
3.1 WePS网页人物搜索评测
3.1.1 WePS
3.1.2 WePS
3.1.3 WePS
3.2 PatentsView专利发明人姓名消歧评测
3.2.1 数据
3.2.2 评价指标
3.2.3 竞赛结果
3.3 TAGKBP命名实体消歧评测
3.4 中文姓名消歧评测
3.4.1 2010年中文人名消歧评测
3.4.2 2012年中文人名消歧竞赛
3.5 本章小结
第4章 研究者标识系统
4.1 背景
4.2 国内外现状与本研究实施技术路线
4.2.1 国内外现状
4.2.2 实施技术路线
4.3 研究者标识系统案例
4.3.1 ResearchID
4.3.2 ORCID
4.3.3 研究者名称解析系统
4.4 研究者信息系统整合案例
4.4.1 Researcher.ID与0RCID
4.4.2 研究者名称解析系统与ORCID
4.5 中国研究者标识系统的应用设计
4.5.1 中国研究者标识系统框架设计
4.5.2 中国研究者标识系统与ORCID整合设计
4.5.3 中国研究者标识系统建设需要注意的问题
4.6 本章小结
第5章 语义指纹姓名消歧的基础理论
5.1 信息指纹
5.2 哈希函数
5.2.1 Rabin哈希函数
5.2.2 SDBM哈希函数
5.2.3 MD5哈希函数
5.2.4 SHA-1哈希函数
5.2.5 哈希函数对比
5.3 语义指纹介绍
5.3.1 语义指纹的概念
5.3.2 语义指纹的研究现状
5.3.3 语义指纹的应用
5.3.4 主要语义指纹算法
5.4 主要文本相似度计算方法
5.4.1 基于向量空间模型的相似度计算方法
5.4.2 基于字符串匹配的相似度计算方法
5.4.3 文本相似度计算方法比较
5.5 主要聚类算法
5.5.1 K-means聚类
5.5.2 层次聚类
5.5.3 图聚类
5.5.4 DBSCAN算法
5.5.5 聚类算法对比
5.6 本章小结
第6章 基于语义指纹的论文著者姓名消歧
6.1 引言
6.1.1 研究背景
6.1.2 研究意义
6.1.3 主要研究内容
6.2 方法
6.2.1 方法的原理
6.2.2 PDF2TXT
6.2.3 指纹生成器
6.2.4 指纹比较器
6.2.5 认领决策器
6.2.6 作品指派器
6.2.7 争议仲裁器
6.3 评价指标
6.4 实验结果
6.4.1 实验数据集构建
6.4.2 数据预处理
6.4.3 姓名消歧特征选择及独立特征姓名消歧实验
6.4.4 基于语义指纹的综合特征姓名消歧实验
6.5 本章小结
6.5.1 技术内涵
6.5.2 可能的应用
6.5.3 研究限制
6.5.4 未来研究方向
第7章 基于语义指纹的专利发明人姓名消歧
7.1 引言
7.1.1 研究背景
7.1.2 研究意义
7.1.3 主要研究内容
7.2 专利发明人姓名消歧方法
7.2.1 总体架构
7.2.2 数据获取
7.2.3 数据规范化
7.2.4 特征提取
7.2.5 语义指纹生成
7.2.6 分块策略设计
7.2.7 参数估计
7.2.8 实验步骤
7.2.9 小结
7.3 评价指标
7.4 专利发明人姓名消歧实验
7.4.1 数据处理
7.4.2 实验结果及讨论
7.4.3 小结
7.5 本章小结
7.5.1 主要研究结论
7.5.2 研究局限性
7.5.3 未来研究方向
第8章 总结及展望
8.1 总结
8.2 展望
参考文献
作者简介
韩红旗,中国科学技术信息研究所副研究员,硕士生导师。主要研究领域包括文本挖掘、复杂网络分析、知识工程、知识管理等。现已发表学术论文40余篇,参编专业图书7部,申请发明专利3件、软件著作权5件,参加国家高水平科研项目20余项,获省部级三等奖1项。目前主持国家自然科学基金面上项目“科学合作网络的不连通问题研究”,作为主要参与人参与国家自然科学基金项目“面向科技监测的实体识别与关系抽取研究”和“基于论文和专利资源的技术机会发现研究”的研究。
-
《标点符号用法》解读
¥5.3¥15.0 -
蛤蟆先生去看心理医生
¥18.6¥38.0 -
世界尽头的咖啡馆
¥15.8¥45.0 -
乡土中国
¥11.2¥26.0 -
咬文嚼字二百问
¥13.4¥32.0 -
始于极限:女性主义往复书简(八品)
¥22.4¥59.0 -
那一定是心理问题:科学识别身体和心理发出的求救信号
¥19.2¥52.0 -
中国人的名·字·号
¥10.9¥28.0 -
从白大褂到病号服:探索医疗中的人性落差
¥15.9¥39.8 -
与内心的恐惧对话:摆脱来自亲人的负能量
¥21.1¥48.0 -
记忆错觉-记忆如何影响了我们的感知.思维与心理
¥17.5¥39.8 -
自卑与超越
¥13.8¥36.0 -
乌合之众:大众心理研究
¥11.0¥36.8 -
理解生命
¥13.8¥32.8 -
钱基博讲古籍版本
¥5.4¥18.0 -
从零开始的女性主义
¥25.0¥52.0 -
社会学:原来这么有趣有用
¥12.6¥36.0 -
扶箕迷信底研究
¥4.7¥12.0 -
那时的大学
¥9.0¥28.0 -
如何从这个世界消失
¥11.9¥39.8