数字文献资源高维聚合模型研究
温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口有划线标记、光盘等附件不全详细品相说明>>
- ISBN:9787520307826
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:259
- 出版时间:2017-08-01
- 条形码:9787520307826 ; 978-7-5203-0782-6
本书特色
针对文本挖掘和信息检索中的文本或文献聚类与分类等问题,学术界基于VSM(向量空间模型)主要有两方面的研究,一者是文献表示模型的改进,二者是算法的改进。然而传统的算法对高维稀疏的向量聚类存在不足,一些新的算法也不尽完美,更主要的是聚类算法的效果与数据本身的特征以及信息提取和表示密切相关,特别是在信息有限的情况下,聚类算法的优势也不能得到完美发挥,相比之下,信息的挖掘、提取和文献向量表示就尤为重要。在本文仅限于元数据甚至只有关键词的前提下,文献的表示向量相比一般文本表示就表现得非常稀疏,面对这种情形聚类算法即使是“巧妇”也“难为无米之炊”,因此,本书的重点突破是文献主题语义信息的提取、度量和文献高维向量的新表示方法。基于以上问题和现象,本书以数字文献资源为对象,本着在信息资源聚合中减少对背景知识的依赖,便于推广应用的宗旨,提出了基于文献集本身或者相关领域的共现信息而实现文献聚合的共现潜在语义向量空间模型(CLSVSM)。而且通过实验证实基于CLSVSM的文献聚类表现比基于VSM和GVSM(广义向量空间模型)显著地好。
内容简介
针对文本挖掘和信息检索中的文本或文献聚类与分类等问题,学术界基于VSM(向量空间模型)主要有两方面的研究,一者是文献表示模型的改进,二者是算法的改进。然而传统的算法对高维稀疏的向量聚类存在不足,一些新的算法也不尽完美,更主要的是聚类算法的效果与数据本身的特征以及信息提取和表示密切相关,特别是在信息有限的情况下,聚类算法的优势也不能得到完美发挥,相比之下,信息的挖掘、提取和文献向量表示就尤为重要。在本文仅限于元数据甚至只有关键词的前提下,文献的表示向量相比一般文本表示就表现得非常稀疏,面对这种情形聚类算法即使是“巧妇”也“难为无米之炊”,因此,本书的重点突破是文献主题语义信息的提取、度量和文献高维向量的新表示方法。基于以上问题和现象,本书以数字文献资源为对象,本着在信息资源聚合中减少对背景知识的依赖,便于推广应用的宗旨,提出了基于文献集本身或者相关领域的共现信息而实现文献聚合的共现潜在语义向量空间模型(CLSVSM)。而且通过实验证实基于CLSVSM的文献聚类表现比基于VSM和GVSM(广义向量空间模型)显著地好。
目录
作者简介
牛奉高,男,1980年4月生,山西沁水人。山西大学数学科学学院统计系讲师,硕士生导师,山西省高等学校优秀青年学术带头人,中国数学会会员,中国科学学与科技政策研究会、全国科学计量学与信息计量学专业委员会会员。2014年毕业于武汉大学情报学专业,获管理学博士学位。2015年获湖北省优秀博士学位论文奖。研究领域包括信息计量与科学评价、应用统计等。主持国家自然科学基金项目一项,省厅级科研项目三项;在《Scientometrics》、《情报学报》、《情报科学》、《重庆大学学报》、《武汉大学学报》、《山西大学学报》等国内外期刊上发表学术论文20余篇;获批软件著作权一项;参编《科学计量学》、《知识计量学》等多部著作,担任《中国研究生学科专业评价报告》副主编。
-
蛤蟆先生去看心理医生
¥26.6¥38.0 -
咬文嚼字二百问
¥15.4¥32.0 -
世界尽头的咖啡馆
¥18.0¥45.0 -
字海探源
¥25.0¥78.0 -
从零开始的女性主义
¥30.3¥52.0 -
乡土中国
¥14.6¥26.0 -
与内心的恐惧对话:摆脱来自亲人的负能量
¥34.1¥48.0 -
《标点符号用法》解读
¥6.2¥15.0 -
中国人的精神
¥9.9¥29.0 -
社会学:原来这么有趣有用
¥9.1¥36.0 -
你能写出好故事-写作的诀窍.大脑的奥秘.认知的陷阱
¥16.4¥32.8 -
焦虑心理学:不畏惧、不逃避,和压力做朋友
¥11.4¥38.0 -
乌合之众:大众心理研究
¥12.1¥36.8 -
理解生命
¥10.5¥32.8 -
从白大褂到病号服:探索医疗中的人性落差
¥19.9¥39.8 -
非暴力沟通心理学 : 用非暴力沟通化解冲突
¥13.0¥36.0 -
上大演讲录(1922-1927卷)(九品)
¥14.0¥52.0 -
那时的大学
¥14.6¥28.0 -
乌合之众:群体心理研究
¥11.9¥39.8 -
始于极限:女性主义往复书简(八品)
¥40.7¥59.0