×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
自然语言标注-用于机器学习-(影印版)

自然语言标注-用于机器学习-(影印版)

1星价 ¥19.4 (3.6折)
2星价¥19.4 定价¥54.0

温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口有划线标记、光盘等附件不全详细品相说明>>

暂无评论
图文详情
  • ISBN:9787564142810
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:324
  • 出版时间:2013-06-01
  • 条形码:9787564142810 ; 978-7-5641-4281-0

本书特色

在收集你的数据集(语料库)之前定义一个清晰的标注目标 学习用于分析你的语料库中语言内容的工具 搭建用于你的标注项目的模型和规范 检查从基本的XML到语言标记框架这样一些不同的标注格式 创建适合于训练和测试机器学习算法的黄金标准语料库 选择用来处理你的标注数据的机器学习算法 评估测试结果并修正你的标注任务 学习如何使用用于标注文本和调整标注的轻量级软件 “语言标注是自然语言处理的关键环节,但是它很少在计算语言学课程中被提及。这是一本手把手讲解标注的书籍,从规范和设计到使用机器学习算法面面俱到。它必然成为本科和研究生的计算语言学课程的范本。” ——Nancy Ide Vassar学院的计算机科学教授

内容简介

是时候创建属于你自己的用于机器学习的自然语言训练语料库了。无论你使用英语、汉语或者其他任何一种自然语言, 本书都可以手把手地指导你一种经验证的标注开发周期——把元语添加到你的训练语料库中来帮助机器学习算法更有效工作的过程。你无需任何编程或者语言学方面的经验就可以上手。通过每一步中的详细示例, 你将学到“标注开发过程”是如何帮助你建模、标注、训练、测试、评估和修正你的训练语料库。你也将了解到一个实际标注项目的完整演示。

目录


preface
1. thebasics
 the importance of language annotation
  the layers of linguistic description
  what is natural language processing?
 a brief history of corpus linguistics
  what is a corpus?
  early use of corpora  
  corpora today  
  kinds of annotation
 language data and machine learnin9  
  classification
  clustering
  structured pattern induction
  the annotation development cycle
  model the phenomenon
  annotate with the specification
  train and test the algorithms over the corpus
  evaluate the results
  revise the model and algorithms
 summary
2. definingyourgoai and dataset
 defining yoor goal
  the statement of purpose
  refining your goal:informativity versus correctness
  background research  
  language resources
 ……
展开全部

作者简介

Jarues Plastejovsky,是Brandeis大学的教授,他在该大学的计算机科学系讲解和研究人工智能及计算语言学。 Amber Stubbs,刚刚获得了Brandeis大学标注方法论的博士学位。她现在是SUNY Albany大学的博上后。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航