×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
暂无评论
图文详情
  • ISBN:9787121311659
  • 装帧:暂无
  • 册数:暂无
  • 重量:暂无
  • 开本:32开
  • 页数:598
  • 出版时间:2017-05-01
  • 条形码:9787121311659 ; 978-7-121-31165-9

本书特色

本书介绍了当下*流行的开源搜索技术解决方案Solr。在搜索引擎视域下,循序渐进地介绍了Solr是什么、Solr 能做什么,以及如何更好地使用Solr 进行开发。在搜索基础层,本书从Solr 的快速搭建入手,介绍了Solr 背后的信息检索基本概念,之后重点讲解了构建一个搜索引擎所需的核心模块:索引构建、文本分析、执行搜索及处理搜索结果。在搜索功能层,详细介绍了Solr 的四大增强型搜索功能:分面搜索、搜索结果高亮、查询建议、搜索结果分组等。在搜索研究的进阶层,介绍了SolrCloud、多语种搜索及复杂查询操作等。*后,围绕搜索引擎的本质核心问题“相关度”展开了讨论与展望。本书适合搜索技术工程师、搜索应用设计者以及对搜索引擎技术感兴趣的读者阅读,也可作为高校计算机专业信息技术方向、信息管理与信息系统专业等的课程参考资料。

内容简介

Solr 为我们提供了一个更易于学习、操作与应用的全功能开源搜索平台。该书从信息检索的基本概念入手,理论讲解联系实践操作,让读者知其然的同时知其所以然。读者不仅能从中掌握如何使用Solr,而且能掌握系统化的信息检索专业知识,对网络各类搜索系统做到触类旁通。

目录

第1 部分 初识Solr............................................... 1
1 Solr 入门.................................................................................. 2
1.1 为什么需要搜索引擎 ...................................................................................... 3
1.1.1 管理以文本为中心的数据 .................................................................. 3
1.1.2 常见的搜索引擎用例 .......................................................................... 6
1.2 Solr 是什么 ....................................................................................................... 8
1.2.1 信息检索引擎 ...................................................................................... 9
1.2.2 灵活的模式管理 ................................................................................ 11
1.2.3 Java Web 应用 .................................................................................... 12
1.2.4 一台服务器上的多个索引 ................................................................ 13
1.2.5 可扩展性(插件) .............................................................................. 13
1.2.6 可伸缩性 ............................................................................................ 14
1.2.7 容错性 ................................................................................................ 15
1.3 选择Solr 的理由 ............................................................................................ 15
1.3.1 面向软件架构师的Solr .................................................................... 15
1.3.2 面向系统管理员的Solr .................................................................... 16
1.3.3 面向CEO 的Solr .............................................................................. 17
1.4 功能概述 ........................................................................................................ 17
1.4.1 用户体验功能 .................................................................................... 17
1.4.2 数据建模功能 .................................................................................... 19
1.4.3 Solr 4 的新功能 ................................................................................. 20
1.5 本章小结 ........................................................................................................ 22
2 Solr 上手................................................................................23
2.1 开始上手 ........................................................................................................ 24
2.1.1 Solr 的安装 ........................................................................................ 24
2.1.2 启动Solr 的示例服务器 ................................................................... 25
2.1.3 了解Solr 主目录 ............................................................................... 29
2.1.4 对示例文档进行索引 ........................................................................ 30
2.2 一切都关乎搜索 ............................................................................................ 31
2.2.1 Solr 查询表单详解 ............................................................................ 31
2.2.2 Solr 的搜索返回机制 ........................................................................ 34
2.2.3 排名检索 ............................................................................................ 36
2.2.4 分页和排序 ....................................................................................... 36
2.2.5 扩展的搜索功能 ................................................................................ 38
2.3 Solr 管理控制台一览 ..................................................................................... 40
2.4 根据需求改造搜索示例服务器 .................................................................... 42
2.5 本章小结 ........................................................................................................ 43
3 Solr 基础理论.........................................................................45
3.1 搜索、匹配与找寻内容 ................................................................................ 46
3.1.1 何为文档 ............................................................................................ 46
3.1.2 基本搜索问题 .................................................................................... 47
3.1.3 倒排索引 ............................................................................................ 50
3.1.4 词项、短语与布尔逻辑 .................................................................... 51
3.1.5 找到文档集 ........................................................................................ 53
3.1.6 短语查询与术语位置 ........................................................................ 55
3.1.7 模糊匹配 ............................................................................................ 57
3.1.8 快速小结 ............................................................................................ 61
3.2 相关度 ............................................................................................................ 61
3.2.1 默认相似度 ........................................................................................ 62
3.2.2 词项频次 ............................................................................................ 63
3.2.3 反向文档频次 .................................................................................... 64
3.2.4 词项权重 ............................................................................................ 65
3.2.5 规范化因子 ........................................................................................ 66
3.3 查准率与查全率 ............................................................................................ 67
3.3.1 查准率 ................................................................................................ 67
3.3.2 查全率 ................................................................................................ 68
3.3.3 达到平衡 ............................................................................................ 69
3.4 搜索的规模化 ................................................................................................ 70
3.4.1 非规范化文档 .................................................................................... 70
3.4.2 分布式搜索 ........................................................................................ 72
3.4.3 集群vs. 服务器 .................................................................................. 73
3.4.4 Solr 的局限 ........................................................................................ 74
3.5 本章小结 ........................................................................................................ 75
4 配置Solr................................................................................77
4.1 solrconfig.xml 文件概览 ................................................................................ 80
4.1.1 常见的XML 数据结构和数据类型元素 ......................................... 82
4.1.2 配置文件更新的应用 ........................................................................ 82
4.1.3 Solr 的其他配置 ................................................................................ 83
4.2 查询请求处理 ................................................................................................ 85
4.2.1 请求处理简介 .................................................................................... 86
4.2.2 搜索处理器 ........................................................................................ 88
4.2.3 Solritas 的browse 请求处理器示例 ................................................. 90
4.2.4
展开全部

作者简介

Trey Grainger是CareerBuilder公司的工程总监。Timothy Potter是LucidWorks公司工程组的资深成员。两位作者都在从事Solr的可扩展性和可靠性、推荐引擎及大数据分析技术等方面的工作。
范炜,四川大学信息管理技术系副教授,情报学硕士生导师。主要从事信息组织与检索方面的教学科研工作。参编《信息管理导论(第3版)》和《信息组织(第3版)》,技术审校《Web信息架构(第2版)》和《搜索模式》。中国图书馆学会信息组织专业委员会委员、国际十进制分类法UDC咨询委员会委员,国际信息科学与技术协会ASIS&T、国际知识组织学会ISKO会员。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航