- ISBN:9787121311659
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 开本:32开
- 页数:598
- 出版时间:2017-05-01
- 条形码:9787121311659 ; 978-7-121-31165-9
本书特色
本书介绍了当下*流行的开源搜索技术解决方案Solr。在搜索引擎视域下,循序渐进地介绍了Solr是什么、Solr 能做什么,以及如何更好地使用Solr 进行开发。在搜索基础层,本书从Solr 的快速搭建入手,介绍了Solr 背后的信息检索基本概念,之后重点讲解了构建一个搜索引擎所需的核心模块:索引构建、文本分析、执行搜索及处理搜索结果。在搜索功能层,详细介绍了Solr 的四大增强型搜索功能:分面搜索、搜索结果高亮、查询建议、搜索结果分组等。在搜索研究的进阶层,介绍了SolrCloud、多语种搜索及复杂查询操作等。*后,围绕搜索引擎的本质核心问题“相关度”展开了讨论与展望。本书适合搜索技术工程师、搜索应用设计者以及对搜索引擎技术感兴趣的读者阅读,也可作为高校计算机专业信息技术方向、信息管理与信息系统专业等的课程参考资料。
内容简介
Solr 为我们提供了一个更易于学习、操作与应用的全功能开源搜索平台。该书从信息检索的基本概念入手,理论讲解联系实践操作,让读者知其然的同时知其所以然。读者不仅能从中掌握如何使用Solr,而且能掌握系统化的信息检索专业知识,对网络各类搜索系统做到触类旁通。
目录
1 Solr 入门.................................................................................. 2
1.1 为什么需要搜索引擎 ...................................................................................... 3
1.1.1 管理以文本为中心的数据 .................................................................. 3
1.1.2 常见的搜索引擎用例 .......................................................................... 6
1.2 Solr 是什么 ....................................................................................................... 8
1.2.1 信息检索引擎 ...................................................................................... 9
1.2.2 灵活的模式管理 ................................................................................ 11
1.2.3 Java Web 应用 .................................................................................... 12
1.2.4 一台服务器上的多个索引 ................................................................ 13
1.2.5 可扩展性(插件) .............................................................................. 13
1.2.6 可伸缩性 ............................................................................................ 14
1.2.7 容错性 ................................................................................................ 15
1.3 选择Solr 的理由 ............................................................................................ 15
1.3.1 面向软件架构师的Solr .................................................................... 15
1.3.2 面向系统管理员的Solr .................................................................... 16
1.3.3 面向CEO 的Solr .............................................................................. 17
1.4 功能概述 ........................................................................................................ 17
1.4.1 用户体验功能 .................................................................................... 17
1.4.2 数据建模功能 .................................................................................... 19
1.4.3 Solr 4 的新功能 ................................................................................. 20
1.5 本章小结 ........................................................................................................ 22
2 Solr 上手................................................................................23
2.1 开始上手 ........................................................................................................ 24
2.1.1 Solr 的安装 ........................................................................................ 24
2.1.2 启动Solr 的示例服务器 ................................................................... 25
2.1.3 了解Solr 主目录 ............................................................................... 29
2.1.4 对示例文档进行索引 ........................................................................ 30
2.2 一切都关乎搜索 ............................................................................................ 31
2.2.1 Solr 查询表单详解 ............................................................................ 31
2.2.2 Solr 的搜索返回机制 ........................................................................ 34
2.2.3 排名检索 ............................................................................................ 36
2.2.4 分页和排序 ....................................................................................... 36
2.2.5 扩展的搜索功能 ................................................................................ 38
2.3 Solr 管理控制台一览 ..................................................................................... 40
2.4 根据需求改造搜索示例服务器 .................................................................... 42
2.5 本章小结 ........................................................................................................ 43
3 Solr 基础理论.........................................................................45
3.1 搜索、匹配与找寻内容 ................................................................................ 46
3.1.1 何为文档 ............................................................................................ 46
3.1.2 基本搜索问题 .................................................................................... 47
3.1.3 倒排索引 ............................................................................................ 50
3.1.4 词项、短语与布尔逻辑 .................................................................... 51
3.1.5 找到文档集 ........................................................................................ 53
3.1.6 短语查询与术语位置 ........................................................................ 55
3.1.7 模糊匹配 ............................................................................................ 57
3.1.8 快速小结 ............................................................................................ 61
3.2 相关度 ............................................................................................................ 61
3.2.1 默认相似度 ........................................................................................ 62
3.2.2 词项频次 ............................................................................................ 63
3.2.3 反向文档频次 .................................................................................... 64
3.2.4 词项权重 ............................................................................................ 65
3.2.5 规范化因子 ........................................................................................ 66
3.3 查准率与查全率 ............................................................................................ 67
3.3.1 查准率 ................................................................................................ 67
3.3.2 查全率 ................................................................................................ 68
3.3.3 达到平衡 ............................................................................................ 69
3.4 搜索的规模化 ................................................................................................ 70
3.4.1 非规范化文档 .................................................................................... 70
3.4.2 分布式搜索 ........................................................................................ 72
3.4.3 集群vs. 服务器 .................................................................................. 73
3.4.4 Solr 的局限 ........................................................................................ 74
3.5 本章小结 ........................................................................................................ 75
4 配置Solr................................................................................77
4.1 solrconfig.xml 文件概览 ................................................................................ 80
4.1.1 常见的XML 数据结构和数据类型元素 ......................................... 82
4.1.2 配置文件更新的应用 ........................................................................ 82
4.1.3 Solr 的其他配置 ................................................................................ 83
4.2 查询请求处理 ................................................................................................ 85
4.2.1 请求处理简介 .................................................................................... 86
4.2.2 搜索处理器 ........................................................................................ 88
4.2.3 Solritas 的browse 请求处理器示例 ................................................. 90
4.2.4
作者简介
Trey Grainger是CareerBuilder公司的工程总监。Timothy Potter是LucidWorks公司工程组的资深成员。两位作者都在从事Solr的可扩展性和可靠性、推荐引擎及大数据分析技术等方面的工作。
范炜,四川大学信息管理技术系副教授,情报学硕士生导师。主要从事信息组织与检索方面的教学科研工作。参编《信息管理导论(第3版)》和《信息组织(第3版)》,技术审校《Web信息架构(第2版)》和《搜索模式》。中国图书馆学会信息组织专业委员会委员、国际十进制分类法UDC咨询委员会委员,国际信息科学与技术协会ASIS&T、国际知识组织学会ISKO会员。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥31.9¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0