×
暂无评论
图文详情
  • ISBN:9787115614575
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:524
  • 出版时间:2023-12-01
  • 条形码:9787115614575 ; 978-7-115-61457-5

本书特色

1.使用特定的数据结构和(或)算法来提高性能”,解决工程实战中存在的真实问题。

2.Github国内大厂、美国大厂的面试题中会多有涉及。

3.涵盖国内大厂、美国大厂常见面试,包括动态规划、布隆过滤器、图计算等。

内容简介

这是一本关于“高级/进阶”算法和数据结构的图书,主要介绍了用于Web应用程序、系统编程和数据处理领域的各种算法,旨在让读者了解如何用这些算法应对各种棘手的编码挑战,以及如何将其应用于具体问题,以应对新技术浪潮下的“棘手”问题。 本书对一些广为人知的基本算法进行了扩展,还介绍了用于改善优先队列、有效缓存、对数据进行集群等的技术,以期读者能针对不同编程问题选出更好的解决方案。书中示例大多辅以图解,并以不囿于特定语言的伪代码以及多种语言的代码样本加以闸释。 学完本书,读者可以了解高级算法和数据结构的相关内容,并能运用这些知识让代码具备更优性能,甚至能够独立设计数据结构,应对需要自定义解决方案的情况。 本书可作为高等院校计算机相关专业本科高年级学生以及研究生的学习用书,也可供从事与算法相关工作的开发者参考。

目录

第 1章 初识数据结构 1

1.1 数据结构 2

1.1.1 定义数据结构 2

1.1.2 描述数据结构 3

1.1.3 算法与数据结构有区别吗 4

1.2 设定目标:阅读本书后的期望 4

1.3 打包背包:数据结构与现实世界的结合 5

1.3.1 抽象化问题 5

1.3.2 寻找解决方案 6

1.3.3 拯救大家的算法 7

1.3.4 打破常规来思考问题 8

1.3.5 完美的结局 9

1.4 小结 9

第 一部分 改进基本数据结构

第 2章 改进优先队列:d叉堆 12

2.1 本章结构 13

2.2 问题:处理优先级 13

2.3 已知解决方案:让列表保持有序 15

2.4 描述数据结构API:优先队列 15

2.4.1 使用优先队列 16

2.4.2 优先级为何非常重要 17

2.5 具体数据结构 17

2.5.1 性能比较 18

2.5.2 正确的具体数据结构是什么 18

2.5.3 堆 18

2.5.4 优先级、*小堆和*大堆 20

2.5.5 高级变体:d叉堆 21

2.6 如何实现堆 22

2.6.1 向上冒泡 22

2.6.2 向下推动 25

2.6.3 插入 27

2.6.4 移除顶部元素 28

2.6.5 修改 30

2.6.6 处理重复优先级 31

2.6.7 堆化 32

2.6.8 API之外的方法:包含 34

2.6.9 性能回顾 34

2.6.10 从伪代码到实现 35

2.7 用例:找到*大的k个元素 35

2.7.1 选择正确的数据结构 36

2.7.2 正确地使用数据结构 36

2.7.3 代码写起来 36

2.8 更多的用例 37

2.8.1 图中的*小距离:Dijkstra算法 37

2.8.2 更多的图算法:Prim算法 37

2.8.3 数据压缩:霍夫曼编码 38

2.9 对分支因子进行分析 41

2.9.1 是否需要d叉堆 41

2.9.2 运行时间 42

2.9.3 寻找*佳分支因子 42

2.9.4 分支因子与内存的关系 43

2.10 性能分析:寻找*佳分支因子 43

2.10.1 剖析 44

2.10.2 解释结果 45

2.10.3 堆化的谜团 49

2.10.4 选择*佳分支因子 49

2.11 小结 50

第3章 树堆:使用随机化来平衡二叉搜索树 52

3.1 问题:多索引 53

3.2 解决方案:描述与API 53

3.3 树堆 54

3.3.1 旋转 57

3.3.2 一些设计问题 60

3.3.3 实现搜索方法 61

3.3.4 插入 61

3.3.5 删除 64

3.3.6 去顶、看顶以及修改 66

3.3.7 返回*小键和*大键 67

3.3.8 性能回顾 67

3.4 应用:随机树堆 68

3.4.1 平衡树 68

3.4.2 引入随机化 70

3.4.3 随机树堆的应用 71

3.5 性能分析和剖析 72

3.5.1 理论:期望高度 72

3.5.2 剖析高度 74

3.5.3 剖析运行时间 76

3.5.4 剖析内存使用情况 78

3.5.5 结论 78

3.6 小结 80

第4章 布隆过滤器:减少跟踪内容所需的内存 81

4.1 字典问题:跟踪事物 82

4.2 实现字典的其他方法 83

4.3 描述数据结构API:关联数组 83

4.4 具体数据结构 84

4.4.1 无序数组:快速插入,慢速搜索 84

4.4.2 有序数组和二分查找:慢插入,稍微快一些的搜索 85

4.4.3 哈希表:在不需要有序的情况下,具有平均常数时间的性能 86

4.4.4 二叉搜索树:所有操作都是对数阶的 86

4.4.5 布隆过滤器:与哈希表一样快,但(由于一个缺陷而)更节省内存 88

4.5 表面之下:布隆过滤器是如何工作的 88

4.6 实现 89

4.6.1 使用布隆过滤器 90

4.6.2 位的读取和写入 91

4.6.3 找到键存储的位置 92

4.6.4 生成哈希函数 93

4.6.5 构造函数 93

4.6.6 查找键 94

4.6.7 存储键 95

4.6.8 估计准确率 96

4.7 应用场景 97

4.7.1 缓存 97

4.7.2 路由 98

4.7.3 爬虫 98

4.7.4 I/O提取器 98

4.7.5 拼写检查器 98

4.7.6 分布式数据库和文件系统 99

4.8 为什么布隆过滤器是可行的 99

4.8.1 为什么没有假阴性 100

4.8.2 为什么有假阳性 100

4.8.3 作为随机算法的布隆过滤器 101

4.9 性能分析 101

4.9.1 运行时间 101

4.9.2 构造函数 102

4.9.3 存储元素 102

4.9.4 查找元素 102

4.10 估计布隆过滤器的精确度 102

4.11 改进的变体 106

4.11.1 布隆表过滤器 106

4.11.2 组合布隆过滤器 106

4.11.3 分层布隆过滤器 106

4.11.4 压缩布隆过滤器 107

4.11.5 可扩展布隆过滤器 107

4.12 小结 108

第5章 不交集:次线性时间的处理过程 109

5.1 不同子集问题 110

5.2 解决方案的论证 111

5.3 描述数据结构API:不交集 112

5.4 简单解决方案 113

5.5 使用树状结构 117

5.5.1 从链表转移到树 117

5.5.2 实现使用树的版本 118

5.6 改进运行时间的启发式算法 120

5.6.1 路径压缩 121

5.6.2 实现平衡性与路径压缩 122

5.7 应用程序 124

5.7.1 图:连通分量 124

5.7.2 图:*小生成树的Kruskal算法 124

5.7.3 聚类 125

5.7.4 合一 126

5.8 小结 126

第6章 trie与基数树:高效的字符串搜索 127

6.1 拼写检查 128

6.1.1 拼写检查器的设计 128

6.1.2 压缩是关键 129

6.1.3 描述与API 129

6.2 trie 130

6.2.1 为什么trie更好 132

6.2.2 搜索 134

6.2.3 插入 137

6.2.4 删除 139

6.2.5 搜索*长前缀词 140

6.2.6 返回匹配特定前缀的所有键 141

6.2.7 什么时候应该使用trie 143

6.3 基数树 144

6.3.1 节点和边 146

6.3.2 搜索 148

6.3.3 插入 149

6.3.4 删除 151

6.3.5 搜索*长前缀词 153

6.3.6 返回匹配特定前缀的所有键 153

6.4 应用程序 154

6.4.1 拼写检查器 154

6.4.2 字符串相似度 156

6.4.3 字符串排序 157

6.4.4 T9 157

6.4.5 自动完成 158

6.5 小结 158

第7章 用例:LRU缓存 160

7.1 不要重复计算 160

7.2 第 一次尝试:记住数据 163

7.2.1 描述与API 164

7.2.2 请保存新数据 164

7.2.3 处理异步调用 165

7.2.4 将缓存的值标记为“正在加载” 166

7.3 内存(真的)不够 167

7.4 清除陈旧数据:LRU缓存 168

7.4.1 有时必须要重复解决问题 169

7.4.2 时间排序 170

7.4.3 性能 174

7.5 当新数据更有价值时:LFU 175

7.5.1 如何选择缓存的清除策略 176

7.5.2 LFU缓存有什么不同 176

7.5.3 性能 178

7.5.4 LFU缓存的不足 178

7.6 如何使用缓存也同样重要 179

7.7 同步简介 180

7.7.1 (在Java中)解决并发问题 182

7.7.2 锁简介 183

7.7.3 获取锁 183

7.7.4 重入锁 184

7.7.5 读锁 185

7.7.6 解决并发的其他方法 186

7.8 缓存应用程序 186

7.9 小结 187

第二部分 多维查询

第8章 *近邻搜索 190

8.1 *近邻搜索问题 190

8.2 解决方案 191

8.2.1 第 一次尝试 191

8.2.2 有时缓存并不是答案 191

8.2.3 简化事情以获得灵感 192

8.2.4 谨慎选择数据结构 193

8.3 描述与API 194

8.4 迁移到k维空间 195

8.4.1 一维二分查找 196

8.4.2 迁移到更高维度 196

8.4.3 用数据结构对二维空间进行建模 197

8.5 小结 198

第9章 k-d树:索引多维数据 199

9.1 从结束的地方继续 199

9.2 迁移到k维空间:循环遍历

维度 199

9.2.1 构造BST 201

9.2.2 不变量 204

9.2.3 保持平衡的重要性 204

9.3 方法 205

9.3.1 搜索 206

9.3.2 插入 208

9.3.3 平衡树 209

9.3.4 删除 212

9.3.5 *近邻搜索 218

9.3.6 区域搜索 224

9.3.7 所有方法的回顾 227

9.4 限制与可能的改进 228

9.5 小结 229

第 10章 相似性搜索树:图像检索的近似

*近邻搜索 230

10.1 从结束的地方继续 230

10.1.1 一个新的(更复杂的)例子 231

10.1.2 克服k-d树的缺陷 232

10.2 R树 232

10.2.1 先退一步:B树简介 232

10.2.2 由B树到R树 233

10.2.3 在R树中插入点 236

10.2.4 搜索 237

10.3 SS树 238

10.3.1 搜索 241

10.3.2 插入 244

10.3.3 插入:方差、均值与投影 249

10.3.4 插入:分裂节点 252

10.3.5 删除 255

10.4 相似性搜索 259

10.4.1 *近邻搜索 260

10.4.2 区域搜索 262

10.4.3 近似相似性搜索 263

10.5 SS 树 265

10.5.1 SS树会更好吗 266

10.5.2 缓解超球体的限制 267

10.5.3 改进拆分启发式算法 267

10.5.4 减少重叠 268

10.6 小结 270

第 11章 *近邻搜索的应用 271

11.1 应用程序:查找*近的枢纽 271

11.1.1 解决方案的初稿 272

11.1.2 天堂里的麻烦 273

11.2 中心化应用程序 274

11.2.1 过滤点 274

11.2.2 复杂的决定 276

11.3 迁移到分布式应用程序 278

11.3.1 处理HTTP通信的问题 279

11.3.2 保持库存同步 281

11.3.3 经验教训 281

11.4 其他应用程序 282

11.4.1 色彩还原 282

11.4.2 粒子的相互作用 283

11.4.3 多维数据库查询的优化 285

11.4.4 聚类 287

11.5 小结 287

第 12章 聚类 288

12.1 聚类简介 289

12.1.1 机器学习的类型 289

12.1.2 聚类的类型 290

12.2 k均值算法 291

12.2.1 k均值算法的问题 295

12.2.2 维度诅咒再次来袭 296

12.2.3 k均值算法的性能分析 297

12.2.4 用k-d树来加快k均值算法 297

12.2.5 关于k均值算法的*后一些提示 300

12.3 DBSCAN算法 300

12.3.1 直接可达与密度可达 301

12.3.2 从定义到算法 302

12.3.3 实现 304

12.3.4 DBSCAN算法的优缺点 305

12.4 OPTICS算法 307

12.4.1 定义 308

12.4.2 OPTICS算法的核心思想 308

12.4.3 从可达距离到聚类 311

12.4.4 分层聚类 314

12.4.5 性能分析和*终的考虑 318

12.5 评估聚类结果:评估指标 318

12.6 小结 322

第 13章 并行聚类:MapReduce与树冠聚类 323

13.1 并行化 323

13.1.1 并行计算与分布式计算 324

13.1.2 并行化k均值算法 325

13.1.3 树冠聚类 325

13.1.4 应用树冠聚类 327

13.2 MapReduce 328

13.2.1 MapReduce是如何工作的 328

13.2.2 先映射,后归约 331

13.2.3 表面之下,还有更多 334

13.3 MapReduce版本的k均值算法 334

13.3.1 并行化树冠聚类 337

13.3.2 使用树冠聚类来进行质心的初始化 339

13.3.3 MapReduce版本的树冠聚类 340

13.4 MapReduce版本的DBSCAN 算法 343

13.5 小结 348



第三部分 平面图与*小交叉数

第 14章 图简介:寻找距离*短的

路径 350

14.1 定义 351

14.1.1 图的实现 351

14.1.2 作为代数类型的图 353

14.1.3 伪代码 354

14.2 图的属性 354

14.2.1 无向 355

14.2.2 连通 355

14.2.3 无环 356

14.3 图的遍历:BFS与DFS 357

14.3.1 优化配送路线 357

14.3.2 广度优先搜索 359

14.3.3 重建到目标的路径 361

14.3.4 深度优先搜索 362

14.3.5 再次比较队列与堆栈 364

14.3.6 投递包裹的*佳路线 365

14.4 加权图中的*短路径:迪杰斯特拉 算法 365

14.4.1 与BFS算法的区别 366

14.4.2 实现 367

14.4.3 分析 368

14.4.4 投递包裹的*佳路线 369

14.5 超越迪杰斯特拉算法:A*

算法 370

14.5.1 A*算法到底有多好 372

14.5.2 将启发式函数作为平衡实时数据的一种方式 375

14.6 小结 376

第 15章 图嵌入与平面性:绘制具有*少相交边的图 377

15.1 图嵌入 378

15.1.1 一些基础定义 379

15.1.2 完全图与完全二分图 380

15.2 平面图 381

15.2.1 在实践中使用库拉托夫斯基定理 381

15.2.2 平面性测试 382

15.2.3 用于平面性测试的朴素算法 383

15.2.4 提高性能 386

15.2.5 高效的算法 388

15.3 非平面图 389

15.3.1 找到交叉数 391

15.3.2 直线交叉数 392

15.4 边的交叉点 393

15.4.1 直线线段 394

15.4.2 折线 397

15.4.3 贝塞尔曲线 397

15.4.4 二次贝塞尔曲线之间的交点 398

15.4.5 顶点与顶点相交以及边与顶点相交 401

15.5 小结 402

第 16章 梯度下降:(不仅是)图的优化问题 403

16.1 用于交叉数的启发式算法 404

16.1.1 刚才提到启发式了吗 404

16.1.2 扩展到曲线边 408

16.2 优化的工作原理 409

16.2.1 成本函数 410

16.2.2 阶跃函数与局部*小值 412

16.2.3 优化随机抽样算法 412

16.3 梯度下降 414

16.3.1 梯度下降中的数学描述 415

16.3.2 几何解释 416

16.3.3 什么时候可以应用梯度下降 418

16.3.4 梯度下降的问题 418

16.4 梯度下降的应用 419

16.5 使用梯度下降进行图嵌入 422

16.5.1 另一种标准 423

16.5.2 实现 425

16.6 小结 426

第 17章 模拟退火:超越局部*小值的优化 427

17.1 模拟退火 428

17.1.1 有时候需要先向上爬才能到达底部 429

17.1.2 实现 431

17.1.3 为什么模拟退火是有效的 432

17.1.4 短程与长程的转换 434

17.1.5 变体 435

17.1.6 模拟退火与梯度下降:应该选择哪一个呢 436

17.2 模拟退火与旅行推销员 436

17.2.1 精确解与近似解 438

17.2.2 可视化成本 438

17.2.3 修剪域 440

17.2.4 状态转换 440

17.2.5 相邻交换与随机交换 443

17.2.6 TSP近似算法的应用 444

17.3 模拟退火与图嵌入 444

17.3.1 *小边交叉 445

17.3.2 力导向绘制 446

17.4 小结 450

第 18章 遗传算法:受生物学启发的快速收敛优化 451

18.1 遗传算法简介 451

18.1.1 来自大自然的灵感 453

18.1.2 染色体 456

18.1.3 种群 457

18.1.4 适应度 458

18.1.5 自然选择 459

18.1.6 选择交配的个体 461

18.1.7 交叉操作 466

18.1.8 突变操作 468

18.1.9 遗传算法模板 469

18.1.10 遗传算法在什么时候效果*好 470

18.2 TSP 471

18.2.1 适应度、染色体与初始化 471

18.2.2 突变操作 472

18.2.3 交叉操作 472

18.2.4 结果与参数调整 473

18.2.5 超越TSP:优化整个车队的路线 476

18.3 *小顶点覆盖 477

18.3.1 顶点覆盖的应用 478

18.3.2 实现遗传算法 478

18.4 遗传算法的其他应用 480

18.4.1 *大流问题 480

18.4.2 蛋白质折叠 481

18.4.3 超越遗传算法 482

18.4.4 算法,超越本书 483

18.5 小结 483

附录A 伪代码快速指南 485

附录B 大O符号 494

附录C 核心数据结构 500

附录D 类似于优先队列的容器 511

附录E 递归 514

附录F 分类问题与随机算法的度量指标 520
展开全部

作者简介

Marcello La Rocca现为一家电商公司的高级软件工程师,曾参与开发Twitter、微软和苹果等公司的大型Web应用程序和数据基础设施,并发明了NeatSort这一自适应排序算法。他的主要研究领域为图、算法优化、机器学习和量子计算。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航