先从最基础的原子查询讲起,介绍了文档的匹配与评分流程,随后介绍了复合查询中的合取与析取操作,文中还结合搜索流程讲到了两个重要的数据结构:SkipList与PriorityQueue。
阅读全文HBase与时空索引技术
本文先探讨HBase存放时空数据所遭遇的各种挑战,而后分析了各种常见的时空索引技术,如R-Tree, Quad-Tree, K-D Tree, Spatial Filling Curve,以及与HBase现有架构结合的可能性。
阅读全文Lucene搜索流程(上)
前面的一系列文章,都是围绕着Lucene的索引文件格式与索引的流程展开的,涉及到不少复杂而巧妙的设计,而这一切工作,都是为文档的快速搜索而服务的。从本文开始,我们开始探讨Lucene的搜索流程。
阅读全文Lucene 8.0关于DocValues的改进
在上一篇文章《Lucene列式存储格式DocValues详解》中详细介绍了DocValues的设计,而且也简单介绍了IndexedDISI。此文将展开IndexedDISI更多的细节,包括Lucene 8.0关于IndexedDISI所做的改进。
阅读全文如何合理的设计HBase RowKey?
今天分享的内容主要是HBase RowKey与索引设计相关的一些技巧、原则和相关案例。内容包含四个部分:HBase基础原理速览;探讨合理的需求调研方法;RowKey与索引设计的常见技巧、原则;关于OpenTSDB/JanusGraph/GeoMesa典型案例的设计分析。
阅读全文Lucene列式存储格式DocValues详解
Lucene原理系列第5篇,详细讲解Lucene的正向索引数据格式DocValues,它是一种列式存储的结构
阅读全文Lucene倒排索引原理探秘(4)
Lucene倒排索引原理探秘系列第4篇,详细探讨Lucene为了加速索引过程所采用的数据结构与技术手段
阅读全文Neo4j 3.5发布,在索引方面大幅增强
本文介绍Neo4j 3.5的内置索引以及基于Lucene的全文索引能力。
阅读全文HBase基础框架级特性Procedure解读
本文先从Procedure的设计初衷着手,而后以Create Table为例介绍了一个Procedure的生命周期,以及Procedure框架的几个关键角色/模块。最后选择了整个框架中比较复杂的几个模块展开了技术实现细节。
阅读全文Lucene倒排索引实现原理探秘(3)
这篇文章讲解了Lucene为一个Document构建索引的处理流程,重点讲解了两种倒排索引结构,Posting与TermVectors,希望能够结合前面的两篇文章来加深大家关于Lucene倒排索引结构的理解。
阅读全文