Elasticsearch 倒排索引

Inverted Index 原理交互演示
预设数据
文档输入(每行一篇文档)
搜索查询
分词器 (Analyzer)

Analyzer 三阶段

Character Filter 字符过滤 (去HTML等)
Tokenizer 分词器 (切分 Token)
Token Filter 词元过滤 (小写/停用词/同义词)

倒排索引结构

Term Index FST 快速定位 Term
Term Dictionary 排序的词项表
Posting List 文档ID + TF + Position

倒排索引
分词管道
搜索过程
正排 vs 倒排
输入文档和搜索词,实时观察倒排索引的建立与搜索过程。