Elasticsearch 文本分析
文本分析是将非结构化文本转换为针对搜索优化的结构化格式的过程。
文本分析简介
文本分析使 Elasticsearch 能够执行全文搜索,其中搜索返回所有相关结果,而不仅仅是完全匹配。
文本分析可以分为两个方面:
- Tokenization(分词化) - 分析通过分词化使全文搜索成为可能:将文本分解成更小的块,称为分词。在大多数情况下,这些标记是单独的 term(词项)。
- Normalizeation(标准化) - 经过分词后的文本只能进行词项匹配,但是无法进行同义词匹配。为解决这个问题,可以将文本进行标准化处理。例如:将
foxes
标准化为fox
。
...大约 9 分钟