IT博客汇
首页
精华
技术
设计
资讯
扯淡
权利声明
登录
注册
Elasticsearch - 自定义分析器
xifeijian
发表于
2016-04-16 12:18:35
love
0
全文搜索引擎会用某种算法对要建索引的文档进行分析, 从文档中提取出若干Token(词元), 这些算法称为Tokenizer(分词器), 这些Token会被进一步处理, 比如转成小写等, 这些处理算法被称为Token Filter(词元处理器), 被处理后的结果被称为Term(词), 文档中包含了几个这样的Term被称为Frequency(词频)。 引擎会建立Term和原文档的Inverted In