扩展词、停用词配置
IK支持自定义扩展词典
和停用词典
扩展词典
就是有些词并不是关键词,但是也希望被ES用来作为检索的关键词,可以将这些词加入扩展词典。
停用词典
就是有些词是关键词,但是出于业务场景不想使用这些关键词被检索到,可以将这些词放入停用词典。
定义扩展词典和停用词典可以修改IK分词器中config
目录中IKAnalyzer.cfg.xml
这个文件。
- 1. 修改vim IKAnalyzer.cfg.xml
-
- "1.0" encoding="UTF-8"?>
- properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
- <properties>
- <comment>IK Analyzer 扩展配置comment>
-
- <entry key="ext_dict">ext_dict.dicentry>
-
- <entry key="ext_stopwords">ext_stopword.dicentry>
- properties>
-
- 2. 在ik分词器目录下config目录中创建ext_dict.dic文件 编码一定要为UTF-8才能生效
- vim ext_dict.dic 加入扩展词即可
-
- 3. 在ik分词器目录下config目录中创建ext_stopword.dic文件
- vim ext_stopword.dic 加入停用词即可
-
- 4.重启es生效
注意:
词典的编码必须为UTF-8,否则无法生效!