最近更新时间:2023.11.10 10:33:48
首次发布时间:2023.07.21 11:36:52
IK 分词插件是 Elasticsearch 的默认插件,不能卸载。您可以在本地词典文件中配置主分词和停用词,通过上传词典文件的方式配置 IK 分词。
您在配置 IK 分词文件、冷热更新文件、使用 IK 分词能力前,请先了解以下基础信息:
在实例列表 v2 页面的 ES 实例,系统默认提供一个主分词词典文件(SYSTEM_MAIN.dic)和一个停用词词典文件(SYSTEM_STOPWORD.dic),支持下载到本地查看词典文件内容。
说明
系统默认提供的主分词和停用词词典文件不支持热启用。如果需要更新默认词典库,您可以选择上传同名文件,然后直接启动实例。这样便能更新默认词典库内容。
您在上传 IK 分词词典文件时,应注意以下内容:
utf-8
编码的 .dic
文件。-_.
)组成。说明
对于已经配置了 IK 分词的索引,在 IK 词典冷更新或热更新操作完成后将只对新数据(包含新增数据和更新后的数据)生效。如果您希望对全部数据生效,需要重建索引。
每个节点获取词典文件的时间可能不同,请耐心等待词典生效,大概两分钟后再使用更新之后的词典。
首次上传的词典文件需要冷启用(重启实例)后才可生效。冷启用词典文件将触发实例重启,请在业务低峰期执行。
当您需要更新已启用的词典文件内容时,您可以下载已启用的词典文件,在本地更新文件内容后,然后进行热启用操作。热启用词典文件不会触发实例重启,而是在运行过程中加载分词词库。
说明
系统默认提供的主分词和停用词词典文件不支持热启用。如果需要更新默认词典库,您可以选择上传同名文件,然后直接启动实例。这样便能更新默认词典库内容。
注意
删除文件将触发实例需重启,建议您在业务低峰期执行该操作。删除词典文件仅对删除后新建的索引生效。