You need to enable JavaScript to run this app.
导航

上传 IK 分词词典文件

最近更新时间2023.11.10 10:33:48

首次发布时间2023.07.21 11:36:52

IK 分词插件是 Elasticsearch 的默认插件,不能卸载。您可以在本地词典文件中配置主分词和停用词,通过上传词典文件的方式配置 IK 分词。

背景信息

您在配置 IK 分词文件、冷热更新文件、使用 IK 分词能力前,请先了解以下基础信息:

词典文件类型

  • 主分词词典:如果创建索引时指定了主分词词典,写入的数据如果包含了主分词词典中的词,那么会创建索引,且能通过关键词搜索该索引。
  • 停用词词典:如果创建索引时指定了停用词词典,写入的数据如果包含了停用词词典的词,该词会被过滤。

图片
实例列表 v2 页面的 ES 实例,系统默认提供一个主分词词典文件(SYSTEM_MAIN.dic)和一个停用词词典文件(SYSTEM_STOPWORD.dic),支持下载到本地查看词典文件内容。

说明

系统默认提供的主分词和停用词词典文件不支持热启用。如果需要更新默认词典库,您可以选择上传同名文件,然后直接启动实例。这样便能更新默认词典库内容。

词典文件限制

您在上传 IK 分词词典文件时,应注意以下内容:

  • 仅支持上传 utf-8 编码的 .dic 文件。
  • 一行只能写一个词。
  • 最多上传 10 个文件,且单个文件最大为 5MiB。
  • 冷启用文件不支持上传同名文件,热启用文件必须上传同名文件。
  • 文件名称只能由大小写字母、数字和 3 个特殊符号(-_.)组成。

词典文件生效说明

  • 冷启用:首次上传的词典文件,需要冷启用(重启实例)后才可生效。新上传文件仅对新建的索引生效,旧的索引需要重建索引才能生效。
  • 热启用:当您需要更新已启用的词典文件内容时,您可以下载已启用的词典文件,在本地更新文件内容后,然后进行热启用操作。热启用词典文件不会触发实例重启,而是在运行过程中加载分词词库,一般在几分钟内生效。

说明

对于已经配置了 IK 分词的索引,在 IK 词典冷更新或热更新操作完成后将只对新数据(包含新增数据和更新后的数据)生效。如果您希望对全部数据生效,需要重建索引。
每个节点获取词典文件的时间可能不同,请耐心等待词典生效,大概两分钟后再使用更新之后的词典。

上传词典文件

  1. 登录云搜索服务控制台
  2. 在顶部导航栏,选择目标实例所在的地域。
  3. 实例列表 v2页面,单击目标实例名称,然后单击插件管理页签。
  4. 插件管理页签,单击 analysis-ik 插件对应操作栏的分词词库
    图片
  5. 分词词库面板,单击上传文件
    图片
  6. 上传冷启用文件对话框,选择文件类型及需要上传的文件,上传完成后,单击关闭
    图片
  7. 在弹出的对话框中,选择文件是否立即生效。
    图片
    • 需要立即生效:单击确定,实例会自动重启,即自动开始冷启用词典文件并生效。
    • 不需要立即生效:单击取消,文件会保存在文件列表中,不会生效,实例也不会重启。当您需要启用该文件时,请参见冷启用词典文件

冷启用词典文件

首次上传的词典文件需要冷启用(重启实例)后才可生效。冷启用词典文件将触发实例重启,请在业务低峰期执行。

  1. 在实例的分词词典库,选择首次上传的词典文件,然后单击冷启用
    图片
  2. 冷启用文件对话框,单击确定

热启用词典文件

当您需要更新已启用的词典文件内容时,您可以下载已启用的词典文件,在本地更新文件内容后,然后进行热启用操作。热启用词典文件不会触发实例重启,而是在运行过程中加载分词词库。

说明

系统默认提供的主分词和停用词词典文件不支持热启用。如果需要更新默认词典库,您可以选择上传同名文件,然后直接启动实例。这样便能更新默认词典库内容。

  1. 在实例的分词词库,选择需要更新的词典文件,然后单击热启用
    图片
  2. 上传热启用文件对话框,上传已更新的同名文件,然后单击关闭
    图片

其他操作

  • 下载文件:在分词词库面板,单击目标文件操作列的下载,即可将文件下载至本地。
  • 删除文件:在分词词库面板,单击目标文件操作列的删除,然后进行二次确认,即可删除该文件。

    注意

    删除文件将触发实例需重启,建议您在业务低峰期执行该操作。删除词典文件仅对删除后新建的索引生效。