You need to enable JavaScript to run this app.
导航
创建自定义模型
最近更新时间:2024.07.17 10:26:44首次发布时间:2024.05.15 11:57:47

在 ML 服务中,系统预置了公共模型,同时也支持创建自定义模型。本文介绍创建自定义模型的操作步骤。

前提条件

  • 已启用 ML 服务且为运行状态。如何启用,请参见启用 ML 服务
  • 创建自定义模型时,需要准备好模型文件。您可以提前将模型文件存放到 TOS Bucket,也可以在创建自定义模型时直接上传本地的模型文件。

    注意

    从 TOS Bucket 中读取模型文件,需要当前账号拥有 Bucket 的**权限,即至少拥有GetObject权限;上传本地模型文件会被存储到指定的 TOS Bucket,需要当前账号拥有 Bucket 的**权限,即至少拥有PutObject权限。
    如何为 IAM 用户授予指定 Bucket 的读写权限,请参见授予 IAM 用户指定桶上传和下载对象的权限

创建模型

  1. 登录云搜索服务控制台

  2. 在顶部导航栏,选择目标项目和地域。

  3. 在左侧导航栏选择 ML 服务,查找并单击目标服务名称。

  4. 在左侧导航栏选择模型管理,然后选择我的模型页签,再单击创建模型

  5. 创建模型对话框,设置模型相关参数,然后单击确定
    图片

    参数

    说明

    模型名称

    自定义设置模型名称。

    • 首字符仅支持字母或下划线(_)。
    • 可包含字母、数字、特殊字符仅支持英文句号(.)、下划线(_)、短横线(-)、反斜杠(/),长度为 1~128 个字符。
    • 最多只能包含一个反斜杠(/)字符。

    模型类型

    请根据实际情况选择模型类型。

    • Text Embedding:文本嵌入,将文本转化为计算机可以理解的数字向量的方法,这些向量能捕捉文本的语义信息。
    • Rerank:重排序,是一种排列搜索结果的技术,依据相关性进行排列,将最相关的结果放在最前面以便用户更快找到他们需要的信息。
    • RAG:Retrieval-Augmented Generation(RAG)是一种深度学习模型,它结合了提取系统和生成模型的功能,以在回答查询或生成文本时融合并利用大量外部信息源。

    网络配置

    是否开通私网访问。
    开通后,允许与 OpenSearch 实例在相同 VPC 环境内的客户端通过模型调用地址访问模型。

    对象存储桶

    从下拉列表中选择一个用于存放模型文件的对象存储桶。
    如果没有可用的 TOS 存储桶,请单击创建存储桶,前往对象存储控制台进行创建。

    模型文件

    选择模型文件的配置方式。

    • 对象存储文件:从选择的对象存储桶中选择模型文件,此时还需要设置对象存储文件夹,即从该文件夹中读取已经存在的模型文件。
    • 上传本地文件:从本地选择模型文件。

    注意

    • 如果当前账号没有对应 Bucket 的****权限(至少拥有GetObject权限),则无法获取到 Bucket 中的文件列表。
    • 如果当前账号没有对应 Bucket 的****权限(至少拥有PutObject权限),则无法将模型文件存放到对象存储桶。

    需要确保当前账号拥有 TOS Bucket 的读写权限。如何为 IAM 用户授予指定 Bucket 的读写权限,请参见授予 IAM 用户指定桶上传和下载对象的权限

    描述

    设置模型的描述语句。