模型创建后,您需要继续创建推理服务。创建推理服务时,需要与目标模型进行关联,并根据业务需求配置网络、资源、以及自定义参数等内容。
明确推理服务需要关联的模型,请提前获取目标模型的名称。
登录云搜索服务控制台。
在顶部导航栏,选择目标项目和地域。
在左侧导航栏选择 AI 搜索,查找并单击目标服务名称。
在左侧导航栏选择推理服务,然后单击创建推理服务。
在创建推理服务面板,配置推理服务相关参数,然后单击确定。
参数 | 说明 |
|---|---|
服务名称 | 自定义设置推理服务的名称。
|
购买方式 | 选择独占资源或按 Token。 |
选择模型 | 从下拉列表框选择推理服务需要关联的自定义模型/公共模型,支持根据模型名称关键字进行模糊搜索。最多可添加 3 个模型。 |
资源类型 | 当购买方式选择独占资源时可见。选择 CPU 或 GPU。 |
规格 | 当购买方式选择独占资源且资源类型选择 CPU 时可见。从下拉列表中选择 CPU 规格。 |
选择 GPU | 当购买方式选择独占资源且资源类型选择 GPU 时可见。从下拉列表中选择 GPU 规格,并指定节点数量。您可以单击添加来添加多个 GPU。 说明 AI 搜索现已支持异构推理,您可以添加不同类型的 GPU。 |
节点数量 | 当购买方式选择独占资源且资源类型选择 CPU 时可见。设置推理服务的节点数量。
|
模型限流 | 当购买方式选择按 Token 时可见。当前账号下访问所选模型的限流。 |
描述 | 自定义设置推理服务的描述信息。 |
接入点限流 | 开启后可设置单接入点访问限流。不开启则默认按照模型限流。
|
高级选项 | 支持为推理服务配置自定义参数。单击添加自定义参数,然后配置参数名称和取值。 |