You need to enable JavaScript to run this app.
导航
创建网关访问密钥
最近更新时间:2025.11.06 16:16:41首次发布时间:2024.08.07 11:04:00
复制全文
我的收藏
有用
有用
无用
无用

本文介绍如何创建通用网关访问密钥。

背景信息

通用网关访问密钥(简称“通用密钥”)包括后付费密钥和预付费密钥两种类型。

  • 后付费密钥:采用按量计费模式,根据的实际模型调用量扣费。
  • 预付费密钥:采用资源订阅模式,需要您提前购买资源额度,实际调用时从资源额度中抵扣用量。

两种类型的通用密钥都提供免费资源额度,具体额度有差异。更多信息,请参见使用限制

开始操作前,请确认要创建的通用密钥类型。

前提条件

您已经注册火山引擎账号并完成实名认证。更多信息,请参见实名认证

操作步骤

创建和配置后付费密钥

  1. 登录边缘大模型网关控制台

  2. 在左侧导航栏,选择 网关访问密钥 > 通用密钥

  3. 后付费密钥 标签页,单击 创建通用密钥

  4. 边缘大模型网关后付费密钥 页面,完成以下操作:
    alt

    1. (可选)为密钥绑定自定义 标签
      标签使用“键-值”对(Key-Value)标识资源,方便您在查询资源时进行过滤。
    2. 为密钥指定 所属项目
      “项目”是火山引擎的资源管理工具,用于分组管理不同云产品下的资源,以便进行访问控制和账单分类。更多信息,请参见项目概述
      在边缘大模型网关中,网关访问密钥是可通过项目管理的资源。每个密钥都必须归属于一个项目。您可以选择 default (默认项目) 或其他自定义项目。
    3. 了解不同模型的定价信息,阅读并勾选协议,然后单击 立即购买
    4. 确认订单信息,然后单击 提交

    订单提交成功后,您可以在通用密钥列表确认购买结果。如果列表中出现名为“边缘大模型网关后付费密钥<YYYYMMDD>”的密钥,则表示密钥创建成功。

  5. 完善密钥配置。

    1. 在密钥列表找到新购买的后付费密钥,单击其名称。
    2. 在弹出的对话框中,单击 立即编辑
    3. 完成 编辑网关访问密钥 配置向导。
      您可以参考创建和配置预付费密钥中的配置向导说明进行配置。

创建和配置预付费密钥

  1. 登录边缘大模型网关控制台
  2. 在左侧导航栏,选择 网关访问密钥 > 通用密钥
  3. 单击 预付费密钥 页签,然后单击 创建通用密钥
  4. 完成 创建网关访问密钥 配置向导。

配置向导说明

  1. 创建网关访问密钥
    完成以下参数配置,然后单击 下一步:调用配置
    alt

    区域配置项说明
    基本信息名称为网关访问密钥设置一个名称。支持中英文、数字、下划线(_)和连字符(-),长度限制为 32 个字符。
    所属项目选择 default (默认项目) 或其他自定义项目。
    “项目”是火山引擎的资源管理工具,用于分组管理不同云产品下的资源,以便进行访问控制和账单分类。更多信息,请参见项目概述
    在边缘大模型网关中,网关访问密钥是可通过项目管理的资源。每个密钥都必须归属于一个项目。
    标签为网关访问密钥绑定自定义标签。标签使用“键-值”对(Key-Value)标识资源,方便您在查询资源时进行过滤。
    描述为网关访问密钥添加描述,长度限制为 128 个字符。

    模型选择

    --

    添加与该密钥绑定的模型或智能体。只有绑定的模型或智能体才能通过该密钥调用。可绑定的模型或智能体来源如下:

    说明

    • 请选择与您使用场景匹配的模型。不同类型的模型处理能力有差异。例如,多模态模型(Multimodal)可以处理包含图片的请求,而对话模型(Chat)通常无法处理。
    • 推荐使用类型筛选器来获取同类型模型/智能体列表。例如,选择类型为 Chat,可以获取具有对话能力的模型/智能体列表;选择类型为 ChatReasoning,可以获取同时具有对话和推理能力的模型/智能体列表。

  2. 调用配置
    完成以下参数配置,然后单击 确定
    alt

    区域配置项说明

    调用策略

    调用顺序

    手动调整上一步选择的模型的顺序。前一个模型调用失败后,边缘大模型网关将依次调用后续模型,直到成功调用一个模型。如果所有模型都调用失败,则返回错误响应。

    说明

    请合理设置模型顺序。当一个多模态模型后面是一个对话模型时,可能导致故障切换机制不起作用。

    重试次数

    设置对一个模型进行调用的最大重试次数,取值范围为 0(不重试)~3。当一个模型调用失败后,边缘大模型网关将重新尝试调用此模型,直到重试次数耗尽。

    注意

    请留意在不同模型提供商处的使用量。当发生故障切换、重试时,一个请求可能实际触发多次模型调用,导致使用量有所增加。

    高级配置

    缓存启用状态

    启用缓存后,边缘大模型网关将缓存模型的调用结果。当收到相似请求时,网关会直接从缓存中返回结果,以缩短响应时间、降低调用成本。
    缓存限制如下:

    • 对于同一个密钥和模型的组合,最多缓存 20 轮对话。
    • 每轮对话的缓存大小不超过 1 MB。如果超过 1 MB,则该轮对话不会被缓存。
    缓存时长仅在 缓存启用状态 开启时,该参数才会出现。设置缓存的保留时长。一旦超过指定时长,缓存将被清除。可选项:1分钟5分钟30分钟1小时1天1周

    图片缓存阈值

    仅在 缓存启用状态 开启时,该参数才会出现。为包含图片的请求设置图片相似度阈值,用于判断是否命中缓存。取值范围为 0~1。
    当请求满足以下条件时,将触发图片相似度匹配:

    • 请求体仅包含单轮输入,且仅携带一张图片。
    • 单轮输入中的 system prompt(如有)和 user prompt 与历史请求完全相同。

    满足条件后,网关会将当前请求中的图片与缓存中已有请求的图片进行比较。如果计算出的相似度大于您配置的阈值,则判定为命中缓存,并直接返回历史缓存结果,从而降低 Token 消耗。

    说明

    该阈值的配置依赖于具体的业务场景。阈值越小,图片相似度的要求越低,缓存命中率也越高。建议您根据自身业务场景进行测试并确定最佳阈值。

    请求超时定义设置单次模型调用的超时时长,单位为毫秒。模型请求发出后,若在超时时长内未收到响应,则判定该请求失败。
    • 如果选择的模型或智能体支持 Reasoning(深度思考),那么请求超时默认值为 300,000 毫秒(5分钟),最大值为 1,800,000 毫秒(30分钟)。
    • 否则请求超时默认值为 60,000 毫秒(1分钟),最大值为 300,000 毫秒(5分钟)。

    请求速率限制

    针对平台预置模型和智能体,设置单模型或智能体的请求速率上限。

    • 对于使用 HTTP 协议的平台预置模型和智能体(如文字识别智能体),可设置每分钟最大请求数(RPM,Requests Per Minute)。默认值:10。取值范围:1~20。
    • 对于使用 WebSocket 协议的平台预置模型和智能体(如语音对话智能体),可设置最大同时连接数。默认值:5。取值范围:1~10。

    说明

    如果默认最大值无法满足业务需求,您可以在网关访问密钥创建成功后,前往 配额中心 申请提升配额。相关操作,请参见申请提升请求速率上限

后续操作

网关访问密钥创建和配置成功后,您可参考使用网关访问密钥进行使用。