You need to enable JavaScript to run this app.
边缘智能

边缘智能

复制全文
产品动态
新功能发布记录
复制全文
新功能发布记录

本文介绍了边缘大模型网关新功能特性的发布动态。

2025年11月

产品特性所属模块功能描述上线范围相关文档

图片缓存功能上线

网关访问密钥

为了提升多模态模型调用效率并降低成本,我们引入了图片缓存功能。

  • 当您启用缓存并设置图片相似度阈值后,对于包含图片的请求,网关会将其与缓存中的历史请求进行图片相似度比对。若相似度高于阈值且满足其他缓存条件,将直接返回缓存结果,有效减少 Token 消耗和等待时间。
  • 该功能特别适用于图片内容变化不大但调用频繁的场景。

全量发布

创建网关访问密钥

日志服务功能上线网关访问密钥通用密钥新增日志服务功能。您可为指定密钥开启日志采集,通过火山引擎日志服务(TLS)实时分析调用日志,以便进行监控、问题排查与安全审计。全量发布日志服务

2025年10月

产品特性所属模块功能描述上线范围相关文档

支持新的平台预置模型

大模型管理

边缘大模型网关新支持以下平台预置模型:

  • Doubao-Seed-1.6-vision

全量发布

支持的调用渠道

2025年9月

2025年8月

产品特性所属模块功能描述上线范围相关文档
后付费密钥上线网关访问密钥通用网关访问密钥现已推出“后付费”密钥,原先的通用密钥统一归类为“预付费”密钥。后付费密钥采用按量计费:
  • 计费仅适用于调用平台预置模型、智能体的场景。
  • 每个后续费密钥包含 500 万 Token 等免费资源额度,用于抵扣平台预置模型、智能体的调用消耗。
  • 免费资源额度用完后,将根据实际调用量按小时结算费用。
全量发布后付费密钥计费说明

支持新的平台预置智能体

智能体管理

边缘大模型网关新支持以下平台预置智能体:

  • 知识点视频生成

白名单

支持的调用渠道

Coze 智能体调用支持自定义用户标识智能体管理通过边缘大模型网关调用您的 Coze 智能体的情形下,您可以传入自定义用户标识。边缘大模型网关会将其转换为 Coze 对话接口中的 user_id 参数。全量发布调用第三方智能体
自部署语音识别模型允许指定输出方式和 VAD 配置大模型管理添加自部署语音识别模型时,您可指定输出方式(全量输出、增量输出)以及 VAD(Voice Activity Detection,语音活动检测)相关配置。全量发布调用自部署模型

2025年7月

产品特性所属模块功能描述上线范围相关文档

网关访问密钥支持火山引擎项目

网关访问密钥

“项目”是火山引擎提供的一种资源管理工具,可用于将不同云产品下的资源进行分组,以便在项目维度上进行独立的访问控制和数据分析。
边缘大模型网关中的“网关访问密钥”作为一种资源,可以通过火山引擎项目来管理。

全量发布

项目概述

端智能密钥支持调用自有三方模型或智能体网关访问密钥端智能密钥能够调用您在边缘大模型网关中配置的自有三方调用渠道,包括第三方模型、自部署模型、第三方智能体。全量发布端智能密钥

2025年6月

产品特性所属模块功能描述上线范围相关文档

支持新的平台预置模型

大模型管理

边缘大模型网关新支持以下平台预置模型:

  • Doubao-Seed-1.6
  • Doubao-Seed-1.6-thinking
  • Doubao-Seed-1.6-flash

全量发布

支持的调用渠道

支持接入新的第三方模型

大模型管理

边缘大模型网关新支持接入以下第三方模型:

  • (字节跳动火山方舟)Doubao-Seed-1.6
  • (字节跳动火山方舟)Doubao-Seed-1.6-thinking
  • (字节跳动火山方舟)Doubao-Seed-1.6-flash

全量发布

支持的调用渠道

预置模型备案信息公示

大模型管理

平台预置模型支持查询模型备案信息。查询方式:

  • 方式一:登录边缘大模型网关控制台,查看平台预置模型。在不同提供商支持的模型列表面板,您可以单击 模型备案信息,查看不同系列模型的备案信息。
  • 方式二:访问官方文档 - 支持的调用渠道,在“预置模型”列表下方查看不同系列模型的备案信息。

全量发布

支持的调用渠道

自部署语音合成模型允许指定输出音频规格大模型管理添加自部署语音合成模型时,您可指定输出音频的规格,包括采样率、位深、通道数。全量发布调用自部署模型

2025年5月

产品特性所属模块功能描述上线范围相关文档

支持新的平台预置模型

大模型管理

边缘大模型网关新支持以下平台预置模型:

  • Qwen2.5-200M-CLS-smart-turn(向量化)

    说明

    要使用该模型,请提交工单

白名单

支持的调用渠道

字节跳动火山方舟调用渠道支持 Access Token 鉴权方式大模型管理针对字节跳动火山方舟平台的语音识别、语音合成模型,在创建调用渠道时,您可以选择使用 Access Token 鉴权方式。全量发布获取第三方模型调用密钥

2025年4月

产品特性所属模块功能描述上线范围相关文档

支持新的平台预置模型

大模型管理

边缘大模型网关新支持以下平台预置模型:

  • Doubao-1.5-thinking-pro
  • Doubao-1.5-thinking-pro-vision
  • Doubao-1.5-vision-lite
  • Doubao-1.5-vision-pro
  • Doubao-1.5-UI-TARS

全量发布

支持的调用渠道

支持接入新的第三方模型

大模型管理

边缘大模型网关新支持接入以下第三方模型:

  • (字节跳动火山方舟)Doubao-1.5-thinking-pro
  • (字节跳动火山方舟)Doubao-1.5-thinking-pro-vision
  • (字节跳动火山方舟)Doubao-1.5-vision-lite
  • (字节跳动火山方舟)Doubao-1.5-vision-pro
  • (字节跳动火山方舟)Doubao-1.5-UI-TARS

全量发布

支持的调用渠道

支持调用自部署模型大模型管理您可以通过边缘大模型网关调用您自己私有化部署的模型。全量发布调用自部署模型

支持 HTTP 和 WebSocket 限流

网关访问密钥

在网关访问密钥高级配置中,您可以针对平台预置模型和智能体设置请求速率限制。

  • 对于使用 HTTP 协议通信的平台预置模型和智能体(如文字识别智能体),可以设置 HTTP 协议每分钟最大请求数。
  • 对于使用 WebSocket 协议通信的平台预置模型和智能体(如语音对话智能体),可以设置 WebSocket 协议最大同时连接数。

全量发布

创建网关访问密钥

支持重置网关访问密钥网关访问密钥如果网关访问密钥 API key 不慎泄露,您需要立即重置该密钥。重置网关访问密钥将使当前 API key 失效并重新生成新的 API key。全量发布重置网关访问密钥
支持模型/智能体维度的用量统计网关访问密钥您可以在网关访问密钥的用量统计中查看调用特定模型或智能体消耗的资源量。全量发布用量统计

2025年3月

产品特性所属模块功能描述上线范围相关文档
支持新的平台预置智能体智能体管理边缘大模型网关新支持以下平台预置智能体:组装质检智能体。全量发布组装质检智能体

支持端智能密钥

网关访问密钥

端智能密钥是网关访问密钥的一种类型,允许您通过物联网设备调用大模型网关 API,在设备端实现 AI 服务。
当您在边缘智能 - 物联网平台成功创建一个端智能实例,系统会自动在边缘大模型网关控制台创建一个与您的实例绑定的端智能密钥。在边缘大模型网关控制台,您可以查看端智能密钥的基本信息、资源用量统计,以及编辑调用策略。

全量发布

端智能密钥

2025年2月

产品特性所属模块功能描述上线范围相关文档

支持新的平台预置智能体

智能体管理

边缘大模型网关新支持以下平台预置智能体:工业质检智能体、目标检测智能体。

全量发布

工业质检智能体
目标检测智能体

支持以 OAuth 访问令牌方式进行扣子智能体访问授权智能体管理在边缘大模型网关创建字节跳动扣子智能体调用渠道时,您可以选择使用 OAuth 访问令牌授权(边缘大模型网关)访问您的智能体。相比于使用个人访问令牌进行授权,OAuth 授权方式安全性更高。全量发布调用第三方智能体

支持新的平台预置模型

大模型管理

边缘大模型网关新支持以下平台预置模型:

  • Doubao-1.5-pro-32k
  • Doubao-1.5-pro-256k
  • Doubao-1.5-vision-pro-32k
  • Doubao-1.5-lite-32k
  • DeepSeek-V3
  • DeepSeek-R1
  • DeepSeek-R1-Distill-Qwen-7B
  • DeepSeek-R1-Distill-Qwen-32B

全量发布

支持的调用渠道

支持接入新的第三方模型

大模型管理

边缘大模型网关新支持接入以下第三方模型:

  • (字节跳动火山方舟)DeepSeek-V3
  • (字节跳动火山方舟)DeepSeek-R1
  • (字节跳动火山方舟)DeepSeek-R1-Distill-Qwen-7B
  • (字节跳动火山方舟)DeepSeek-R1-Distill-Qwen-32B
  • (DeepSeek开放平台)DeepSeek-V3
  • (DeepSeek开放平台)DeepSeek-R1
  • (阿里云DashScope模型服务灵积)DeepSeek-R1
  • (阿里云DashScope模型服务灵积)DeepSeek-V3
  • (阿里云DashScope模型服务灵积)DeepSeek-R1-Distill-Qwen-1.5B
  • (阿里云DashScope模型服务灵积)DeepSeek-R1-Distill-Qwen-7B
  • (阿里云DashScope模型服务灵积)DeepSeek-R1-Distill-Llama-8B
  • (阿里云DashScope模型服务灵积)DeepSeek-R1-Distill-Qwen-14B
  • (阿里云DashScope模型服务灵积)DeepSeek-R1-Distill-Qwen-32B
  • (阿里云DashScope模型服务灵积)DeepSeek-R1-Distill-Llama-70B
  • (硅基流动)DeepSeek-R1
  • (硅基流动)DeepSeek-V3
  • (硅基流动)DeepSeek-R1-Distill-Qwen-32B
  • (硅基流动)DeepSeek-R1-Distill-Qwen-14B
  • (硅基流动)DeepSeek-R1-Distill-Llama-8B
  • (硅基流动)DeepSeek-R1-Distill-Qwen-7B
  • (硅基流动)DeepSeek-R1-Distill-Qwen-1.5B
  • (硅基流动)Janus-Pro-7B
  • (腾讯云大模型知识引擎LKE)DeepSeek-V3
  • (腾讯云大模型知识引擎LKE)DeepSeek-R1
  • (百度千帆ModelBuilder)DeepSeek-V3
  • (百度千帆ModelBuilder)DeepSeek-R1
  • (百度千帆ModelBuilder)DeepSeek-R1-Distill-Qwen-32B
  • (百度千帆ModelBuilder)DeepSeek-R1-Distill-Qwen-14B
  • (百度千帆ModelBuilder)DeepSeek-R1-Distill-Qwen-7B
  • (百度千帆ModelBuilder)DeepSeek-R1-Distill-Qwen-1.5B
  • (百度千帆ModelBuilder)DeepSeek-R1-Distill-Llama-8B
  • (百度千帆ModelBuilder)DeepSeek-R1-Distill-Llama-70B

全量发布

支持的调用渠道

2025年1月

产品特性所属模块功能描述上线范围相关文档

支持新的平台预置模型

大模型管理

边缘大模型网关新支持以下平台预置模型:

  • Doubao-同声传译

全量发布

支持的调用渠道

支持订阅模型下架消息大模型管理边缘大模型网关借助火山引擎消息中心的 产品到期通知 渠道,向订阅者发送模型下架通知。推荐您订阅模型下架消息,以便及时掌握模型动态。全量发布订阅模型下架消息

预置语音对话智能体能力升级

智能体管理

语音对话智能体支持以下新特性:

  • 与您在 Coze 平台上搭建的智能体组合使用(后端为Coze)
  • 对话可打断
  • 未收到语音时返回语音应答

全量发布

语音对话智能体

预置文字识别智能体支持调用预览智能体管理文字识别智能体提供了调用预览功能。通过调用预览,您可以在可视化界面中与智能体交互,如上传一张图片,要求智能体按照指示识别其中的文字。全量发布语音对话智能体

2024年

2024年12月

产品特性所属模块功能描述上线范围相关文档

支持新的平台预置模型

大模型管理

边缘大模型网关新支持以下平台预置模型:

  • Doubao-语音合成
  • Doubao-文生图模型-智能绘图-通用2.0L
  • Doubao-文生图模型-智能绘图-通用2.0S
  • Doubao-vision-pro-32k
  • Doubao-语音识别
  • Doubao-vision-lite-32k
  • Doubao-Embedding
  • Doubao-Embedding-Large

全量发布

支持的调用渠道

支持模型调用超时设置网关访问密钥您可以为网关访问密钥自定义请求超时时间。一次模型调用在超时时间内无响应时,即视为失败。全量发布创建网关访问密钥
用量统计页面升级网关访问密钥网关访问密钥的用量统计中能够查询以下资源用量数据:Token、语音时长、调用次数、字符数。全量发布用量统计

支持使用平台预置智能体

智能体管理

边缘大模型网关新支持了以下平台预置智能体:语音对话智能体、文字识别智能体。

全量发布

2024年11月

产品特性所属模块功能描述上线范围相关文档
支持调用第三方智能体智能体管理边缘大模型网关能够调用字节跳动扣子平台的智能体。全量发布调用第三方智能体
接入字节跳动火山方舟 - 豆包系列大模型大模型管理平台预置模型中新增多款豆包系列大模型,覆盖对话、函数调用等类型。全量发布支持的调用渠道

2024年10月

2024年9月

产品特性所属模块功能描述上线范围相关文档
支持数据监控与告警边缘大模型网关允许在火山引擎云监控中查看您的网关访问密钥数据报表(支持免费额度用量等指标),并可针对监控指标创建告警策略,主动感知数据变化及异常。全量发布数据监控
支持的第三方模型中增加:腾讯-混元、百度-文心一言模型模型调用密钥允许添加您在腾讯-混元平台、百度-文心一言平台获得的模型调用密钥,以便通过边缘大模型网关调用相应平台提供的模型。全量发布支持的调用渠道
支持调用认证功能网关访问密钥允许您在向边缘大模型网关发送的 API 请求中包含经加密的客户端身份认证信息,以及开启高级数据监控功能(在客户端维度查询监控数据)。该功能加白开放。只有白名单中用户可以使用。白名单查看代码

2024年8月

产品特性所属模块功能描述上线范围相关文档

支持缓存配置

边缘大模型网关

针对网关访问密钥,您可以设置是否开启缓存功能。若开启缓存功能,边缘大模型网关会缓存来自模型提供商的响应。
在收到相同请求时,边缘大模型网关将会基于缓存进行响应,而无需重新发起模型调用。缓存机制使您的用户更快获得响应,并节省模型使用量。

全量发布

创建网关访问密钥

支持第三方模型调用

边缘大模型网关

边缘大模型网关允许您添加来自第三方模型提供商的密钥(API Key),以便通过边缘大模型网关来调用第三方模型。需要注意的是:

  • 调用第三方模型将会消耗您在第三方模型提供商平台的额度,不会消耗边缘大模型网关向您提供的免费调用额度(免费调用额度仅限于调用边缘大模型网关的预置模型)。
  • 目前支持的第三方模型提供商及模型有限。

全量发布

支持的调用渠道

2024年7月

产品特性所属模块功能描述上线范围相关文档
支持调用策略配置边缘大模型网关针对网关访问密钥,您可以设置模型调用的策略,包含自动重试次数、模型调用顺序。全量发布创建网关访问密钥

产品上线

边缘大模型网关

边缘大模型网关面向所有用户开放免费测试。使用完成实名认证的火山引擎账号,即可创建网关访问密钥,获得预置模型的免费调用额度。

全量发布

最近更新时间:2025.11.07 11:48:05
这个页面对您有帮助吗?
有用
有用
无用
无用