You need to enable JavaScript to run this app.
文档中心
全站加速

全站加速

复制全文
下载 pdf
AI 场景加速
AI 场景加速概述
复制全文
下载 pdf
AI 场景加速概述

注意

为更好地优化 AI 场景加速体验,全站加速于2026年03月26日对不同 AI 场景的服务和计费方式进行统一。

火山引擎全站加速联合豆包大模型、扣子推出 AI 场景加速解决方案,面向 AI 业务的两类典型跨区域访问诉求提供加速能力:一类是加速用户或应用对 AI 服务源站 API 的访问,另一类是加速终端用户对存放在对象存储桶中的大模型生成内容的下载。

其中,AI 服务访问类场景覆盖豆包全线大模型、扣子平台,以及语音、视觉等常用 AI 服务;生成内容下载类场景覆盖 Seedream、Seedance 等模型生成并存放在对象存储桶中的图片、视频内容的下载访问。针对这两类场景,全站加速均提供预置的场景化配置选项,帮助您更快完成接入。

解决方案概述

该解决方案提供以下能力:

  • 针对 大模型 & AI 应用加速 场景,提供预置源站类型,支持快速加速常用 AI 服务 API 的访问。
  • 针对 大模型生成内容下载 场景,提供预置的火山引擎对象存储产物桶,并兼容多家第三方对象存储来源。
  • 依托全站加速的全球链路,降低跨区域访问时的建连耗时、传输时延和下载等待时间。
  • 支持 SSE(Server-Sent Events)和 WebSocket 等协议,满足 AI 服务流式响应等场景的传输需求。

场景分类与支持范围

大模型 & AI 应用加速

适用于加速对 AI 服务源站的访问,典型场景包括:

alt

源站类型说明源站域名
大语言模型火山方舟大模型服务平台提供的大模型服务 API。ark.cn-beijing.volces.com
语音大模型火山引擎语音技术提供的智能语音服务 API。openspeech.bytedance.com
其他模型火山方舟大模型服务平台提供的同声传译 APIark-beta.cn-beijing.volces.com
智能视觉图像生成大模型(包括即梦 AI)服务的 API。visual.volcengineapi.com
AI 应用服务平台-扣子火山引擎扣子(coze.cn)提供的 AI 应用服务 API。api.coze.cn
扣子语音对话/识别火山引擎扣子提供的语音对话与语音识别 WebSocket 服务。ws.coze.cn
Serverless AI 应用火山引擎函数服务上托管的函数。全站加速直接通过最优路径与函数服务的区域接入点对接,不涉及域名。

大模型生成内容下载

适用于加速终端用户对存放在对象存储桶中的大模型生成图片、视频等内容的下载访问,典型场景包括:

对象存储来源说明接入方式对象存储域名 / 地址要求
火山引擎对象存储-seedream对 Seedream 生成的图片内容加速。预置源站,直接选择ark-content-generation-v2-cn-beijing.tos-cn-beijing.volces.com
火山引擎对象存储-seedance对 Seedance 生成的视频内容加速。预置源站,直接选择ark-content-generation-cn-beijing.tos-cn-beijing.volces.com
火山引擎对象存储-seedream_seedance同时承载 Seedream 和 Seedance 产物的对象存储桶。预置源站,直接选择ark-acg-cn-beijing.tos-cn-beijing.volces.com
第三方对象存储支持阿里云、腾讯云、AWS、华为云、Cloudflare 等来源。手动填写源站地址需填写对应对象存储桶访问域名

alt

典型适用场景

  • 大语言模型调用:对大模型服务响应速度敏感的业务,尤其当调用方位于中国内地以外时(跨境网络延迟可能显著影响服务体验)。
  • 音视频 AI 服务调用:涉及音视频资料传输且对实时性要求较高的 AI 应用(如同声传译、扣子语音对话场景)。
  • MCP Server 后端调用:通过火山引擎函数服务实现 MCP Server 所调用工具的后端,MCP Server 与后端间的传输速度直接影响智能体工作效率。
  • 大模型生成内容下载:终端用户跨区域下载 Seedream、Seedance 等模型在对象存储桶中生成的图片、视频时,通过加速域名显著降低首字节延时与整体下载耗时。

优化效果参考

以海外用户通过 SSE 协议访问托管在火山方舟的豆包大模型 API 为例,经由 DCDN 加速后,海外用户访问 API 的性能提升如下:

  • 丢包率降低 5~10%。
  • API 调用成功率提升 0.4~0.5%。
  • 建连耗时缩短 200 ms,总耗时缩短 10%~30%。

按场景导航

根据您的业务诉求,选择对应子场景的端到端配置教程:

子场景适用情况
大模型 & AI 应用加速访问适用于加速对火山方舟大模型 API、扣子平台 API、语音/视觉智能服务 API 等 AI 服务源站的访问。
加速大模型生成内容下载适用于加速终端用户对 Seedream、Seedance 等模型生成内容的下载访问。
加速基于函数服务的 MCP Server 后端调用适用于加速通过火山引擎函数服务实现的 MCP Server 后端调用。
加速基于函数服务的 Serverless AI 应用访问适用于加速对运行在函数服务上的 Serverless AI 应用的访问。
最近更新时间:2026.05.22 17:30:19
这个页面对您有帮助吗?
有用
有用
无用
无用