You need to enable JavaScript to run this app.
导航
配置模型接入参数
最近更新时间:2025.09.25 21:57:18首次发布时间:2025.07.04 11:25:56
复制全文
我的收藏
有用
有用
无用
无用

大模型应用防火墙可以根据不同的模型平台类型,结合 API Key 和访问域名、源站配置等信息,与客户端和您的后端服务器进行流量通信,并对流量进行检测,确保业务安全稳定运行。 本文主要介绍如何配置不同模型的接入参数。

前提条件

您已获取相关模型服务的域名和 API Key,相关操作请参见获取模型服务域名和 API Key

注意事项

API Key 需符合Authorization: Bearer <API Key>样式,否则会导致鉴权失败,流量无法通过。

操作步骤

  1. 登录大模型应用防火墙控制台
  2. 在顶栏选择实例所属地域。
  3. 在左侧导航选择资产管理,然后单击添加资产
  4. 选择接入方式为模型服务接入,并配置相关参数信息。
    Image
  • 应用信息:应用基本信息用于标识接入大模型应用防火墙的具体业务。

    参数

    说明

    应用名称

    您自定义的业务应用名称,用于在防火墙控制台区分不同的接入应用。

    说明

    • 以中文、字母或数字开头。
    • 允许使用中文、字母、数字、点(.)、下划线(_)和中划线(-)。
    • 长度为 1-100 个字符。

    描述

    对该接入应用的补充说明。

  • 模型配置:模型配置参数决定了大模型应用防火墙如何准确地识别和提取请求中的提示词和响应中的大模型输出,是进行深度内容安全检测的基础。根据模型类型不同,这些参数的具体设置也会有所差异。具体如下:

    • 模型服务域名:输入您提前获取的机器学习平台服务域名。例如获取的机器学习平台公网访问地址为https://scv8****.apigateway-cn-shanghai.volceapi.com/mlp/s-20250311190045-rbjcf/,则填入scv8****.apigateway-cn-shanghai.volceapi.com。获取方式请参考获取机器学习平台服务域名
      • 防护域名:平台自动生成防护域名,业务请求将被牵引至该域名下进行检测,检测后的数据会被转发至机器学习平台处理。您需要将原有访问域名替换为大模型应用防火墙提供的防护域名,将业务流量牵引至大模型应用防火墙进行防护。
      • 自定义防护路径:根据模型类型配置对应的防护路径,确保请求能够准确地被引导至相应的防护机制下进行处理。
        • 类型:不同的主流大模型在接收用户输入和返回响应时,其 JSON 结构、参数名称、数据类型等可能存在差异。例如,OpenAI 的 API 可能使用 messages 数组来封装对话内容,而其他模型可能直接使用 prompt 字段。大模型应用防火墙已对部分主流大模型应用(包括 OpenAI、Qwen、DeepSeek R1、DeepSeek V3、豆包)进行了数据解析和适配。通过选择对应的应用类型,防火墙能够自动识别和解析请求体中的 Prompt 位置以及响应体中的大模型输出位置,从而简化您的配置流程。

          说明

          如果您的大模型业务不属于以上适配的应用类型,或者您需要进行更高级的自定义解析,则需要选择自定义应用类型,并且导入 schema 来完成接入。自定义应用配置的相关说明请参考配置自定义应用类型

        • 路径:将公网访问地址的路径部分与 API 请求路径拼接后填写。例如公网访问地址为https://scv8****.apigateway-cn-shanghai.volceapi.com/mlp/s-20250311190045-rbjcf,API 请求路径为/v1/chat/completions,则填写/mlp/s-20250311190045-rbjcf/v1/chat/completions。一个大模型应用可能提供多个 API 接口(例如:/v1/chat/completions 用于对话,/v1/embeddings 用于生成向量)。防火墙可以针对不同路径的 API 接口配置不同的防护策略,满足多样化的安全需求。
  • 源站配置:​源站配置参数用于控制大模型应用防火墙与后端机器学习平台之间的连接行为,如无特殊需要,保持默认值即可。

    参数名称

    说明

    默认值

    可配置范围

    建连超时时间

    大模型应用防火墙和后端服务器建立连接的超时时间。

    4 秒

    4~120 秒

    写超时时间

    大模型应用防火墙将请求传输给后端服务器的超时时间。

    60 秒

    30~3600 秒

    读超时时间

    大模型应用防火墙从后端服务器读取响应的超时时间。

    60 秒

    30~3600 秒

    最大回源重试次数

    大模型应用防火墙回源失败后,可重试的次数。

    3 次

    1~10 次

    长连接可复用个数

    大模型应用防火墙回源长连接可复用个数。

    100 个

    60-1000 个

    空闲长连接超时时间

    大模型应用防火墙与后端服务器建立请求的长连接空闲时间。

    15 秒

    1~3600 秒

  1. 单击下一步
    页面会返回防护域名的大模型防护策略默认配置选项。你可以在此处快速配置,或者直接前往策略配置页面进行详细配置。
    对应策略的详细介绍和配置说明可参见防护策略介绍
    Image

后续操作

完成配置后,您需要将原有访问域名替换为大模型应用防火墙提供的防护域名,将业务流量牵引至大模型应用防火墙进行防护。
以方舟 Python SDK 为例,将以下初始化配置中的base_url设置为<大模型应用防火墙防护域名>/api/v3

import os
from volcenginesdkarkruntime import Ark
client = Ark(
    api_key=os.environ.get("ARK_API_KEY"), # 方舟的 API Key,例如:5b25f2d5-466d-4017-a864-304d99cf****
    base_url="a00d4f9ab2dbc92d564ed6644cdb****.access.omni-shield.volces.com/api/v3"  # 将方舟访问路径设置为<大模型应用防火墙防护域名>/api/v3

替换完成后,部署于方舟的应用将自动受大模型应用防火墙保护。大模型应用防火墙会依据已配置的策略,对所有相关请求进行实时检测并返回结果。