大模型应用防火墙可以根据不同的模型平台类型,结合 API Key 和访问域名、源站配置等信息,与客户端和您的后端服务器进行流量通信,并对流量进行检测,确保业务安全稳定运行。 本文主要介绍如何配置不同模型的接入参数。
您已获取相关模型服务的域名和 API Key,相关操作请参见获取模型服务域名和 API Key。
API Key 需符合Authorization: Bearer <API Key>样式,否则会导致鉴权失败,流量无法通过。
应用信息:应用基本信息用于标识接入大模型应用防火墙的具体业务。
参数 | 说明 |
|---|---|
应用名称 | 您自定义的业务应用名称,用于在防火墙控制台区分不同的接入应用。 说明
|
描述 | 对该接入应用的补充说明。 |
模型配置:模型配置参数决定了大模型应用防火墙如何准确地识别和提取请求中的提示词和响应中的大模型输出,是进行深度内容安全检测的基础。根据模型类型不同,这些参数的具体设置也会有所差异。具体如下:
https://scv8****.apigateway-cn-shanghai.volceapi.com/mlp/s-20250311190045-rbjcf/,则填入scv8****.apigateway-cn-shanghai.volceapi.com。获取方式请参考获取机器学习平台服务域名。
messages 数组来封装对话内容,而其他模型可能直接使用 prompt 字段。大模型应用防火墙已对部分主流大模型应用(包括 OpenAI、Qwen、DeepSeek R1、DeepSeek V3、豆包)进行了数据解析和适配。通过选择对应的应用类型,防火墙能够自动识别和解析请求体中的 Prompt 位置以及响应体中的大模型输出位置,从而简化您的配置流程。说明
如果您的大模型业务不属于以上适配的应用类型,或者您需要进行更高级的自定义解析,则需要选择自定义应用类型,并且导入 schema 来完成接入。自定义应用配置的相关说明请参考配置自定义应用类型。
https://scv8****.apigateway-cn-shanghai.volceapi.com/mlp/s-20250311190045-rbjcf,API 请求路径为/v1/chat/completions,则填写/mlp/s-20250311190045-rbjcf/v1/chat/completions。一个大模型应用可能提供多个 API 接口(例如:/v1/chat/completions 用于对话,/v1/embeddings 用于生成向量)。防火墙可以针对不同路径的 API 接口配置不同的防护策略,满足多样化的安全需求。源站配置:源站配置参数用于控制大模型应用防火墙与后端机器学习平台之间的连接行为,如无特殊需要,保持默认值即可。
参数名称 | 说明 | 默认值 | 可配置范围 |
|---|---|---|---|
建连超时时间 | 大模型应用防火墙和后端服务器建立连接的超时时间。 | 4 秒 | 4~120 秒 |
写超时时间 | 大模型应用防火墙将请求传输给后端服务器的超时时间。 | 60 秒 | 30~3600 秒 |
读超时时间 | 大模型应用防火墙从后端服务器读取响应的超时时间。 | 60 秒 | 30~3600 秒 |
最大回源重试次数 | 大模型应用防火墙回源失败后,可重试的次数。 | 3 次 | 1~10 次 |
长连接可复用个数 | 大模型应用防火墙回源长连接可复用个数。 | 100 个 | 60-1000 个 |
空闲长连接超时时间 | 大模型应用防火墙与后端服务器建立请求的长连接空闲时间。 | 15 秒 | 1~3600 秒 |
完成配置后,您需要将原有访问域名替换为大模型应用防火墙提供的防护域名,将业务流量牵引至大模型应用防火墙进行防护。
以方舟 Python SDK 为例,将以下初始化配置中的base_url设置为<大模型应用防火墙防护域名>/api/v3。
import os from volcenginesdkarkruntime import Ark client = Ark( api_key=os.environ.get("ARK_API_KEY"), # 方舟的 API Key,例如:5b25f2d5-466d-4017-a864-304d99cf**** base_url="a00d4f9ab2dbc92d564ed6644cdb****.access.omni-shield.volces.com/api/v3" # 将方舟访问路径设置为<大模型应用防火墙防护域名>/api/v3
替换完成后,部署于方舟的应用将自动受大模型应用防火墙保护。大模型应用防火墙会依据已配置的策略,对所有相关请求进行实时检测并返回结果。