You need to enable JavaScript to run this app.
导航
在 Coze 工作流中启用大模型应用防火墙插件
最近更新时间:2025.11.03 19:24:49首次发布时间:2025.11.03 19:24:49
复制全文
我的收藏
有用
有用
无用
无用

大模型应用防火墙插件现已发布到 Coze 插件商店,您可以在 Coze 工作流的输入、推理与输出链路中添加插件节点,进行风险识别与拦截、或是调用安全代答接口获取合规的回复内容。本指南将引导您在 Coze 工作流中编排和使用 Moderate 与 Generate 插件。

插件能力

  • Moderate:用于检测用户输入或模型响应的内容是否合规。
  • Generate:根据检测接口返回的消息 ID 生成指定消息的代答内容。

适用场景

  • 知识型问答:面向员工或客户的 FAQ/知识库检索,需避免将机密信息外泄或生成不当内容。
  • 文案与生成:营销稿、内部通告、培训材料等产生过程需控制话题与措辞合规。
  • 数据类对话:涉及手机号、邮箱、ID 等个人信息的处理,需支持脱敏或拦截。
  • 辅助代答:当主模型被拦截或需降级时,通过“代答”策略提供安全替代回应。
  • 自动化流程:在工作流中串联调用多个工具/模型,需对每次调用的输入输出进行统一治理。

操作步骤

假设您有一个智能问答助手的 Coze 智能体,希望将用户输入内容送至 Moderate 插件检测后,确保内容合规再发送给大模型进行回答。此外,如果输入内容存在风险或可能导致大模型输出的内容存在风险,则直接调用 Generate 插件输出回答。您可以参考以下步骤,了解如何在 Coze 工作流中编排和使用大模型应用防火墙提供的插件。

步骤一 购买大模型应用防火墙智能体实例

使用大模型应用防火墙插件能力需要您先在火山引擎大模型应用防火墙控制台购买对应实例。如您已经完成购买,可以跳过此步骤。

  1. 登录大模型应用防火墙控制台

  2. 在欢迎页面,单击立即开通

    说明

    非首次创建请前往设置>实例管理,单击购买实例

  3. 配置相关购买参数,说明如下。

    配置

    说明

    实例名称

    可选参数,若留空,则会自动生成一个实例名称。

    说明

    以中文、字母、数字开头。允许字母、数字、中文、半角句号“.”、下划线“_”和短横线“-”。长度为 1-128 个字符。

    计费模式

    • 包年包月:根据所选套餐规格及使用时长计费,不同套餐规格价格不同,详情请参见包年包月
    • 按量付费:根据大模型检测费、大模型代答费等计费项综合计费,按每小时实际用量支付费用。详情请参见按量付费

    区域

    实例所属区域。注意建议选择与待防护资源位置较近的区域,以免影响网络访问效果。同一帐号在同一个区域只能购买一条实例,实例到期回收后方可重新选购实例。

    套餐规格

    包年包月计费方式下,您可以选择不同的规格版本,详情请参见包年包月

  4. 确认所选配置后,阅读并同意勾选相关服务协议。

  5. 单击立即购买进入订单管理页面,确认订单信息。

  6. 确认订单信息无误后,完成支付。

步骤二 通过 SDK 方式创建防护资产

完成实例购买后,您需要生成一个 SDK 接入的虚拟资产,大模型应用防火墙将为该资产生成对应的 AppID,用于识别不同的接入资产。

  1. 登录大模型应用防火墙控制台
  2. 在顶栏选择实例所属地域。
  3. 在左侧导航选择资产管理,然后单击添加资产
  4. 选择接入方式为SDK接入,填写应用基本信息,包括应用名称和描述。

步骤三 为资产配置防护策略

填写完应用基本信息后,您可以直接为当前资产应用设置防护策略。平台会展示防护策略的默认配置,且配置为开启状态。

  • 如无需修改,您可以直接提交当前配置,完成控制台部分的接入操作。
  • 如需修改,可直接在当前页面调整相关配置。修改并确认后的结果将作为下一次接入的默认配置。

对应策略的详细介绍和配置说明可参见防护策略介绍
Image

步骤四 在 Coze 智能体工作流中启用大模型应用防火墙插件

  1. 登录 Coze 开发平台

  2. 在资源库中选择需要启用插件的工作流。

    说明

    如果您还没有创建工作流,请参考 Coze 官方文档使用工作流了解详情。

  3. 在已有工作流中添加大模型应用防火墙的检测插件和代答插件。

    1. 单击添加节点,选择插件
    1. 搜索火山引擎大模型应用防火墙,将两个插件添加至当前工作流中。

    2. 结合此前的需求,您可以参考如下编排方式:
      详细配置说明请参考参数说明

步骤五 测试插件效果

编排完成后,您可以在当前工作流中测试插件应用效果。例如:

工作流参数说明

Moderate 插件

输入

参数

示例值

说明

access_key

AKLTYWRhNDMw****

  • 参数说明:火山引擎账号的 Access Key IDSecret Access Key
  • 获取方式:获取说明请参见 Access Key(密钥)管理

secret_key

TWprNE5XVXlZbc****

app_id

  • 参数说明:资产的唯一标识,完成控制台接入配置后,系统将自动生成 AppID。

说明

SDK 调用时支持传入通过 SDK 方式接入的资产 AppID,其他接入方式的资产不生效。

Image

content

今天天气怎么样。

需要检测的内容。该工作流中直接配置为开始节点的 Input,则每次用户输入都将自动传入内容。

content_type

text

内容类型,当前仅支持text,即文本类型。

region

cn-beijing

  • 参数说明:大模型应用防火墙实例所属地域。
    • 华北2(北京):cn-beijing
    • 华东2(上海):cn-shanghai
  • 获取方式:可前往大模型应用防火墙控制台实例管理模块,查看实例所在区域。

Image

role

user

内容的来源,用于区分内容属性:

  • user:用户输入的提示词内容
  • assistant:模型响应内容

输出

输出相关参数的说明,请参见返回参数说明

Generate 插件

输入

参数

示例值

说明

access_key

AKLTYWRhNDMw****

  • 参数说明:火山引擎账号的 Access Key IDSecret Access Key
  • 获取方式:获取说明请参见 Access Key(密钥)管理

secret_key

TWprNE5XVXlZbc****

msg_id

19de789baf324b4480e25c9616aa****

消息唯一标识符。该工作流中直接配置为 moderate 插件输出的 msg_id,可自动传入并生成代答结果。

region

cn-beijing

  • 参数说明:大模型应用防火墙实例所属地域。
    • 华北2(北京):cn-beijing
    • 华东2(上海):cn-shanghai
  • 获取方式:可前往大模型应用防火墙控制台实例管理模块,查看实例所在区域。

Image

输出

  • answer:即大模型应用防火墙的代答结果。

IF 选择器

当且仅当送检内容不存在风险,即被 moderate 插件判定为放行(对应decision_type = 1)时,直接将用户提示词作为大模型的输入,否则调用 generate 插件生成代答结果。