大模型应用防火墙插件现已发布到 Dify 平台,本指南将引导您如何在 Dify 工作流中添加和使用大模型应用防火墙插件。您可以学习如何对工作流的输入与输出进行风险识别与拦截,或调用安全代答接口,从而确保您的大模型应用内容安全合规。
假设您有一个智能问答助手的 Dify 工作流,希望将用户输入内容进行检测后,确保内容合规再发送给大模型进行回答。此外,如果输入内容存在风险或可能导致大模型输出的内容存在风险,则直接调用安全代答插件输出回答。您可以参考以下步骤,了解如何在 Dify 工作流中编排和使用大模型应用防火墙提供的插件。
使用大模型应用防火墙插件能力需要您先在火山引擎大模型应用防火墙控制台购买对应实例。如您已经完成购买,可以跳过此步骤。
说明
非首次创建请前往设置>实例管理,单击购买实例。
配置 | 说明 |
|---|---|
实例名称 | 可选参数,若留空,则会自动生成一个实例名称。 说明 以中文、字母、数字开头。允许字母、数字、中文、半角句号“.”、下划线“_”和短横线“-”。长度为 1-128 个字符。 |
计费模式 | |
区域 | 实例所属区域。注意建议选择与待防护资源位置较近的区域,以免影响网络访问效果。同一帐号在同一个区域只能购买一条实例,实例到期回收后方可重新选购实例。 |
套餐规格 | 包年包月计费方式下,您可以选择不同的规格版本,详情请参见包年包月。 |
完成实例购买后,您需要生成一个 SDK 接入的虚拟资产,大模型应用防火墙将为该资产生成对应的 AppID,用于识别不同的接入资产。
填写完应用基本信息后,您可以直接为当前资产应用设置防护策略。平台会展示防护策略的默认配置,且配置为开启状态。
对应策略的详细介绍和配置说明可参见防护策略介绍。
在Dify 官网搜索火山引擎大模型应用防火墙,并完成安装。
安装完成后您可以在工具列表单击工具,进入工具详情页面。
单击API Key 授权配置。
填写火山引擎账号的 AK 和 SK。详细操作说明可参考 获取AccessKey、SecretKey。
完成授权后,工作区内的所有成员在编排应用时都可以使用此工具。
说明
如果您还没有创建工作流,请参考 Dify 官方文档使用工作流了解详情。
编排完成后,您可以在当前工作流中测试插件应用效果。例如:
参数 | 示例值 | 说明 |
|---|---|---|
APP_ID | app-d38eqoo2pj8lguju**** |
说明 SDK 调用时支持传入通过 SDK 方式接入的资产 AppID,其他接入方式的资产不生效。
|
CONTENT | 今天天气怎么样。 | 需要检测的内容。该工作流中直接配置为开始节点的 Input,则每次用户输入都将自动传入内容。 |
CONTENT_TYPE | Text | 内容类型,当前仅支持 |
REGION | cn-beijing |
|
ROLE | User | 内容的来源,用于区分内容属性:
|
输出相关参数的说明,请参见返回参数说明。
参数 | 示例值 | 说明 |
|---|---|---|
消息 ID | 19de789baf324b4480e25c9616aa**** | 消息唯一标识符。该工作流中直接配置为 moderate 插件输出的 msg_id,可自动传入并生成代答结果。 |
区域 | 北京 |
|
输出内容为大模型应用防火墙的代答结果。
从插件检测结果中解析参数,作为后续节点输入。
说明
以下截图中的参数仅供参考,如果您需要获取消息 ID 则仅解析 msg_id 即可。
当且仅当送检内容不存在风险,即被检测大模型输入或输出内容是否合规插件判定为放行(对应decision_type = 1)时,直接将用户提示词作为大模型的输入,否则调用查询大模型应用防火墙代答结果插件生成代答结果。