大模型应用防火墙内置词库,用于匹配输入和输出内容中的敏感信息或者不合规内容。此外,大模型应用防火墙还支持自定义词库,以适配更符合您业务实际场景的内容检测需要。
什么是正向词库和负向词库?
- 正向词库:指允许出现的提示词。如果您将某提示词加入到正向词库中,则该提示词被大模型应用防火墙视为”正常输入“。这种情况下,即便对应提示词内容命中了防护策略,大模型应用防火墙也不会将其判定为攻击行为,直接放行。
- 负向词库:指禁止出现的提示词。如果您将某提示词加入到负向词库中,则该提示词被大模型应用防火墙视为”恶意输入“。在命中对应提示词内容后,大模型应用防火墙会判定该请求中包含攻击词汇,按照设定的防护策略执行相关动作。
注意事项
如果您不配置自定词库,大模型应用防火墙会按照预置词库检测输入和输出内容。
操作步骤
登录大模型应用防火墙控制台。
在顶栏选择实例所属地域。
在左侧导航选择防护>大模型防护>自定义词库。
单击添加词库,配置词库信息。

参数 | 说明 | 示例值 |
|---|
基本信息 |
规则名称 | 输入词库的名称。 说明 - 以中文、字母、数字开头。
- 允许字母、数字、中文、点“.”、下划线“_”和中划线“-”。
- 长度为1-128个字符。
| 词库1 |
检测分类 | 配置负向词库时,需要将该词库关联到对应的检测分类下。当词库命中时,大模型应用防火墙会返回对应的检测分类标签。 | 涉敏1
欺诈 |
词库类型 | - 正向:该词库用于添加正常输出的内容,即词库内的提示词允许出现,不会触发防护动作,直接放行。
- 负向:该词库用于添加恶意输入的内容,即词库内的提示词禁止出现,会触发相应的防护动作。
| 负向 |
词库内容 |
匹配方式 | - 完全匹配:用户输入的提示词与此处配置的单条内容完全一致才算命中,对内容匹配度要求较高。
- 关键词匹配:用户输入的提示词只要匹配到单条提示词中的关键词,即为命中,对内容匹配度要求较低。
| 完全匹配 |
提示词 | 输入需要加入到该词库中的提示词内容。如需输入多条提示词,直接换行即可。 | - 测试1
- 测试2
|
生效配置 |
词库开关 | 根据需要设置是否启用该词库。 | 开启 |
单击确定。
配置完成后,自定义词库列表会生成与提示词数目相等的词库规则。例如输入了 2 行提示词,则生成 2 条词库规则。
