大模型应用防火墙内置词库,用于匹配输入和输出内容中的敏感信息或者不合规内容。此外,大模型应用防火墙还支持自定义词库,以适配更符合您业务实际场景的内容检测需要。
什么是正向词库和负向词库?
- 正向词库:指允许出现的提示词。如果您将某提示词加入到正向词库中,则该提示词被大模型应用防火墙视为”正常输入“。这种情况下,即便您配置的提示词防护策略关联了该词库所属的检测分类,在命中对应提示词内容后,大模型应用防火墙也不会将其判定为攻击行为,直接放行。
- 负向词库:指禁止出现的提示词。如果您将某提示词加入到负向词库中,则该提示词被大模型应用防火墙视为”恶意输入“。如果您配置的提示词防护策略关联了该词库所属的检测分类,在命中对应提示词内容后,大模型应用防火墙会判定该请求中包含攻击词汇,按照设定的防护策略执行相关动作,包括观察、放行或优化回答。
注意事项
- 如果您不配置自定词库,大模型应用防火墙会按照预置词库检测输入和输出内容。
- 自定义词库关联的检测分类必须应用于相关防护策略中才会生效。
操作步骤
登录大模型应用防火墙控制台。
在顶栏选择实例所属地域。
在左侧导航选择防护>大模型防护>自定义词库。
单击添加词库,配置词库信息。

参数 | 说明 | 示例值 |
---|
规则名称 | 输入词库的名称。 说明 - 以中文、字母、数字开头。
- 允许字母、数字、中文、点“.”、下划线“_”和中划线“-”。
- 长度为1-128个字符。
| 词库1 |
检测分类 | 将该词库关联到对应的检测分类下,当配置的提示词防护策略使用该检测分类时,大模型应用防火墙才会匹配该词库。 | 涉敏1
欺诈 |
词库类型 | - 正向:该词库用于添加正常输出的内容,即词库内的提示词允许出现,不会触发防护动作,直接放行。
- 负向:该词库用于添加恶意输入的内容,即词库内的提示词禁止出现,会触发相应的防护动作。
| 负向 |
匹配方式 | - 完全匹配:用户输入的提示词与此处配置的单条内容完全一致才算命中,对内容匹配度要求较高。
- 关键词匹配:用户输入的提示词只要匹配到单条提示词中的关键词,即为命中,对内容匹配度要求较低。
| 完全匹配 |
提示词 | 输入需要加入到该词库中的提示词内容。如需输入多条提示词,直接换行即可。 | - 测试1
- 测试2
|
测试状态 | 测试状态开关可用于测试提示词库的效果。 - 关闭状态下,大模型应用防火墙对命中的提示词直接执行配置的防护动作。
- 如果您担心匹配词库会影响正常请求,希望观察一段时间再正式启用词库,可以开启测试状态。开启后,大模型应用防火墙不会直接对命中的请求执行对应动作,仅记录日志。您可以通过日志记分析命中情况,确认词库内容是否符合预期。
| 开启 |
词库开关 | 根据需要设置是否启用该词库。 | 开启 |
单击确定。
配置完成后,自定义词库列表会生成与提示词数目相等的词库规则。例如输入了 2 行提示词,则生成 2 条词库规则。规则 ID 可用于日志检索和攻击详情判断。
