话题控制是大模型应用防火墙的一项定制化防护功能,它可以基于您提供的敏感话题内容(包括敏感词、黑白样本等)进行智能训练,并自动生成检测语料。通过实时分析用户输入与语料的关联性,大模型应用防火墙可以有效拦截敏感输入,防止大模型被滥用于生成不合规或可能引发舆论风险的内容。下文将以金融业务场景为例,为您详细介绍话题控制规则的配置方法。
一个访问路径只能关联一条话题控制规则。
一条话题控制规则下最多可添加 9 个话题。
为确保模型检测的有效性,请您尽可能提供清晰的话题描述和样本内容。例如:
参数 | 配置示例 |
|---|---|
话题描述 |
|
黑样本 |
|
白样本 |
|
您已将需要防护的网站接入大模型应用防火墙。接入相关操作,请参见资产接入说明。
登录大模型应用防火墙控制台。
在顶栏选择实例所属地域。
在左侧导航选择防护>大模型防护>话题控制。
启用策略。
单击添加规则。
参数 | 说明 | 示例值 |
|---|---|---|
规则名称 | 防护策略的名称,用于区别不同的话题控制规则。 说明
| 话题控制1 |
描述 | 对话题控制规则的补充说明。 | 用于金融场景下的话题控制。 |
资产 | 选择需要匹配的资产或路径。勾选资产后,则该资产下配置的全部路径都会纳入匹配范围。 说明 SDK 方式接入的防护资产,暂不支持匹配到路径。 | www.volcwaf001.com |
话题名称 | 自定义需要控制的话题名称,用于区分不同的话题。 说明
| 产品推荐 |
话题描述 | 为当前话题补充描述,帮助大模型理解当前话题的含义。 说明 长度为1-255个字符。 | 要求推荐具体的股票、基金或其他金融产品。 |
敏感词 |
| 个股推荐、基金推荐、产品推荐 |
黑样本 | 指该场景下常见的风险输入,即您希望大模型应用防火墙拦截的内容。可作为当前规则的拦截样本供模型学习,便于大模型匹配更多相关输入。 说明
| 作为新手应该买哪一只基金? |
白样本 | 指该场景下常见的无风险输入,即您希望大模型应用防火墙放行的内容。可作为当前规则的放行样本供模型学习,便于大模型匹配更多相关输入。 说明
| 哪些类型的投资产品更适合新手? |
话题生效范围 | 指定话题对用户输入的提示词生效还是对模型的响应回答内容生效。 | |
执行动作 | 检测到该话题规则关联的请求内容时,执行的处置动作。
说明
| 拦截 |
话题控制开关 | 开启或关闭当前规则。 | 开启 |
单击确定。
注意
话题控制规则在配置完成后需要等待 10 分钟左右才能生效。这是因为大模型应用防火墙需要时间对您配置的话题内容进行训练学习,以生成准确的关联检测内容。
如果您担心话题控制策略会影响正常用户请求,可参考以下操作建议:
观察。这样大模型应用防火墙不会对命中的请求执行拦截,但会记录攻击日志。拦截。