You need to enable JavaScript to run this app.
导航
配置话题控制策略
最近更新时间:2025.11.07 11:14:01首次发布时间:2025.06.18 10:26:45
复制全文
我的收藏
有用
有用
无用
无用

话题控制是大模型应用防火墙的一项定制化防护功能,它可以基于您提供的敏感话题内容(包括敏感词、黑白样本等)进行智能训练,并自动生成检测语料。通过实时分析用户输入与语料的关联性,大模型应用防火墙可以有效拦截敏感输入,防止大模型被滥用于生成不合规或可能引发舆论风险的内容。下文将以金融业务场景为例,为您详细介绍话题控制规则的配置方法。

注意事项

  • 一个访问路径只能关联一条话题控制规则。

  • 一条话题控制规则下最多可添加 9 个话题。

  • 为确保模型检测的有效性,请您尽可能提供清晰的话题描述和样本内容。例如:

    参数

    配置示例

    话题描述

    要求推荐具体的股票/基金/具体产品

    黑样本

    帮我推荐 3 只明天会涨停的股票。

    白样本

    父母养老钱适合买银行理财产品吗?

前提条件

您已将需要防护的网站接入大模型应用防火墙。接入相关操作,请参见资产接入说明

操作步骤

  1. 登录大模型应用防火墙控制台

  2. 在顶栏选择实例所属地域。

  3. 在左侧导航选择防护>大模型防护>话题控制

  4. 启用策略。
    Image

  5. 单击添加规则

    参数

    说明

    示例值

    规则名称

    防护策略的名称,用于区别不同的话题控制规则。

    说明

    • 以中文、字母、数字开头。
    • 允许字母、数字、中文、点“.”、下划线“_”和中划线“-”。
    • 长度为1-128个字符。

    话题控制1

    描述

    对话题控制规则的补充说明。

    用于金融场景下的话题控制。

    资产

    选择需要匹配的资产或路径。勾选资产后,则该资产下配置的全部路径都会纳入匹配范围。

    说明

    SDK 方式接入的防护资产,暂不支持匹配到路径。

    www.volcwaf001.com

    话题名称

    自定义需要控制的话题名称,用于区分不同的话题。

    说明

    • 以中文、字母、数字开头。
    • 允许字母、数字、中文、点“.”、下划线“_”和中划线“-”。
    • 长度为1-128个字符。

    产品推荐

    话题描述

    为当前话题补充描述,帮助大模型理解当前话题的含义。

    说明

    长度为1-255个字符。

    要求推荐具体的股票、基金或其他金融产品。

    敏感词

    • 该配置为可选项,可作为当前规则的关键词,便于大模型匹配对应检测内容。
    • 支持输入多个敏感词,按回车键可确认并输入下一个敏感词。

    个股推荐、基金推荐、产品推荐

    黑样本

    指该场景下常见的风险输入,即您希望大模型应用防火墙拦截的内容。可作为当前规则的拦截样本供模型学习,便于大模型匹配更多相关输入。

    说明

    • 每个话题最多可以输入 10 条黑样本。
    • 每条样本最多支持 50 个字符。

    作为新手应该买哪一只基金?

    白样本

    指该场景下常见的无风险输入,即您希望大模型应用防火墙放行的内容。可作为当前规则的放行样本供模型学习,便于大模型匹配更多相关输入。

    说明

    • 每个话题最多可以输入 10 条白样本。
    • 每条样本最多支持 50 个字符。

    哪些类型的投资产品更适合新手?

    话题生效范围

    指定话题对用户输入的提示词生效还是对模型的响应回答内容生效。

    执行动作

    检测到该话题规则关联的请求内容时,执行的处置动作。

    • 观察:放行请求行为。
    • 拦截:拦截请求行为,如果该资产配置了自定义拦截响应策略,则会按照已配置内容响应用户。
    • 安全代答:以经过训练的答案代替原大模型回应用户,确保回复内容合规合法。

    说明

    • 所有触发防护策略的请求都会被记录于攻击详情中。
    • 如果担心话题控制规则会拦截正常业务请求,建议先设置规则执行动作为观察。这种模式下,大模型应用防火墙不会对命中的请求执行拦截,仅记录攻击日志。您可以通过攻击详情分析命中情况,确认符合预期后再将动作调整为拦截

    拦截

    话题控制开关

    开启或关闭当前规则。

    开启

  6. 单击确定

    注意

    话题控制规则在配置完成后需要等待 10 分钟左右才能生效。这是因为大模型应用防火墙需要时间对您配置的话题内容进行训练学习,以生成准确的关联检测内容。

常见问题

话题控制和自定义词库有什么区别?

  • 自定义词库是基于正则表达式的内容匹配,只有在输入内容中检测到词库中的关键词或者与词库规则完全一致时才会命中规则,触发防护动作。
  • 话题控制是基于话题描述和话题样本的智能匹配,能够检测多样化的话题内容,更精准地识别和拦截不合规内容,防止模型滥用。

配置话题控制策略后会影响正常用户请求么?

如果您担心话题控制策略会影响正常用户请求,可参考以下操作建议:

  1. 配置规则时将执行动作设置为观察。这样大模型应用防火墙不会对命中的请求执行拦截,但会记录攻击日志。
  2. 通过查看攻击事件详情分析命中情况,确认攻击日志的相关事件是否符合攻击特征。
  3. 如果确认攻击事件符合预期,再将动作调整为拦截