大模型应用防火墙提供了丰富的预置策略,能够覆盖通用安全场景,同时也提供自定义模型防护能力,可基于您提供的样本内容训练自定义模型,生成符合业务实际场景的专属防护模型。
什么时候需要自定义模型?
- 场景高度定制:您的业务非常垂直,例如 AI 辅助编程、医疗咨询、金融分析等,通用策略难以精准识别其中的“黑话”或特定风险。
- 高检出率要求:对特定风险(如生成非法代码、诱导投资等)的检出率有极高要求,宁可误报,不可漏报。
- 样本充足:您拥有足够的高质量、已标注的业务数据(正/负样本),可用于模型训练。
当预置策略效果不足以覆盖您的业务场景,且有明确的、独特的防护目标时,自定义模型是必要的补充。
流程说明

创建自定义模型的完整流程包括准备样本、训练模型、部署测试直至最终发布。为保证模型效果,请您务必关注以下三个关键点:
- 提供高质量样本:模型的防护效果直接取决于您提供的训练数据质量。请务必提供清晰、典型且具有代表性的黑、白样本。
- 白样本:您期望模型放行的正常业务内容。
- 黑样本:您期望模型拦截的违规或攻击内容。
- 数量建议:每个类别至少需要 20 个白样本和 20 个黑样本。为提升准确率,建议白样本数量略多于黑样本。
- 在发布前充分测试:模型正式上线前,您必须通过“快速测试”或“灰度测试”来验证其效果,以避免影响线上业务。
- 通过迭代持续优化:安全防护是一个动态过程。您需要持续收集线上的误报和漏报样本来重新训练模型,这是其能力不断提升的关键。
相关文档