You need to enable JavaScript to run this app.
导航
通过 SDK 方式接入大模型应用防火墙
最近更新时间:2025.06.10 17:45:27首次发布时间:2025.06.10 17:45:27
我的收藏
有用
有用
无用
无用

您可以通过 SDK 方式,在不改变大模型应用部署结构的情况下,将服务快速集成到应用中,实现内容校验、优化代答等功能。

请求过程

SDK 接入方式灵活简便,无需对业务部署结构进行改造,接入后,您的业务流量仍然从客户端直接访问源站。您可以在业务系统中直接调用 SDK 接口,获取大模型防护策略的检测或代答结果,再根据业务需要进行相应处理。例如对匹配到提示词攻击防护策略的内容进行拦截,或参考代答结果响应用户。
Image

适用场景

  • 实时检测用户输入的提示词内容,识别其中可能存在的攻击风险或违规敏感信息。
  • 审核大模型的回答内容,及时发现并拦截违规敏感信息,防止模型被滥用或敏感信息外泄。
  • 优化存在风险的模型响应内容,确保输出结果合法合规。

前提条件

您已创建防护实例,相关操作可参考创建大模型安全防火墙实例

注意事项

  • 服务端调用 SDK 前,您需要在控制台获取接入点域名并完成相关策略配置。大模型会基于接入点域名和配置的策略内容,返回对应的检测结果。
  • SDK 接入方式下,仅大模型防护策略生效,暂不支持通过 SDK 调用其他类型的防护策略检测。

接入流程

步骤一 获取接入点域名

您可以在大模型应用防火墙控制台获取系统自动生成的接入点域名。当调用 SDK 时,大模型应用防火墙服务将通过这个域名识别并匹配相应的防护策略。

  1. 登录大模型应用防火墙控制台
  2. 在顶栏选择实例所属地域。
  3. 在左侧导航选择资产管理,然后单击添加域名
  4. 选择接入方式为 SDK
    平台自动生成接入点域名。
    Image
  5. 单击提交
    提交完成后,页面会返回提交成功的站点信息,您也可以在资产管理页面查看接入点域名。
    Image

步骤二 配置防护策略

平台默认在 SDK 接入的返回页面展示大模型防护策略的默认配置,且为开启状态。

  • 如无需修改,您可以直接提交当前配置,完成控制台部分的接入操作。
  • 如需修改,可直接在当前页面调整检测分类和执行动作。修改并确认后的结果将作为下一次接入的默认配置。

Image
以下是每种策略类型的介绍:

  • 提示词攻击防护:提示词攻击防护策略主要检测和识别恶意提示词中的潜在风险,防止业务遭受提示词注入攻击、越权攻击等。通过实时监控和拦截机制,确保模型输出符合安全标准。相关策略配置的详细说明请参见配置提示词攻击防护策略
  • 模型滥用防护:配置模型滥用防护策略后,大模型应用防火墙会对模型服务的使用情况进行全面监控,及时识别并处理异常行为,这些异常行为可能包括:让模型生成违法违规、违反社会价值观、偏见歧视、侵犯隐私,或者产生幻觉的请求。相关策略配置的详细说明请参见配置模型滥用防护策略
  • 敏感数据防护:大模型应用防火墙内置丰富的敏感信息识别规则,可根据预设的敏感信息标签,实时检测输入输出内容中的隐私数据。通过灵活的策略配置,有效防范数据泄露和滥用风险。相关策略配置的详细说明请参见配置敏感数据防护策略

步骤三 下载并集成 SDK

将 SDK 集成到您的大模型应用上,并根据 SDK 的说明文档,调用服务接口,获取对应内容的检测结果。

  1. 参考SDK 列表中的下载地址下载对应语言的 SDK 文件。
  2. 参考SDK 列表中的说明文档,将 SDK 集成到大模型应用上。
  3. 调用 SDK,获取对应接口的返回结果。相关接口的详细说明请参见:

后续操作

服务调用成功后,如果有命中防护规则的请求或响应,大模型应用防火墙会在攻击详情列表生成对应的日志记录,便于您追溯和分析攻击事件。

  1. 登录大模型应用防火墙控制台
  2. 在顶栏选择实例所属地域。
  3. 在左侧导航选择攻击详情,根据时间、接入点域名、攻击类型等筛选攻击事件详情。

Image
您可以根据攻击事件详情和防护数据,调整或新增防护规则使大模型应用防火墙的检测结果更符合您的业务场景。例如,对匹配非高危检测分类的请求内容仅做观察处理,而不直接拦截,以避免误报。