在线测试服务可帮助您小批量、快速验证自定义模型的防护能力。它通过简单的界面化操作,让您可以快速构造测试内容并获取验证结果,适用于需要快速验证模型能力的场景。
测试方式对比
平台支持通过两种方式验证模型的防护效果:
- 在线测试:适用于已经准备好测试样本、且对验证速度要求较高的场景,可以快速构造测试内容并获取验证结果。
- 灰度测试:通过关联测试资产,模拟线上真实流量进行测试,更全面地评估模型在实际环境中的表现。相关测试内容请参考配置自定义检测规则。
前提条件
您已经完成自定义模型部署。部署相关操作,请参考后续操作。
注意事项
- 最多可同时存在 100 个任务,包括处于以下状态的所有任务。
- 每个任务最多可以添加 100 条测试内容。
- 每条测试内容最多可包括 4096 个字节。
从模型列表发起在线测试
待模型部署完成后,您可以直接在模型列表中选择相应模型发起在线测试,具体操作如下所述。
- 登录大模型应用防火墙控制台。
- 在顶栏选择实例所属地域。
- 在左侧菜单栏选择防护 > 自定义防护 > 自定义模型防护。
- 在自定义模型列表,找到创建好的模型。
- 单击操作列的测试与发布。

- 选择在线测试,并单击确定。

- 选择模型并输入待测试内容。

- 单击运行。
- 单击查看结果,可查看测试详情。

从测试任务列表发起在线测试
您也可以从在线测试任务列表,单独为模型创建新的测试任务,具体操作如下所述。
- 登录大模型应用防火墙控制台。
- 在顶栏选择实例所属地域。
- 在左侧菜单栏选择防护 > 自定义防护 > 自定义模型防护。
- 单击创建测试。

- 选择完成部署的模型并输入待测试内容。

- 单击运行。
- 等待任务变成已完成状态,单击任务可查看结果。

后续操作
您需要进行多轮在线测试以验证模型的防护效果,若结果符合预期,则可将该模型投入正式使用。
- 前往自定义模型列表。
- 选择需要发布的模型,单击操作列的测试与发布。
- 选择直接发布,并单击确定。

待模型发布后,模型会流转为已发布状态。