为了保障大模型输入输出的内容安全合规,火山方舟平台提供内容安全护栏功能,在豆包模型原生安全能力之上,能够帮助企业自动识别并过滤用户在调用推理点过程中的涉敏、涉黄等风险,从而保障客户业务生态的健康与安全。
根据模型不同,内容安全护栏包含多种方案供您选择。
模型类型 | 默认方案 | 自定义方案 | 关闭 |
|---|---|---|---|
豆包模型 | 火山方舟默认的内容安全机制,广泛覆盖内容安全通用需求,保障底线安全。 | 火山方舟原生支持调用火山引擎内容风险识别服务,识别多模态内容中的潜在合规风险并支持定制策略,满足企业对于内容审核的场景化需求。 | / |
三方/开源/精调模型 | 火山方舟为三方/开源/精调模型额外提供的基础过滤词。 | 支持关闭内容安全护栏 |
说明
历史部分模型支持的 “基础” 内容安全方案,因已不适配当前风险场景,计划下线。若您有推理点已选择该方案,可通过安全管理 - 内容安全统一查询,建议尽快前往编辑推理点 - 编辑内容安全护栏切换为 “默认” 方案。
火山引擎内容风险识别(以下简称“火山风控”)的主要功能包括:
请参考文档 火山引擎-内容风险识别-产品接入操作手册进行配置。配置过程中如有问题,请联系火山风控工作人员。
查看/编辑内容安全护栏入口:
在选择内容安全护栏-自定义方案时,显示配置安全策略列表:
阅读并确认《自定义内容审核机制合规承诺函》,完成策略配置。
完成配置后,通过以下步骤验证内容安全策略是否生效。
错误码详情:错误码
文本被拦截的返回示例如下:
# API请求参数 { "model": "ep-************", "prompt": "*****", "response_format": "url", "size": "1024x1024", "guidance_scale": 3, "watermark": true } # 错误响应 { "error": { "code": "InputTextSensitiveContentDetecteed", "message": "The request failed because the input text may contain sensitive information. Requestid: 021***213274668fd7e*********538983d3199357a1****80873", "param": ", ", "type": "" } }
详细测试方式:请咨询火山风控工作人员。
使用火山引擎内容风险识别服务会涉及如下两项费用,这些费用将自动从你的火山引擎账户余额中扣款。