SWG 敏感词库是专门用于安全 Web 网关(SWG)模块的资源配置项。管理员可以在此定义特定的关键词或正则表达式,为云应用管控策略中的文本外发检测提供匹配依据,从而识别并管控通过网页或 SaaS 客户端传输的敏感文本信息。
本文详细介绍如何利用内置敏感词资源,以及如何创建并维护企业自定义的 SWG 专属敏感词。
注意
资源适用范围说明
本页面配置的敏感词库仅适用于安全 Web 网关(SWG)相关的策略逻辑。如需配置终端数据防泄露(DLP)等其他模块的敏感数据规则,请前往对应的功能页面进行设置。
敏感词分类
- 登录飞连管理后台。
- 在左侧导航栏,选择系统设置 > 资源管理 > 敏感数据库。
- 在 SWG 敏感词库页签下,通过左侧树状目录查看敏感词分类。

内置敏感词
飞连官方预置了涵盖医疗健康、个人隐私、企业商密、经营管理等维度的标准词库。
- 权限说明:系统内置敏感词条目仅支持预览匹配逻辑,不支持编辑、移动或删除操作。
- 快速复用:若需在内置词库基础上进行微调,可点击操作列的创建副本,系统将生成一条可编辑的自定义词条。
自定义敏感词
管理员可以根据企业特有的业务术语、项目代号等信息创建专属词库。
- 前置操作:在创建自定义敏感词前,需先在左侧目录底部点击 + 新建自定义分类。
- 管理逻辑:所有的自定义敏感词条目必须归属于特定的自定义类别下,便于分类管理。
新建自定义敏感词
选定某个自定义分类目录,点击页面右侧 + 新建敏感词,完成以下参数配置:
- 名称:定义敏感词条目的展示名称。
- 适配语言:选择该词条适用的语种,支持通用、中文及英文。系统将根据选择的语种采用相应的分词与匹配算法。
- 匹配规则:
- 匹配任一:下述“匹配内容”中定义的多个规则项,只要命中其中任意一项,即触发策略。
- 匹配全部:需同时命中下述“匹配内容”中定义的所有规则项,方可触发策略。
- 匹配内容
系统支持通过三种技术手段定义敏感特征。在同一个规则块内,多个输入项之间固定为“或”匹配关系。点击 + 添加规则,可选择以下识别手段:
- 关键词:直接输入明文字符。可录入企业特有的项目代号、敏感术语等。
- 内置正则:调用系统预置的正则表达式(如:手机号、身份证号、银行卡号等)。
- 自定义正则:由管理员手动编写特定的正则表达式,用于识别企业特有的具备固定排版规律的数据格式(如:特定格式的合同编号)。
- 通用判定参数
- 匹配次数:设定该关键词在单个文件中出现的最小次数,达到该数值即判定为命中。例如,设置为 3 时,代表该词需在单个文件中出现至少 3 次才算命中,可有效过滤误报。
- 是否去重:决定相同内容的匹配项是否重复计算次数。开启后,完全相同的匹配结果仅计为 1 次。例如:一次外发中同一个身份证号出现了 100 次,通常只是一个人的信息;但 100 个不同的身份证号则意味着大规模泄露。
词库运维与管理
管理员可以在 SWG 敏感词库页面查看资源分布情况,并对已有的敏感词条进行分类调整与内容维护。
资源概览与分类检索
- 数据看板:页面顶部展示资源统计信息,包括总敏感词数、自定义词条数以及内置词条数,帮助管理员掌握当前的资源构成。
- 多维筛选:
- 搜索:支持通过关键字对敏感词名称进行检索。
- 条件过滤:支持按适配语言(通用/中文/英文)或 匹配类型(关键词/正则)进行组合筛选。
- 目录切换:通过左侧树状目录,可在系统内置分类与管理员创建的自定义分类间快速切换。
自定义敏感词管理动作
针对处于自定义目录下的词条,操作列提供以下管理功能:
操作项 | 执行逻辑与说明 |
|---|
预览 | 查看当前词条的适配语言、匹配规则及具体的配置内容等详细信息。 |
编辑 | 进入配置页面,修改词条的所有参数,包括匹配规则、命中次数、去重设置等。 |
创建副本 | 快速克隆当前词条。系统将生成一个配置完全一致的新条目,方便管理员基于现有逻辑快速衍生出新的匹配规则。 |
移动到.../批量移动 | 调整词条所属的自定义分类。管理员可将其迁移至其他已创建的自定义级目录下。 |
删除/批量删除 | 永久移除某个/某些敏感词条。注意:若该词条正被某些“云应用管控”策略引用,删除后对应的策略逻辑将因失去匹配依据而失效,请在操作前确认策略关联情况。 |
应用词库
完成敏感词库的定义与配置后,管理员需将其关联至具体的管控策略,方可对终端外发的文本内容执行审计或阻断。请前往安全 Web 网关 > 云应用管控,在创建“应用保护策略”时,关联此处定义的敏感词库以开启深度内容检测。详情参看配置云应用管控策略。