使用正则表达式处理特定词表的连字符增删（英美英语）

使用正则表达式处理特定词表的连字符增删（英美英语）

阿华AIGC实验室

2026-5-7

解决指定词对连字符移除的单正则方案

嘿，这个需求我之前批量处理文档格式时也碰到过，既要用单正则搞定，又不能出现错误匹配，给你两个亲测有效的方案：

方案一：精确分支捕获组（兼容大多数编辑器）

这个方案直接把每个合法词对作为独立分支，用捕获组锁定前缀和后缀，替换时自动拼接匹配到的内容：

查找正则：

\b(afore)-(mention)\b|\b(base)-(line)\b|\b(start)-(up)\b

替换内容：

$1$2$3$4$5$6

原理：

\b是单词边界，避免匹配到单词中间的片段（比如xafore-mention）
每个分支只匹配固定配对的词对，比如afore只能和mention绑定，不会和line产生错误匹配
替换时，未匹配到的捕获组会自动为空，只会拼接当前分支的前缀和后缀，比如匹配base-line时，$1$2$5$6都是空，最终输出baseline

方案二：正向预查绑定（更简洁）

这个思路是先匹配前缀，同时通过正向预查确保后面跟着对应的后缀连字符，然后直接移除连字符：

查找正则：

\b(afore)(?=-mention)|(base)(?=-line)|(start)(?=-up)-

替换内容：

$1$2$3

原理：

(?=-xxx)是正向预查，只匹配后面紧跟-xxx的前缀，比如afore只有在后面是-mention时才会被选中
最后匹配连字符-，替换时只保留前缀（$1/$2/$3），相当于直接删掉合法配对的连字符
完全避免错误匹配，比如afore-line里的afore后面是-line，不符合预查条件，不会被处理

额外提示

如果文本里有大小写变体（比如Afore-Mention），可以在正则开头加(?i)开启忽略大小写模式
这两个方案都可以直接在VS Code、Sublime Text、Notepad++等主流编辑器的查找替换中使用，不需要额外脚本

内容的提问来源于stack exchange，提问作者Randy

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠