如何用Python匹配‘I am’后接单个-ing结尾单词的内容？

阿华AIGC实验室

2026-5-19

解决Python正则匹配“I am [ing结尾单词]”的问题

你的问题很典型，原来的正则表达式因为用了贪婪的.*，会把“I am”之后到最后一个“ing”之间的所有内容都匹配到，自然会错误命中长句子里的内容。要实现只匹配“I am”后面紧跟一个以ing结尾的单个单词的情况，我们可以通过限制单词边界和匹配规则来解决：

方案1：匹配整个句子（严格匹配）

如果你的需求是整个字符串就是“I am + ing结尾单词”（比如输入就是单独的“I am dancing”），可以用带行首行尾锚点的正则：

import re

# 正则模式：行首必须是"I am "，后面跟一个以ing结尾的单词，然后到行尾
pattern = r'^I am \w+ing$'

test_strings = [
    "I am dancing",   # 应该匹配
    "I am walking",   # 应该匹配
    "I am a student and I like dancing",  # 不匹配
    "I am singing in the park"  # 不匹配，因为后面有额外内容
]

for s in test_strings:
    if re.fullmatch(pattern, s):
        print(f"✅ 匹配成功：{s}")
    else:
        print(f"❌ 匹配失败：{s}")

这个正则里的关键部分：

^ 和 $：分别锚定字符串的开头和结尾，确保整个字符串符合规则，不会匹配长句子里的片段
\w+：匹配一个或多个字母、数字或下划线（如果需要支持带连字符的单词，比如“I am ice-skating”，可以改成[\w-]+）
ing：固定结尾，确保单词是以ing结尾的

方案2：在文本中查找符合规则的短语

如果你的需求是在一段文本中找到所有“I am + ing结尾单词”的短语（而不是整个句子），可以用带单词边界的正则：

import re

pattern = r'\bI am (\w+ing)\b'
text = "I am dancing. She says I am walking, but I am a student and I like dancing."

matches = re.findall(pattern, text)
print("找到的ing结尾单词：", matches)  # 输出：['dancing', 'walking']

这里的\b是单词边界，确保“I am”后面的内容是一个完整的单词，不会把长句子里的“dancing”（前面不是紧跟“I am”）匹配进来。