You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

技术问询:如何匹配包含特定单词的不同句式句子

提取文本中含特定单词的句子解决方案

嘿,这事儿其实没那么复杂,咱们一步步来搞定它:

核心思路

先把整段文本拆成独立的句子,再逐个检查句子里有没有你要找的特定单词,最后把符合条件的句子捞出来就行。

具体操作(以你的示例文本为例)

假设咱们要找含毁灭这个词的句子:

  • 第一步:拆分句子。中文句子一般以 这类标点结尾,咱们可以用这些标点把文本拆成句子列表;要是英文文本,就用. ! ?来拆分。
  • 第二步:筛选匹配。遍历每个句子,判断目标单词是否在句子里;如果是英文场景,记得考虑大小写问题,比如把句子和目标词都转成小写再匹配。
  • 第三步:收集结果。把符合条件的句子整理出来就行。

代码示例(Python)

要是想自动化处理,这段脚本就能帮你快速搞定:

# 你的示例文本
text = "进一步说明,以提供另一种模型。第二段的分析可引出如下方向。《The Destructors》显然围绕毁灭展开,而《Genesis》则围绕创造展开。词汇具有相似性:Blackie注意到‘混乱已加剧’,这是对上帝将形式赋予虚空的讽刺性逆转。"

# 要查找的特定单词
target_word = "毁灭"

# 拆分句子(这里用句号分割,复杂场景可以用正则匹配更精准的句子边界)
sentences = [s.strip() + "。" for s in text.split("。") if s.strip()]

# 筛选含目标单词的句子
matched_sentences = [sent for sent in sentences if target_word in sent]

# 输出结果
for sent in matched_sentences:
    print(sent)

运行这段代码后,输出结果就是:

《The Destructors》显然围绕毁灭展开,而《Genesis》则围绕创造展开。

小提示

如果遇到标点复杂的文本,比如有跨行句子、特殊符号,建议用正则表达式来拆分句子,比如中文可以用re.split(r'[。!?;]', text),这样拆分出来的句子会更准确。

内容的提问来源于stack exchange,提问作者Praneeth Tvss.

火山引擎 最新活动