使用Python NLTK计算单词相似度遇问题：部分结果返回None

阿华AIGC实验室

2026-5-22

为什么wup_similarity比较location和located的Synset时返回None？

嘿，我来帮你理清这个问题——你看到的None其实是因为你在**跨词性（名词<->动词）**比较WordNet的Synset，这刚好踩中了WUP（Wu-Palmer）相似度算法的核心限制！

问题根源

WordNet里的每个Synset都属于特定的词性（比如n代表名词，v代表动词），而且不同词性的Synset属于完全独立的语义层级树。WUP相似度的计算逻辑是找两个Synset在语义树中的共同上位词（hypernym），然后基于它们到共同上位词的路径长度来计算相似性。

但你看你的例子：

'location'的Synset都是名词（比如Synset('location.n.01')）
'located'的Synset都是动词（比如Synset('locate.v.01')）

名词和动词的语义树根本没有交集，算法找不到任何共同的上位节点，自然就返回None表示无法计算有效相似度。

解决办法

要得到有效的相似度数值，你需要确保比较的是相同词性的Synset，这里有两种可行的思路：

1. 筛选同词性的Synset进行比较

比如你可以直接指定词性来获取Synset，或者用对应的同词性词形来对比。举个例子，把location换成它的动词形式locate来和located的动词Synset比较：

from itertools import product
from nltk.corpus import wordnet

# 获取'locate'的动词Synset
syns_verb1 = wordnet.synsets('locate', pos=wordnet.VERB)
# 获取'located'的动词Synset
syns_verb2 = wordnet.synsets('located', pos=wordnet.VERB)

for s1, s2 in product(syns_verb1, syns_verb2):
    print(f"{s1} -- {s2}:")
    print(s1.wup_similarity(s2))

运行这段代码你会看到，同词性的Synset比较会返回正常的相似度数值——比如Synset('locate.v.01')和Synset('locate.v.01')的相似度是1.0，和Synset('situate.v.01')的相似度会接近1.0（因为它们是近义动词）。