下面是一个使用Python中的gensim库训练Word2Vec模型并计算词相似度的代码示例:
from gensim.models import Word2Vec
# 定义语料库,这里以一个简单的句子列表为例
sentences = [['I', 'love', 'coding'],
['coding', 'is', 'fun'],
['Python', 'is', 'awesome']]
# 训练Word2Vec模型
model = Word2Vec(sentences, min_count=1)
# 计算词语相似度
similarity_score = model.wv.similarity('coding', 'Python')
print(f"词语相似度: {similarity_score}")
在这个示例中,我们首先定义了一个简单的句子列表作为语料库。然后使用Word2Vec
类训练模型,min_count
参数表示最低词频阈值。之后,我们可以使用训练好的模型通过wv.similarity()
方法来计算两个词语的相似度。
注意:在实际应用中,通常会使用更大规模和更多复杂的语料库来训练Word2Vec模型,以获得更准确和有意义的结果。
内容由零声教学AI助手提供,问题来源于学员提问