gensim word2vec: найти количество слов в словаре

после обучения модели word2vec с использованием python gensim, Как вы находите количество слов в словаре модели?

1 ответов


словарь в vocab поле модели Word2Vec wv свойство, как словарь, с ключами, являющимися каждым токеном (словом). Таким образом, это просто обычный Python для получения длины словаря:

len(w2v_model.wv.vocab)

(в более старых версиях gensim до 0.13,vocab появился непосредственно на модели. Таким образом, вы будете использовать w2v_model.vocab вместо w2v_model.wv.vocab.)