Как сделать словарь слов из gensim word2vec?

Я использую пакет gensim word2vec в python. Я знаю, как получить словарный запас от обученной модели. Но как получить количество слов для каждого слова в словаре?

1 ответов


каждое слово в словаре имеет связанный объект словаря, который содержит индекс и счетчик.

vocab_obj = w2v.vocab["word"]
vocab_obj.count

выход для Google news w2v модель: 2998437

таким образом, чтобы получить количество для каждого слова, вы будете перебирать все слова и объекты vocab в словаре.

for word, vocab_obj in w2v.vocab.items():
  #Do something with vocab_obj.count