Как сделать словарь слов из gensim word2vec?
Я использую пакет gensim word2vec в python. Я знаю, как получить словарный запас от обученной модели. Но как получить количество слов для каждого слова в словаре?
1 ответов
каждое слово в словаре имеет связанный объект словаря, который содержит индекс и счетчик.
vocab_obj = w2v.vocab["word"]
vocab_obj.count
выход для Google news w2v модель: 2998437
таким образом, чтобы получить количество для каждого слова, вы будете перебирать все слова и объекты vocab в словаре.
for word, vocab_obj in w2v.vocab.items():
#Do something with vocab_obj.count