скачивание ошибку, используя в nltk.скачать()

я экспериментирую с пакетом NLTK, используя Python. Я попытался загрузить NLTK, используя nltk.download(). Я получил такое сообщение об ошибке. Как решить эту проблему? Спасибо.

система, которую я использовал, Ubuntu установлена под VMware. IDE-это Spyder.

enter image description here

после использования nltk.download('all'), он может скачать некоторые пакеты, но он получает сообщение об ошибке при загрузке oanc_masc

enter image description here

2 ответов


чтобы загрузить определенный набор данных / модели, используйте nltk.download() функция, например, если вы хотите скачать punkt предложение tokenizer, использовать:

$ python3
>>> import nltk
>>> nltk.download('punkt')

если вы не уверены, какие данные / модель вам нужны, вы можете начать с основного списка данных + моделей с:

>>> import nltk
>>> nltk.download('popular')

он загрузит список "популярных" ресурсов.

убедитесь что у вас последняя версия NLTK потому что он всегда улучшается и постоянно поддерживать:

$ pip install --upgrade nltk

редактировать

в случае, если кто-то избегает ошибок при загрузке больших наборов данных из nltk, от https://stackoverflow.com/a/38135306/610569

$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python

>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')

и если кто-то хочет найти nltk_data каталог, см. https://stackoverflow.com/a/36383314/610569

и в config nltk_data путь, см. https://stackoverflow.com/a/22987374/610569


из командной строки после импорта nltk попробуйте

nltk.download('popular', halt_on_error=False)

после ошибки он попросит повторить попытку сломанного пакета, просто отклонить с n, и он продолжит работу с правильными пакетами.