скачивание ошибку, используя в nltk.скачать()
я экспериментирую с пакетом NLTK, используя Python. Я попытался загрузить NLTK, используя nltk.download()
. Я получил такое сообщение об ошибке. Как решить эту проблему? Спасибо.
система, которую я использовал, Ubuntu установлена под VMware. IDE-это Spyder.
после использования nltk.download('all')
, он может скачать некоторые пакеты, но он получает сообщение об ошибке при загрузке oanc_masc
2 ответов
чтобы загрузить определенный набор данных / модели, используйте nltk.download()
функция, например, если вы хотите скачать punkt
предложение tokenizer, использовать:
$ python3
>>> import nltk
>>> nltk.download('punkt')
если вы не уверены, какие данные / модель вам нужны, вы можете начать с основного списка данных + моделей с:
>>> import nltk
>>> nltk.download('popular')
он загрузит список "популярных" ресурсов.
убедитесь что у вас последняя версия NLTK
потому что он всегда улучшается и постоянно поддерживать:
$ pip install --upgrade nltk
редактировать
в случае, если кто-то избегает ошибок при загрузке больших наборов данных из nltk
, от https://stackoverflow.com/a/38135306/610569
$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python
>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')
и если кто-то хочет найти nltk_data
каталог, см. https://stackoverflow.com/a/36383314/610569
и в config nltk_data
путь, см. https://stackoverflow.com/a/22987374/610569
из командной строки после импорта nltk попробуйте
nltk.download('popular', halt_on_error=False)
после ошибки он попросит повторить попытку сломанного пакета, просто отклонить с n, и он продолжит работу с правильными пакетами.