Ответ 1
Чтобы загрузить конкретный набор данных/моделей, используйте функцию nltk.download()
, например. если вы хотите загрузить токенизатор предложения punkt
, используйте:
$ python3
>>> import nltk
>>> nltk.download('punkt')
Если вы не знаете, какие данные/модель вам нужны, вы можете начать с основного списка данных + моделей с помощью:
>>> import nltk
>>> nltk.download('popular')
Он загрузит список "популярных" ресурсов.
Убедитесь, что у вас установлена последняя версия NLTK
, потому что она всегда улучшает и постоянно поддерживает:
$ pip install --upgrade nltk
EDITED
Если кто-то избегает ошибок при загрузке больших наборов данных из NLTK
, из fooobar.com/questions/228305/...
$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python
>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it already installed.
>>> dler.download('popular')
И если кто-то хочет найти каталог nltk_data
, см. fooobar.com/questions/107598/...
И для config nltk_data
путь, см. fooobar.com/questions/107595/...