Ответ 1
В настоящее время вы пытаетесь загрузить каждый элемент в nltk-данных, так что это может занять много времени. Вы можете попробовать загрузить только те стоп-слова, которые вам нужны:
import nltk
nltk.download('stopwords')
Я пытаюсь импортировать пакет nltk в python 2.7
import nltk
stopwords = nltk.corpus.stopwords.words('english')
print(stopwords[:10])
Выполнение этого дает мне следующую ошибку:
LookupError:
**********************************************************************
Resource 'corpora/stopwords' not found. Please use the NLTK
Downloader to obtain the resource: >>> nltk.download()
Итак, поэтому я открываю свой python termin и делал следующее:
import nltk
nltk.download()
Что дает мне:
showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml
Однако это, похоже, не останавливается. И запустить его снова по-прежнему дает мне ту же ошибку. Любые мысли, где это идет не так?
В настоящее время вы пытаетесь загрузить каждый элемент в nltk-данных, так что это может занять много времени. Вы можете попробовать загрузить только те стоп-слова, которые вам нужны:
import nltk
nltk.download('stopwords')
Некоторые из них были упомянуты здесь Куртом Бурбаки, но в командной строке:
python -m nltk.downloader stopwords
Вы можете сделать это отдельно в консоли.
Это даст вам результат.
import nltk
nltk.download('stopwords')
Я использовал консоль Jupyter, когда столкнулся с этой проблемой.
Если ваш компьютер использует прокси для подключения, попробуйте следующее:
import nltk
nltk.set_proxy('http://proxy.example.com:3128', ('USERNAME', 'PASSWORD'))
nltk.download('stopwords')
Вы можете ввести это в командной строке для Python 3:
python3 -m nltk.downloader stopwords
Просто запустите эту команду в своем ноутбуке ipython (или любом другом текстовом редакторе /IDE, который вы используете):
import nltk
nltk.download('stopwords')
Он автоматически загрузит файл stopword
и распакует его в требуемый каталог.
введите в командной строке, если вы установили Python 3.
>>python
>>import nltk
это проверить, установлен ли у вас nltk в противном случае установите его с помощью
>>pip install nltk
тогда, если вы хотите установить только каталог стоп-слов, используйте
>>python -m nltk.downloader stopwords
это займет меньше времени по сравнению с установкой всего пакета затем
>> import nltk
>> nltk.download('punkt')
после этого вы готовы использовать стоп-слова в вашем компиляторе