Ответ 1
Несколько примечательных примечаний.
-
Если вы собираетесь проверять членство в списке снова и снова, я бы использовал набор вместо списка.
-
stopwords.words('english')
возвращает список строчных стоп-слов. Весьма вероятно, что ваш источник имеет заглавные буквы и не подходит по этой причине. -
Вы не читаете файл правильно, вы проверяете объект файла, а не список слов, разделенных пробелами.
Объединяя все это:
import nltk
from nltk.corpus import stopwords
word_list = open("xxx.y.txt", "r")
stops = set(stopwords.words('english'))
for line in word_list:
for w in line.split():
if w.lower() not in stops:
print w