Ответ 1
Sentiment Lexicon, в Университете Питтсбурга, может быть, то, что вам нужно. Это лексика около 8000 слов с положительным/нейтральным/отрицательным чувством. Он более подробно описан в этой статье и выпущен под GPL.
Мне было интересно, знает ли кто-нибудь, где я мог бы получить словари положительных и отрицательных слов. Я изучаю анализ чувств, и это очень важно.
Sentiment Lexicon, в Университете Питтсбурга, может быть, то, что вам нужно. Это лексика около 8000 слов с положительным/нейтральным/отрицательным чувством. Он более подробно описан в этой статье и выпущен под GPL.
Прибыв немного поздно, я просто заметлю, что словари имеют ограниченный вклад для анализа настроений. В некоторых предложениях, связанных с настроением, не содержится никакого слова "чувства" - например. "прочитайте книгу", которая может быть положительной в обзоре книги, в то время как негатив в обзоре фильма. Точно так же сентиментальное слово "непредсказуемое" может быть положительным в контексте триллера, но отрицательным при описании системы разломов Тойоты.
и есть еще много...
Источники:
Профессор Bing Liu предоставляет английский лексикон около 6800 слов, вы можете скачать форму по этой ссылке: Мнение Майнинг, анализ настроений и обнаружение спама мнения
В этой статье от 2002 г. описывается алгоритм для получения такого словаря из текстовых выборок автоматически, используя только два слова в качестве набора семян.
AFINN вы можете найти здесь, а также создать его динамически. Например, когда неизвестное + ve слово добавляет его с +1. Подобно банану, это новое слово + ve и появляется дважды, тогда оно станет +2.
Как много статей и данных, которые вы craws ваш словарь станет сильнее!
Каталог словарей Гарварда-IV http://www.wjh.harvard.edu/~inquirer/homecat.htm содержит как минимум два набора готовых к употреблению словарей для позитивной/отрицательной ориентации.
Вы можете использовать лексику чувств vader
from nltk.sentiment.vader import SentimentIntensityAnalyzer
sentence='APPle is good for health'
sid = SentimentIntensityAnalyzer()
ss = sid.polarity_scores(sentence)
print(ss)
он даст вам полярность предложения.
выход:
{'compound': 0.4404, 'neu': 0.58, 'pos': 0.42, 'neg': 0.0}