Может ли алгоритм обнаруживать сарказм
Мне было предложено написать алгоритм обнаружения сарказма, но в логике я столкнулся с недостатком (или тем, что кажется одним).
Например, если человек говорит
A: Я люблю Джастина Бибера. Вам он нравится?
B: Да. Конечно. Я его абсолютно люблю.
Теперь это можно считать сарказмом или нет, и единственный способ узнать, похоже, знать, является ли B серьезным или нет.
(Я не должен был быть в глубине. Нам дали кучу фраз и просто сказали, что если они были в предложении, тогда это было саркастично, но меня заинтересовало?)
Есть ли способ обойти это? Или компьютеры абсолютно застревают, когда дело касается сарказма?
(я полагаю, это зависит от тона динамика, но мой ввод - текст)
Ответы
Ответ 1
Похоже, что есть исследования, которые пытались это сделать, но они еще не придумали хорошо работающий алгоритм.
Из González-Ibáñez, R. et al. "Идентификация сарказма в Twitter: более пристальный взгляд"
Сарказмы и ирония являются хорошо изученными явлениями в лингвистике, психологии и когнитивной науки [...]. Но в текстовом поиске литературы, автоматическое обнаружение сарказма считается сложным проблемы [...] и был рассмотрен лишь в нескольких исследованиях. [...] Работа, наиболее тесно связанная с нашей, - это работа Дэвидова и др. (2010), целью которого было выявление саркастических и не саркастических высказывания в Twitter и в обзорах продуктов Amazon. В этой статье мы рассмотрим несколько более сложную задачу - отличить саркастические твиты от неаркастических твитов
Они заключают:
Возможно, неудивительно, что ни судьи, ни судья методы обучения работают очень хорошо. [...] Наши результаты свидетельствуют о том, что одних только лексических признаков недостаточно для определения сарказма и что прагматические и контекстуальные признаки заслуживают дальнейшего изучения.
Вот еще одна недавняя актуальная статья:
Рейес, А. "От признания юмора до обнаружения иронии: филативный язык социальных сетей"
Ответ 2
... предложения написаны пользователями. Его симулированный разговор между двумя людьми.
Обнаружение сарказма почти невозможно с помощью одной фразы, но с контекстом это может быть немного более выполнимо. Предположим, что вы можете разобрать предложение и интерпретировать его буквальное значение (а не тривиальную задачу, но эта проблема была решена хотя бы несколько).
Теперь у вас есть контекст:
- Все фразы в разговоре.
- Ответ другого докладчика.
Фразы с перекрестными ссылками
Чтобы использовать # 1, вы можете перекрестно ссылаться на все фразы друг с другом. Являются ли они противоречивыми?
Пример:
Спикер 1: Я ЛЮБЛЮ Джастина Бибера. Вы?
Спикер 2: Полностью! Я люблю его.
Спикер 1: Что вы любите в нем?
Спикер 2: Его потрясающая музыка!
Спикер 1: Действительно? Какая ваша любимая песня?
Спикер 2: Пойдем, ты же знаешь, я ненавижу его музыку.
Мы знаем, что есть две противоречивые фразы: "Я люблю его!" и "Я ненавижу его музыку". Там был хотя бы случайный сарказм.
Вопрос или ответ от других спикеров (-ов)
Подход №2 может быть более эффективным (или бесполезным... возможно, сарказм известен, но невысказанный между двумя сторонами).
Пример:
Спикер 1: Джастин Бибер находится в городе. Я его буду видеть.
Спикер 2: Ха.
Другой пример:
Спикер 1: Я ЛЮБЛЮ Джастина Бибера. Вы?
Спикер 2: У меня есть гигантский плакат над моей кроватью.
Спикер 1: Да, правильно.
Получив еще более подробную информацию, вы можете применить эвристику, чтобы определить, насколько резко разговор отклоняется после определенной фразы.
Спикер 1: Я настолько полностью в Джастин Бибер!!! Вы?
Спикер 1 сделал решительное выражение
Спикер 2: Да, конечно.
<Суб > сарказм. Мы этого не знаем, но другой человек в разговоре.
В каком направлении сейчас идет Speaker 1? они меняют предмет? В зависимости от того, насколько резко разворачивается разговор, это может указывать, как они реагировали на воспринимаемый ответ.
Все, что было сказано, большая часть этого потребует сложной обработки, и я бы ожидал очень низкой точности в лучшем случае. Но это увлекательный вопрос.
Ответ 3
Сарказм действительно о тон, в котором сказано, текст не содержит вокальный тон, также насколько возможно утверждение о том, чтобы быть истинным, также может определить, является ли его сарказм...
Если входы набираются пользователями, вы можете сделать это двумя способами.
Один основан на том, что они пишут с использованием интернет-линга.
Например:
Пользователь может ввести:
"Yeah. Sure. I absolutely love him. /sarcasm"
Вы могли бы поискать такие ключевые слова, как /sarcasm
[/sarcasm]
и т.д.
В качестве альтернативы вы можете использовать статистические коэффициенты:
"Yeah, and I'm the president of USA"
.... статистические шансы на то, что он фактически правильный, настолько низки, что его можно было бы помечать как сарказм.
Ответ 4
Так что же такое сарказм с точки зрения культуры или языка? Если вы хотите решить эту сложную проблему, вы должны уточнить это. Проблема очень сложная, поскольку требует использования ИИ в терминологии какого-либо человеческого языка. Вы можете посмотреть A.L.I.C.E. для какого-то вдохновения.