Ответ 1
Извлечение информации
(IE) - задача автоматического извлечения структурированной информации из неструктурированных и/или полуструктурированных машиночитаемых документов. В большинстве случаев эта деятельность касается обработки текстов на языке человека посредством обработки естественного языка (НЛП). Недавние действия в обработке мультимедийных документов, таких как автоматическая аннотация и извлечение содержимого из изображений/аудио/видео, можно рассматривать как извлечение информации.
Text Mining
- это деятельность по получению информационных ресурсов, относящихся к информационной потребности из набора информационных ресурсов. Поиски могут основываться на метаданных или на полнотекстовом индексировании.
Текстовая обработка - обширная область по сравнению с поиском информации. Типичные задачи интеллектуального анализа текста включают классификацию документов, кластеризацию документов, построение онтологии, анализ настроений, обобщение документов, извлечение информации и т.д. Где, как поиск информации, как правило, имеет дело с обходом, анализом и индексированием документа, извлечением документов.