Учебники для обработки естественного языка
Недавно я посетил класс coursera о "обработке естественного языка", и я много узнал о разборе, IR и других интересных аспектах например Q & A и т.д., хотя я хорошо разбирался в концепциях, но на самом деле я практически не знал об этом. Может ли кто-нибудь предложить мне хорошие онлайн-учебники или книги для обработки естественного языка?
Спасибо
Ответы
Ответ 1
Вы можете прочитать Jurafsky и Martin Речь и обработка языка (издание 2008 г.), который является стандартным учебником в этой области. Это долго и имеет множество тем, поэтому я бы предложил прочитать только главы, которые действительно применимы к вашим интересам.
Кроме того, лучший способ узнать - это почти наверняка на самом деле реализовать алгоритмы НЛП с нуля. Вы могли бы выбрать некоторые стандартные задачи (языковое моделирование, классификация текста, маркировку POS, NER, синтаксический анализ) и реализовать различные алгоритмы с нуля (модели ngram, HMM, Naive Bayes, MaxEnt, CKY), чтобы действительно понять, что заставляет их работать. Также не должно быть слишком сложно найти какой-либо бесплатный набор данных для тестирования ваших реализаций.
Наконец, есть много учебников для конкретных алгоритмов НЛП, которые превосходны. Например, если вы хотите создать HMM, я предлагаю учебник Jason Eisner, который также охватывает сглаживание и неконтролируемое обучение с помощью EM. Если вы хотите внедрить выборку Gibbs для неконтролируемого обучения Naive Bayes, я предлагаю учебник Philip Resnik.
Ответ 2
Помимо книги Юрафского и Мартина, Кристофер Д. Мэннинг и Хинрих Шютце Основы статистической обработки естественного языка также широко используются. Для IR Manning et al. также написал Введение в информационный поиск, который можно прочитать или скачать онлайн на своем сайте.
Ответ 3
Если вам нужны практические знания о том, как вы можете работать на естественном языке, вы должны начать его реализацию.
Я предлагаю использовать NLTK (набор инструментов для создания естественного языка) с Python. Его легко реализовать NLP в python.
Вы можете ссылаться на эту ссылку
http://nltk.org/
Или вы можете попробовать его онлайн
http://cst.dk/online/pos_tagger/uk/
Ответ 4
Вместо того, чтобы читать определенную книгу, погружение в море бумаг может быть хорошей идеей. http://www.aclweb.org, например, содержит много тем в НЛП. Через эти документы вы получаете ссылки на другие документы, некоторые из которых являются основами определенной отрасли НЛП. И поскольку они были написаны разными авторами, вы вряд ли сильно повлияете на одну точку зрения.
Ответ 5
Если вы разработчик Java, существует обширный список учебников по созданию компонентов систем НЛП с использованием LingPipe по адресу http://alias-i.com/lingpipe/demos/tutorial/read-me.html. Полное раскрытие Я написал некоторые из этих учебников и одну из приведенных ниже книг.
Есть несколько книг, которые более ориентированы на индустрию:
1) Обработка естественного языка с помощью Java Ричардом М Риз
Здесь описывается, как выполнять некоторые общие задачи с помощью набора инструментов с открытым исходным кодом (включая LingPipe).
2) Обработка естественного языка с помощью Java и LingPipe Cookbook Paperback
Брек Болдуин, Кришна Даянидхи
Эта книга задана на уровне "получить компонент, построенный" и охватывает основные технологии, управляющие большинством НЛП-систем, которые основаны на тексте. Он не охватывает перевод. Это более подробно, чем первая книга, и имеет более широкий охват, чем учебники LingPipe, но иногда менее детализирован, чем учебники.
Брек
Ответ 6
Существует учебный центр для учебных и учебных материалов, называемый TeLeMaCo. Вы можете найти ресурсы для многих аспектов НЛП, и вы можете легко добавить больше материалов, которые вы нашли в Интернете.