Ответ 1
Посмотрите, что вы думаете о версии в Apache Tika. Это предполагает, что вы хотите узнать, на каком языке текста, в отличие от желания создать парсер для языка программирования.
Есть ли какой-либо язык с открытым исходным кодом для Java? Найдено только для c/С++.
UPD:
Я говорю о человеческом текстовом языке. Пример:
Вход: Меня зовут Джон. Выход: английский.
Вход: Ich heisse John. Выход: немецкий.
Вход: Меня зовут Джон. Результат: русский.
Посмотрите, что вы думаете о версии в Apache Tika. Это предполагает, что вы хотите узнать, на каком языке текста, в отличие от желания создать парсер для языка программирования.
Textcat http://textcat.sourceforge.net/ не России, но это не обрабатывать следующее:
Я думаю, ANTLR в значительной степени стандартный.
Существует API обнаружения языков, который принимает текст через HTTP POST и возвращает JSON с обнаруженными языками и оценками. Он может использоваться с Java или любым другим языком программирования.