Autodetect язык текста в Java (Android)
Для моего приложения я хотел бы, с учетом текста, определить его язык (например, код ISO и шанс). Я хотел бы знать, есть ли какой-либо веб-сервис или java-библиотека для этого.
Заранее спасибо
Ответы
Ответ 1
Автоматическое обнаружение естественного языка текста относительно легко с использованием алгоритма анализа bigram. Вы можете либо реализовать его самостоятельно, либо просто использовать некоторую существующую библиотеку, например. Language-Detection проект.
Ответ 2
Microsoft Translator несколько API-интерфейсов, включая HTTP API, - вы должны иметь возможность использовать его и Метод обнаружения
К сожалению, Google Translate не является вариантом.
Ответ 3
Google Translate имеет API
Ответ 4
Google Translate, который устарел, был заменен на Google Translate v2 API, который теперь является платной услугой ($ 20/1M chars). (слово на улице - это то, что бесплатный сервис был отменен из-за того, что оптимизаторы SEO использовали его для установки поддельных сайтов).
Ответ 5
Мое решение проблемы обнаружения языка на Android доступно в Интернете.
Он адаптирует существующую систему определения языка Java на основе n-граммов для ускорения работы с использованием жестко запрограммированных языковых профилей вместо загрузки профилей из JSON текстовые файлы.