API распознавания звука, SDK (Android)
Мне нужно сделать приложение для Android, которое может распознать определенные звуковые файлы, созданные мной, и выполнить действие по распознаванию. Так что что-то похожее на Shazam/Soundhound, но с моими собственными звуковыми файлами.
Есть ли API или SDK или что-то в этом роде?
Я читал об Echoprint, но я понимаю, что это для Windows и iOS, и мне кажется, что это довольно сложно. Будет ли это работать? Или есть другие варианты?
PS: Чтобы было ясно, я не хочу распознавать голос или текст в речь. Мои звуковые файлы могут содержать музыку, искаженный голос, эффекты и т.д.
Ответы
Ответ 1
Через год я закончил использование Echoprint для Android, как описано здесь. Он получает некоторые результаты, но в целом он работает довольно плохо, особенно с пользовательскими звуковыми файлами. Echoprint не предназначен для распознавания OTA. Я бы рекомендовал его для тестирования/прототипирования, но не для производства. К сожалению, пока это единственный, позволяющий вам иметь собственные серверные и звуковые файлы.
Ответ 2
ACRCloud поддерживает поисковую систему Music/Audio, поддерживается 50 миллионов песен/контент для загрузки пользователей, SDK для iOS/Android/Linux, который можно загрузить после регистрации (http://console.acrcloud.com/signup). Для клиентов существует три уровня:
- Свободный уровень для демонстрации/прототипирования
- Ускоряющий уровень, для стартапов
- Коммерческий уровень
пожелайте, чтобы это помогло