Программное обеспечение распознавания голоса для разработчиков
Ну, наконец, документы сказали это, мне нужно немного успокоиться на моем запястье в течение нескольких месяцев. Будучи тем, что я .NET Developer, это может закончиться моей жизнью на некоторое время, что я не хочу делать. Тем не менее, есть ли хорошие варианты громкой связи для разработчиков? Кто-нибудь успешно использовал какое-либо программное обеспечение для распознавания речи?
POSTSCRIPT: Я снова поправил руку до такой степени, что двуручное программирование не является проблемой. Дракон Естественно, работал достаточно хорошо, но был медленнее, не так, как клавиатура, где я программировал быстрее, чем я думал.
Ответы
Ответ 1
Он там, и он работает...
Существует довольно много программ распознавания речи, из которых Dragon NaturallySpeaking является, я думаю, одним из наиболее широко используемых. Я использовал его сам и был впечатлен его качеством. Это было пару лет назад, я думаю, что до сих пор все еще улучшилось.
... но это непросто...
Несмотря на то, что он работает удивительно хорошо, я не буду говорить, что это простое решение. Для подготовки программы требуется время, и даже тогда это будет делать ошибки. Это кропотливо медленнее по сравнению с типированием, поэтому мне пришлось постоянно говорить себе: "Не хватай клавиатуру, не хватай клавиатуру..." (после чего я все равно хватаю клавиатуру). Я сам склонен немного бормотать, что не улучшило ситуацию:-). Особенно первые недели могут расстраивать. Вы даже можете получить проблемы с голосом, если вы слишком сильно меняете свой голос.
... особенно для программистов!
В целом, это, безусловно, приемлемое решение для людей, которые пишут обычный текст/прозу. Как программист, вы находитесь в совершенно другой сфере, для которой нет реальных решений. Возможно, теперь все изменилось, но я был бы удивлен, если бы они были.
Какая проблема? Большинство программных средств SR созданы для распознавания нормального языка. Программисты пишут очень загадочные вещи, и трудно, если не невозможно, найти программное обеспечение, которое выполняет преобразование между нормальным языком и кодом. Например, как бы вы диктовали:
if (somevar == 'a')
{
print('You pressed a!');
}
Используя команды в вашей средней программе SR, это огромная боль: "если пробел оставил скобку, равный знаку, равный знак апострофа, заклинание апострофа...". И я даже не говорю о навигации по вашему коду. Вы когда-нибудь замечали, как много вы используете клавиатуру во время программирования, и насколько отличается от использования обычным пользователем клавиатуры?
Как сделать все возможное
До сих пор я работал только с Dragon NaturallySpeaking (DNS), поэтому я могу говорить только за этот продукт. Есть несколько интересных дополнений и веб-сайтов, предназначенных для таких людей, как программисты:
- Vocola - неофициальный плагин, который позволяет вам легко добавлять свои собственные команды в DNS. Я счел это необходимым, в основном. Вы также сможете находить наборы команд, написанные другими программистами, например. навигационный код. Он основан на программном пакете, написанном на Python, поэтому есть и несколько более продвинутых и привлекательных пакетов. Также проверьте Vocola Страница ресурсов. (Предупреждение: когда я использовал его, возникли некоторые проблемы с установкой Vocola, ознакомьтесь с новостной группой ниже для информации!)
- SpeechComputing.com - форум/группа новостей с большим количеством интересных обсуждений. Хорошее место для начала.
Заключительные замечания
Кажется, что наилучшим решением этой проблемы является:
- Найдите способы фактического кодирования.
- Попробуйте восстановить. Я несколько неохотно рекомендую эту книгу, но, похоже, она отлично работает для людей с RSI/carpal tunnel и другими проблемами хронической боли: J.E. Sarno, рецепт Mindbody. Я сейчас работаю над этим, и я думаю, что это определенно стоит прочитать.
Ответ 2
Я диктую VB.net и TSQL с помощью Dragon NaturallySpeaking 10 Professional. VB.net по своей сути ближе к "разговорному" языку, но я не вижу причин, почему он не мог работать на С# или других. Я начинаю с совершенно пустой лексики и строю ее с нуля, чтобы удовлетворить мои потребности (именно поэтому я использую профессиональную версию).
Вот основные этапы (предполагается, что вы уже создали и обучили пользователя):
- Создайте новый словарь на основе "Base General - Empty Dictation".
- Не проверяйте документы или электронную почту.
- Добавить списки ключевых слов с произношением, специфичным для вашего языка программирования (Dim, ByVal\by-val и т.д.).
- Создайте документ .txt, содержащий все ваши комментарии минус-код.
- Убирайте слова из этого документа и добавляйте их с произношениями.
- Используйте документ для обучения языковой модели словаря.
Я напишу что-то более подробно, когда у меня появится шанс, если кто-то заинтересован.
Edit:
Вот как диктовать код SQL. Список слов, созданный здесь, может быть включен в другие словари, если вы разработчик базы данных.
Ответ 3
Отъезд Использование Python для кодирования по голосу.
Ответ 4
Еще одна идея - найти другого хорошего разработчика для совместной работы с программой. Это сработало очень хорошо для меня. Я получаю, чтобы отдохнуть руками, не обязательно замедляя работу, в конечном итоге создавая более качественный код - или, по крайней мере, не нужно пересматривать его.
Ответ 5
Для всех пользователей Linux я хотел бы поделиться некоторыми ссылками.
Начните с Simon - программное обеспечение для распознавания речи с открытым исходным кодом:
и некоторые другие:
и
Ответ 6
Я знаю, что я немного не по теме, и ничего не знаю о программном обеспечении для распознавания голоса; однако вам может показаться полезным исследовать изменение клавиатуры на макет Dvorak, о котором я слышал, гораздо больше на запястьях.
http://en.wikipedia.org/wiki/Dvorak_Simplified_Keyboard
Ответ 7
Я попробовал Дракона пару лет назад, и это был кошмар из раздутых слов и фраз - не рекомендуется. Я понимаю, что это было самое лучшее, что происходит в этот момент времени, поэтому я не оптимист.
Как человек-страдальщик, рекомендации будут следующими:
- Найдите работу, которая требует как можно меньше OT
- Попробуйте различные клавиатуры. По моему опыту, работа на ноутбуке с полной занятостью работала лучше всего.
- Начните программу тяжелой атлетической атлетики.
Ответ 8
Что касается проблемы с запястьем, я узнал, что с помощью мыши обеими руками около 10 лет назад.
Это удивительно легко и существенно облегчает натяжение. В настоящее время я использую ноутбук и нажатие кнопки тачпада напрягает мой большой палец.
Будьте осторожны. Эти проблемы могут длиться дольше, чем можно было бы подумать.
p.s. вы можете добавить тег "эргономика" или что-то в этом роде - название может рассматриваться как разработка для распознавания голоса.
Ответ 9
Как упоминалось выше, Dragon Naturally Speaking является лучшим программным обеспечением для распознавания речи, однако Microsoft Speech Recognition не отстает и поставляется вместе с Vista.
Недавно Vocola был перенесен в MSR и имеет функцию интеграции .Net.
Несколько советов
- Обучение диктованию требует определенного времени. Просто потому, что вы можете говорить, это не значит, что вы знаете, как использовать программное обеспечение для распознавания речи.
- Получение опыта с сочетанием SR и клавиатуры/мыши намного проще, чем полная работа в режиме громкой связи.
- Используйте CodeRush или эквивалент типа less.
Ответ 10
Золотой стандарт для программирования голосом VoiceCode. Если я правильно помню, они поддерживают С++ и Python.
Ответ 11
Я начал использовать свою левую руку для мыши, это не только помогло мне немного, но и позволило мне использовать мою правую руку более свободно, если вы напишете много материала dwon, пока вы это кодируете, это вам очень помогает. вы можете прокручивать и записывать одновременно...
Когда начались мои проблемы, я поставил под мой запястье мешок с водой, мне понравилось! сумка у меня была идеальная, она была длинной, и я положил ее перед клавиатурой, чтобы я мог одеть мои запястья там.... пока однажды не наступит на нее...
Ответ 12
Дракон Естественно Говоря Предпочтительный и Vocola. Autohotkey для автоматизации в максимально возможной степени. Нелегко программировать. Я пытался; почти невозможно. Отъезд Джон Сарно Лечение боли в спине. Это сделало меня лучше. Я возвращаюсь к программированию весь день!
Ответ 13
Еще один бит вне темы здесь, я обнаружил, что расщепленный кебар на две части и другие специальные клавиатуры помогают, просто проверьте кинезис. Я собрал информацию о таком оборудовании в режиме diigo:
Как насчет прямых ссылок:
Еще одна вещь! Помните о перерывах в упражнениях. Регулярные упражнения (например, небольшие упражнения - каждая половина
и час другой) сделать действительно действительно лучше!
Ответ 14
Scott Hanselman использует распознавание голоса довольно немного.
Ответ 15
Я использовал Dragon Dictate в 1996 году по той же причине, что и вы. Это было медленно, но лучше, чем не работать. Мне было проще писать код, заполнив белую доску 4x8 кодом, а затем заставляя кого-то еще вводить ее. Затем я использовал DD для отладки.
И пока вы на нем, вы можете посмотреть книги Дебора Култерта о RSI. Они очень информативны.
Ответ 16
Я не могу найти ссылку на один (я действительно смотрел), но есть клавиатура с 5 ключами, позволяющая вводить одну руку, я предполагаю, что у вас только одно плохое запястье.
Если я найду ссылку, я попытаюсь сообщить вам.