Ответ 1
Вероятно, вы не должны пытаться делать что-либо особенное, даже если вы обнаружите, что работает прошивка. Даже если вы правильно это понимаете для одной группы пользователей, занимающихся прокруткой, вы можете ошибаться в другой группе. Лучше всего сосредоточиться на написании хорошего чистого HTML5 в первую очередь.
Обратите внимание, что не все пользователи экранного чтения используют текст в речь; много использование выход Брайля. Кроме того, другие типы средств обеспечения доступности, такие как элементы выделения контента и приложения для ввода голоса, используют те же методы и API (например, DOM, MSAA), которые делают прошивки, поэтому любой метод, который "обнаруживает сканер", скорее всего, также обнаружит их вы не можете предположить, что это означает, что пользователь полностью слеп и использует только речь.
В настоящее время звуковой тег в настоящее время не универсально доступен, разные браузеры имеют разные уровни поддержки доступности - см. HTML5 Доступность и прокрутка до звука для получения более подробной информации о текущей поддержке. Я видел некоторые страницы, которые добавляют элементы управления на основе HTML5 плюс javascript после тега аудио, чтобы они могли предоставить свой собственный пользовательский интерфейс, чтобы пользователи клавиатуры или экрана могли воспроизводить/останавливать звук по мере необходимости. (В конце концов, когда браузеры догоняют, это не требуется.)
Что касается общей доступности, WCAG 2.0 (Руководства по доступности веб-контента) рекомендует, чтобы любой звук, который воспроизводится автоматически более 3 секунд, должен имеют доступные средства для приостановки или остановки звука. (Я бы пошел еще дальше и не рекомендую использовать любое автоматическое аудио - при использовании просмотра с вкладками часто невозможно определить, с какой вкладки поступает звук.)