ANTLR4: обработка пробелов - программирование

Я видел много грамматик ANTLR, которые используют обработку пробелов следующим образом:

Таким образом, пробелы выбрасываются, соответственно отправляются на скрытый канал.

действительные входы "не истинны" или "не являются ложными", но также "nottrue", что не является желаемым результатом. Изменение грамматики на:

устраняет проблему, но я не хочу обрабатывать пробелы вручную в каждом правиле.

Как правило, я хочу иметь пробел между каждым токеном с некоторыми исключениями (например, "! true" не требует пробела между ними).

Ответы

Ответ 1

Добавить правило IDENTIFIER lexer для обработки слов, которые не являются ключевыми словами.

IDENTIFIER : [a-zA-Z]+;

Теперь текст nottrue - это единственный тег IDENTIFIER, который ваш парсер не будет принимать вместо отдельных ключевых слов в not true.

Убедитесь, что IDENTIFIER определяется после других ключевых слов. Лексер найдет, что оба NOT и IDENTIFIER соответствуют тексту NOT, и назначат тип токена первой, которая появляется в грамматике.