Регулярные выражения Python: как получить доступ к нескольким совпадениям группы?

Я собираю довольно сложное регулярное выражение. Одна часть выражения соответствует строкам, таким как "+ a", "-57" и т.д. A + или a, за которым следует любое количество букв или цифр. Я хочу совместить 0 или более строк, соответствующих этому шаблону.

Если бы я искал строку '-56 + a', используя этот шаблон, я бы ожидал получить два совпадения:

Однако, я получаю только последнее совпадение:

Посмотрев на документы python, я вижу следующее:

Итак, мой вопрос: как вы получаете доступ к нескольким групповым совпадениям?

Ответы

Ответ 1

Отбросьте * из своего регулярного выражения (так что он соответствует точно одному экземпляру вашего шаблона). Затем используйте либо re.findall(...), либо re.finditer (см. здесь), чтобы вернуть все совпадения.

Update:

Похоже, вы, по сути, создаете рекурсивный синтаксический анализатор . Для относительно простых задач синтаксического анализа довольно часто и вполне разумно делать это вручную. Если вы заинтересованы в решении библиотеки (например, если ваша задача синтаксического анализа может усложниться позже), посмотрите pyparsing.

Ответ 2

Модуль regex устраняет это, добавляя метод .captures:

>>> m = regex.match(r"(..)+", "a1b2c3")
>>> m.captures(1)
['a1', 'b2', 'c3']