Как анализировать несколько вложенных подкоманд с помощью python argparse?

Я реализую программу командной строки с таким интерфейсом:

cmd [GLOBAL_OPTIONS] {command [COMMAND_OPTS]} [{command [COMMAND_OPTS]} ...]

Я просмотрел документацию argparse. Я могу реализовать GLOBAL_OPTIONS как необязательный аргумент, используя add_argument в argparse. И {command [COMMAND_OPTS]}, используя Sub-commands.

Из документации кажется, что у меня может быть только одна подкоманда. Но, как вы видите, мне нужно реализовать одну или несколько подкоманд. Каков наилучший способ проанализировать такие аргументы командной строки, используя argparse?

Ответы

Ответ 1

@mgilson имеет приятный ответ на этот вопрос. Но проблема с расщеплением sys.argv заключается в том, что я теряю все приятное справочное сообщение, которое Argparse генерирует для пользователя. Поэтому я закончил это:

import argparse

## This function takes the 'extra' attribute from global namespace and re-parses it to create separate namespaces for all other chained commands.
def parse_extra (parser, namespace):
  namespaces = []
  extra = namespace.extra
  while extra:
    n = parser.parse_args(extra)
    extra = n.extra
    namespaces.append(n)

  return namespaces

argparser=argparse.ArgumentParser()
subparsers = argparser.add_subparsers(help='sub-command help', dest='subparser_name')

parser_a = subparsers.add_parser('command_a', help = "command_a help")
## Setup options for parser_a

## Add nargs="*" for zero or more other commands
argparser.add_argument('extra', nargs = "*", help = 'Other commands')

## Do similar stuff for other sub-parsers

Теперь после первого разбора все цепные команды сохраняются в extra. Я повторяю его, пока он не пуст, чтобы получить все цепочечные команды и создать для них отдельные пространства имён. И я получаю более приятную строку использования, которую генерирует argparse.

Ответ 2

Я придумал то же самое, и, похоже, у меня есть лучший ответ.

Решение состоит в том, что мы не будем просто вставлять subparser другим подпараметром, но мы можем добавить subparser, следующий с парсером, следующим за другим подпараметром.

Код сообщает вам, как:

parent_parser = argparse.ArgumentParser(add_help=False)                                                                                                  
parent_parser.add_argument('--user', '-u',                                                                                                               
                    default=getpass.getuser(),                                                                                                           
                    help='username')                                                                                                                     
parent_parser.add_argument('--debug', default=False, required=False,                                                                                     
                           action='store_true', dest="debug", help='debug flag')                                                                         
main_parser = argparse.ArgumentParser()                                                                                                                  
service_subparsers = main_parser.add_subparsers(title="service",                                                                                         
                    dest="service_command")                                                                                                              
service_parser = service_subparsers.add_parser("first", help="first",                                                                                    
                    parents=[parent_parser])                                                                                                             
action_subparser = service_parser.add_subparsers(title="action",                                                                                         
                    dest="action_command")                                                                                                               
action_parser = action_subparser.add_parser("second", help="second",                                                                                     
                    parents=[parent_parser])                                                                                                             

args = main_parser.parse_args()

Ответ 3

parse_known_args возвращает пространство имен и список неизвестных строк. Это похоже на extra в проверенном ответе.

import argparse
parser = argparse.ArgumentParser()
parser.add_argument('--foo')
sub = parser.add_subparsers()
for i in range(1,4):
    sp = sub.add_parser('cmd%i'%i)
    sp.add_argument('--foo%i'%i) # optionals have to be distinct

rest = '--foo 0 cmd2 --foo2 2 cmd3 --foo3 3 cmd1 --foo1 1'.split() # or sys.argv
args = argparse.Namespace()
while rest:
    args,rest =  parser.parse_known_args(rest,namespace=args)
    print args, rest

дает:

Namespace(foo='0', foo2='2') ['cmd3', '--foo3', '3', 'cmd1', '--foo1', '1']
Namespace(foo='0', foo2='2', foo3='3') ['cmd1', '--foo1', '1']
Namespace(foo='0', foo1='1', foo2='2', foo3='3') []

Альтернативный цикл предоставит каждому подпарсеру собственное пространство имен. Это позволяет перекрывать имена позиций.

argslist = []
while rest:
    args,rest =  parser.parse_known_args(rest)
    argslist.append(args)

Ответ 4

Вы всегда можете разделить командную строку самостоятельно (разделить sys.argv на имена команд), а затем передать только часть, соответствующую конкретной команде, на parse_args - вы можете использовать тот же Namespace используя ключевое слово namespace, если хотите.

Группировка командной строки легко с помощью itertools.groupby:

import sys
import itertools
import argparse    

mycommands=['cmd1','cmd2','cmd3']

def groupargs(arg,currentarg=[None]):
    if(arg in mycommands):currentarg[0]=arg
    return currentarg[0]

commandlines=[list(args) for cmd,args in intertools.groupby(sys.argv,groupargs)]

#setup parser here...
parser=argparse.ArgumentParser()
#...

namespace=argparse.Namespace()
for cmdline in commandlines:
    parser.parse_args(cmdline,namespace=namespace)

#Now do something with namespace...

непроверенных

Ответ 5

Улучшая ответ на @mgilson, я написал небольшой метод разбора, который разбивает argv на части и ставит значения аргументов команд в иерархию пространств имен:

import sys
import argparse


def parse_args(parser, commands):
    # Divide argv by commands
    split_argv = [[]]
    for c in sys.argv[1:]:
        if c in commands.choices:
            split_argv.append([c])
        else:
            split_argv[-1].append(c)
    # Initialize namespace
    args = argparse.Namespace()
    for c in commands.choices:
        setattr(args, c, None)
    # Parse each command
    parser.parse_args(split_argv[0], namespace=args)  # Without command
    for argv in split_argv[1:]:  # Commands
        n = argparse.Namespace()
        setattr(args, argv[0], n)
        parser.parse_args(argv, namespace=n)
    return args


parser = argparse.ArgumentParser()
commands = parser.add_subparsers(title='sub-commands')

cmd1_parser = commands.add_parser('cmd1')
cmd1_parser.add_argument('--foo')

cmd2_parser = commands.add_parser('cmd2')
cmd2_parser.add_argument('--foo')

cmd2_parser = commands.add_parser('cmd3')
cmd2_parser.add_argument('--foo')


args = parse_args(parser, commands)
print(args)

Он ведет себя правильно, обеспечивая приятную помощь с помощью argparse:

Для ./test.py --help:

usage: test.py [-h] {cmd1,cmd2,cmd3} ...

optional arguments:
  -h, --help        show this help message and exit

sub-commands:
  {cmd1,cmd2,cmd3}

Для ./test.py cmd1 --help:

usage: test.py cmd1 [-h] [--foo FOO]

optional arguments:
  -h, --help  show this help message and exit
  --foo FOO

И создает иерархию пространств имен, содержащих значения аргументов:

./test.py cmd1 --foo 3 cmd3 --foo 4
Namespace(cmd1=Namespace(foo='3'), cmd2=None, cmd3=Namespace(foo='4'))

Ответ 6

Вы можете попробовать arghandler. Это расширение для argparse с явной поддержкой подкоманд.

Ответ 7

Другим пакетом, который поддерживает параллельные парсеры, является "declarative_parser".

import argparse
from declarative_parser import Parser, Argument

supported_formats = ['png', 'jpeg', 'gif']

class InputParser(Parser):
    path = Argument(type=argparse.FileType('rb'), optional=False)
    format = Argument(default='png', choices=supported_formats)

class OutputParser(Parser):
    format = Argument(default='jpeg', choices=supported_formats)

class ImageConverter(Parser):
    description = 'This app converts images'

    verbose = Argument(action='store_true')
    input = InputParser()
    output = OutputParser()

parser = ImageConverter()

commands = '--verbose input image.jpeg --format jpeg output --format gif'.split()

namespace = parser.parse_args(commands)

и пространство имен становится:

Namespace(
    input=Namespace(format='jpeg', path=<_io.BufferedReader name='image.jpeg'>),
    output=Namespace(format='gif'),
    verbose=True
)

Отказ от ответственности: я автор. Требуется Python 3.6. Для установки используйте:

pip3 install declarative_parser

Вот документация, и вот repo на GitHub.

Ответ 8

Решение, предоставляемое @Vikas, не подходит для subcommand- конкретных необязательных аргументов, но подход действителен. Вот улучшенная версия:

import argparse

# create the top-level parser
parser = argparse.ArgumentParser(prog='PROG')
parser.add_argument('--foo', action='store_true', help='foo help')
subparsers = parser.add_subparsers(help='sub-command help', dest='subparser_name')

# create the parser for the "command_a" command
parser_a = subparsers.add_parser('command_a', help='command_a help')
parser_a.add_argument('bar', type=int, help='bar help')

# create the parser for the "command_b" command
parser_b = subparsers.add_parser('command_b', help='command_b help')
parser_b.add_argument('--baz', choices='XYZ', help='baz help')

# parse some argument lists
argv = ['--foo', 'command_a', '12', 'command_b', '--baz', 'Z']
while argv:
    print(argv)
    options, argv = parser.parse_known_args(argv)
    print(options)
    if not options.subparser_name:
        break

Это использует parse_known_args вместо parse_args. parse_args прерывается, как только встречается аргумент, неизвестный текущему подпарщику, parse_known_args возвращает их как второе значение в возвращаемом кортеже. В этом подходе остальные аргументы снова передаются в синтаксический анализатор. Поэтому для каждой команды создается новое пространство имен.

Обратите внимание, что в этом базовом примере все глобальные параметры добавляются к первым вариантам только пространства имен, а не к последующим пространствам имен.

Этот подход отлично подходит для большинства ситуаций, но имеет три важных ограничения:

Невозможно использовать один и тот же необязательный аргумент для разных подкоманд, например myprog.py command_a --foo=bar command_b --foo=bar.
Невозможно использовать позиционные аргументы переменной длины с подкомандами (nargs='?' Или nargs='+' или nargs='*').
Любой известный аргумент анализируется без "взлома" новой команды. Например, в PROG --foo command_b command_a --baz Z 12 с кодом выше, --baz Z будет потребляться command_b, не command_a.

Эти ограничения являются прямым ограничением argparse. Вот простой пример, который показывает ограничения argparse -even при использовании одного subcommand-:

import argparse

parser = argparse.ArgumentParser()
parser.add_argument('spam', nargs='?')
subparsers = parser.add_subparsers(help='sub-command help', dest='subparser_name')

# create the parser for the "command_a" command
parser_a = subparsers.add_parser('command_a', help='command_a help')
parser_a.add_argument('bar', type=int, help='bar help')

# create the parser for the "command_b" command
parser_b = subparsers.add_parser('command_b', help='command_b help')

options = parser.parse_args('command_a 42'.split())
print(options)

Это вызовет error: argument subparser_name: invalid choice: '42' (choose from 'command_a', 'command_b').

Причина в том, что внутренний метод argparse.ArgParser._parse_known_args() слишком жадный и предполагает, что command_a является значением необязательного аргумента spam. В частности, когда "расщепление" необязательных и позиционных аргументов, _parse_known_args() не рассматривает имена компромиссов (например, command_a или command_b), а просто там, где они встречаются в списке аргументов. Он также предполагает, что любая подкоманда будет использовать все остальные аргументы. Это ограничение argparse также препятствует правильной реализации подпараметров с несколькими командами. Это, к сожалению, означает, что для правильной реализации требуется полная переработка метода argparse.ArgParser._parse_known_args(), который является 200+ строками кода.

Учитывая эти ограничения, это может быть вариант просто вернуться к одному аргументу с множественным выбором вместо подкоманд:

import argparse

parser = argparse.ArgumentParser()
parser.add_argument('--bar', type=int, help='bar help')
parser.add_argument('commands', nargs='*', metavar='COMMAND',
                 choices=['command_a', 'command_b'])

options = parser.parse_args('--bar 2 command_a command_b'.split())
print(options)
#options = parser.parse_args(['--help'])

Можно даже перечислить различные команды в информации об использовании, см. Мой ответ fooobar.com/questions/15555369/...

Ответ 9

вы можете использовать пакет optparse

import optparse
parser = optparse.OptionParser()
parser.add_option("-f", dest="filename", help="corpus filename")
parser.add_option("--alpha", dest="alpha", type="float", help="parameter alpha", default=0.5)
(options, args) = parser.parse_args()
fname = options.filename
alpha = options.alpha