Форматирование множественных строк

Учитывая словарь int s, я пытаюсь отформатировать строку с каждым номером и плюрализацию элемента.

Пример ввода dict:

data = {'tree': 1, 'bush': 2, 'flower': 3, 'cactus': 0}

Пример вывода str:

'My garden has 1 tree, 2 bushes, 3 flowers, and 0 cacti'

Он должен работать с произвольной строкой формата.

Лучшим решением, которое я придумал, является класс PluralItem для хранения двух атрибутов, n (исходное значение) и s (строка 's', если множественное число, пустая строка '' если не). Подклассы для различных методов плюрализации

class PluralItem(object):
    def __init__(self, num):
        self.n = num
        self._get_s()
    def _get_s(self):
        self.s = '' if self.n == 1 else 's'

class PluralES(PluralItem):
    def _get_s(self):
        self.s = 's' if self.n == 1 else 'es'

class PluralI(PluralItem):
    def _get_s(self):
        self.s = 'us' if self.n == 1 else 'i'

Затем создайте новое dict через понимание и отображение classes:

classes = {'bush': PluralES, 'cactus': PluralI, None: PluralItem}
plural_data = {key: classes.get(key, classes[None])(value) for key, value in data.items()}

Наконец, строка формата и реализация:

formatter = 'My garden has {tree.n} tree{tree.s}, {bush.n} bush{bush.s}, {flower.n} flower{flower.s}, and {cactus.n} cact{cactus.s}'
print(formatter.format(**plural_data))

Выводит следующее:

My garden has 1 tree, 2 bushes, 3 flowers, and 0 cacti

Для такой, несомненно, общей потребности, я не решаюсь бросить полотенце с таким запутанным решением.

Есть ли способ форматировать такую ​​строку, используя встроенный метод format и минимальный дополнительный код? Псевдокод может выглядеть примерно так:

"{tree} tree{tree(s)}, {bush} bush{bush(es)}, {flower} flower{flower(s)}, {cactus} cact{cactus(i,us)}".format(data)

где круглые скобки возвращают содержимое, если значение множественное, или если содержимое имеет запятую, означает множественное число/исключительное

Ответы

Ответ 1

Использование пользовательского форматера:

import string

class PluralFormatter(string.Formatter):
    def get_value(self, key, args, kwargs):
        if isinstance(key, int):
            return args[key]
        if key in kwargs:
            return kwargs[key]
        if '(' in key and key.endswith(')'):
            key, rest = key.split('(', 1)
            value = kwargs[key]
            suffix = rest.rstrip(')').split(',')
            if len(suffix) == 1:
                suffix.insert(0, '')
            return suffix[0] if value <= 1 else suffix[1]
        else:
            raise KeyError(key)

data = {'tree': 1, 'bush': 2, 'flower': 3, 'cactus': 0}
formatter = PluralFormatter()
fmt = "{tree} tree{tree(s)}, {bush} bush{bush(es)}, {flower} flower{flower(s)}, {cactus} cact{cactus(i,us)}"
print(formatter.format(fmt, **data))

Выход:

1 tree, 2 bushes, 3 flowers, 0 cacti

ОБНОВИТЬ

Если вы используете Python 3. 2+ ( str.format_map был добавлен), вы можете использовать идею OP (см комментарий), которые используют настроенное Dict.

class PluralDict(dict):
    def __missing__(self, key):
        if '(' in key and key.endswith(')'):
            key, rest = key.split('(', 1)
            value = super().__getitem__(key)
            suffix = rest.rstrip(')').split(',')
            if len(suffix) == 1:
                suffix.insert(0, '')
            return suffix[0] if value <= 1 else suffix[1]
        raise KeyError(key)

data = PluralDict({'tree': 1, 'bush': 2, 'flower': 3, 'cactus': 0})
fmt = "{tree} tree{tree(s)}, {bush} bush{bush(es)}, {flower} flower{flower(s)}, {cactus} cact{cactus(i,us)}"
print(fmt.format_map(data))

Выход: такой же, как указано выше.

Ответ 2

Откажитесь от пакета инфляции. Это будет плюрализировать вещи, а также сделать целый ряд других лингвистических обманщиков. Слишком много ситуаций для особого случая сами!

Из документов по ссылке выше:

import inflect
p = inflect.engine()

# UNCONDITIONALLY FORM THE PLURAL
print("The plural of ", word, " is ", p.plural(word))

# CONDITIONALLY FORM THE PLURAL
print("I saw", cat_count, p.plural("cat",cat_count))

В вашем конкретном примере:

{print(str(count) + " " + p.pluralize(string, count)) for string, count in data.items() }

Ответ 3

Я бы пошел с чем-то вроде

class Pluralizer:
    def __init__(self, value):
        self.value = value

    def __format__(self, formatter):
        formatter = formatter.replace("N", str(self.value))
        start, _, suffixes = formatter.partition("/")
        singular, _, plural = suffixes.rpartition("/")

        return "{}{}".format(start, singular if self.value == 1 else plural)

"There are {:N thing/s} which are made of {:/a cactus/N cacti}".format(Pluralizer(10), Pluralizer(1))
#>>> 'There are 10 things which are made of a cactus'

Формат always/singular/plural, который singular (then plural) необязательный.

Итак,

"xyz/foo/bar".format(Pluralizer(1)) == "xyzfoo"
"xyz/foo/bar".format(Pluralizer(2)) == "xyzbar"

"xyz/bar".format(Pluralizer(1)) == "xyz"
"xyz/bar".format(Pluralizer(2)) == "xyzbar"

"xyz".format(Pluralizer(1)) == "xyz"
"xyz".format(Pluralizer(2)) == "xyz"

Тогда для вашего примера это просто:

data = {'tree': 1, 'bush': 2, 'flower': 3, 'cactus': 0}
string = 'My garden has {tree:N tree/s}, {bush:N bush/es}, {flower:N flower/s}, and {cactus:N cact/us/i}'

string.format_map({k: Pluralizer(v) for k, v in data.items()})
#>>> 'My garden has 1 tree, 2 bushes, 3 flowers, and 0 cacti'

Ответ 4

Если вы уже используете Django, это легко: pluralize - это функция.

Это часто используется в шаблонах:

You have {{ num_messages }} message{{ num_messages|pluralize }}.

Тем не менее, вы также можете использовать его в своем коде Python:

f'You have {num_messages} message{pluralize(num_messages)}.'

В Python2 это будет выглядеть так:

'You have {} message{}.'.format(num_messages, pluralize(num_messages))

или же:

'You have %d message%s' % (num_messages, pluralize(num_messages))

Django множественное число документов: https://docs.djangoproject.com/en/2.0/ref/templates/builtins/#pluralize

Ответ 5

Ответы, в частности @Veedrac, вдохновили меня на создание утилиты Plurality:

https://gist.github.com/elidchan/40baea13bb91193a326e3a8c4cbcaeb9

Особенности:

  • Настраиваемые шаблоны с номерами (например, см. Ниже)
  • Номера и поддержка токенов $ n
  • Формы единственного/множественного числа (например, 'cact/us/i') и поддержка токенов шаблона $ thing/$ things
  • Неограниченные возможности статьи (на основе fooobar.com/info/1515188/...) и поддержка $ шаблона токена
  • Конкатенация левой/правой строки
  • Частичные с любым подмножеством числа, форм и шаблонов
  • Частичное завершение через call() или строку формата

Из строки документации:

"""
Usage:

>>> from utils.verbiage import Plurality

>>> f"We have {Plurality(0, 'g/oose/eese')}."
'We have 0 geese.'
>>> f"We have {Plurality(1, 'g/oose/eese')}."
'We have 1 goose.'
>>> f"We have {Plurality(2, 'g/oose/eese')}."
'We have 2 geese.'

>>> oxen = Plurality('ox/en')
>>> oxen.template_formatter
'1=$n $thing;n=$n $things'
>>> f"We have {oxen(0)}."
'We have 0 oxen.'
>>> f"We have {oxen(1)}."
'We have 1 ox.'
>>> f"We have {oxen(2)}."
'We have 2 oxen.'

>>> cows = Plurality('/cow/kine', '0=no $things', '1=$a $thing')
>>> cows.template_formatter
'0=no $things;1=a $thing;n=$n $things'
>>> f"We have {cows(0)}."
'We have no kine.'
>>> f"We have {cows(1)}."
'We have a cow.'
>>> f"We have {cows(2)}."
'We have 2 kine.'

>>> 'We have {:0=no $things;0.5=half $a $thing}.'.format(Plurality(0, 'octop/us/odes'))
'We have no octopodes.'
>>> 'We have {:octop/us/odes;0=no $things;0.5=half $a $thing}.'.format(Plurality(0.5))
'We have half an octopus.'
>>> 'We have {:4;octop/us/odes;0=no $things;0.5=half $a $thing}.'.format(Plurality())
'We have 4 octopodes.'

>>> data = {'herb': 1, 'bush': 2, 'flower': 3, 'cactus': 0}
>>> s = "We have {herb:herb/s}, {bush:bush/es}, {flower:flower/s}, and {cactus:cact/us/i}."
>>> s.format_map({k: Plurality(v) for k, v in data.items()})
'We have 1 herb, 2 bushes, 3 flowers, and 0 cacti.'
>>> vague = Plurality('0=no $things;1=$a $thing;2=a couple $things;n=some $things')
>>> s.format_map({k: vague(v) for k, v in data.items()})
'We have an herb, a couple bushes, some flowers, and no cacti.'
"""