Динамическая оценка простой логической логики в Python
У меня есть динамически генерируемые логические выражения, например:
- (A или B) и (C или D)
- A или (A и B)
- А
- empty - означает True
Заполнители заменяются булевыми. Должен ли я,
- Преобразуйте эту информацию в выражение Python, например
True or (True or False)
и eval
it?
- Создайте двоичное дерево, где node является объектом
bool
или Conjunction
/Disjunction
и рекурсивно оценивает его?
- Преобразовать его в вложенные S-выражения и использовать парсер Lisp?
- Что-то еще?
Предложения приветствуются.
Ответы
Ответ 1
Совсем не должно быть затруднительно написать оценщик, который мог бы справиться с этим, например, используя pyparsing. У вас есть только несколько операций для обработки (и, или, и группировки?), Поэтому вы сможете проанализировать и оценить их самостоятельно.
Вам не нужно явно формировать двоичное дерево для оценки выражения.
Ответ 2
Здесь небольшой (возможно, 74 строки, включая пробельный) модуль, который я построил примерно через полтора часа (плюс почти час для рефакторинга):
str_to_token = {'True':True,
'False':False,
'and':lambda left, right: left and right,
'or':lambda left, right: left or right,
'(':'(',
')':')'}
empty_res = True
def create_token_lst(s, str_to_token=str_to_token):
"""create token list:
'True or False' -> [True, lambda..., False]"""
s = s.replace('(', ' ( ')
s = s.replace(')', ' ) ')
return [str_to_token[it] for it in s.split()]
def find(lst, what, start=0):
return [i for i,it in enumerate(lst) if it == what and i >= start]
def parens(token_lst):
"""returns:
(bool)parens_exist, left_paren_pos, right_paren_pos
"""
left_lst = find(token_lst, '(')
if not left_lst:
return False, -1, -1
left = left_lst[-1]
#can not occur earlier, hence there are args and op.
right = find(token_lst, ')', left + 4)[0]
return True, left, right
def bool_eval(token_lst):
"""token_lst has length 3 and format: [left_arg, operator, right_arg]
operator(left_arg, right_arg) is returned"""
return token_lst[1](token_lst[0], token_lst[2])
def formatted_bool_eval(token_lst, empty_res=empty_res):
"""eval a formatted (i.e. of the form 'ToFa(ToF)') string"""
if not token_lst:
return empty_res
if len(token_lst) == 1:
return token_lst[0]
has_parens, l_paren, r_paren = parens(token_lst)
if not has_parens:
return bool_eval(token_lst)
token_lst[l_paren:r_paren + 1] = [bool_eval(token_lst[l_paren+1:r_paren])]
return formatted_bool_eval(token_lst, bool_eval)
def nested_bool_eval(s):
"""The actual 'eval' routine,
if 's' is empty, 'True' is returned,
otherwise 's' is evaluated according to parentheses nesting.
The format assumed:
[1] 'LEFT OPERATOR RIGHT',
where LEFT and RIGHT are either:
True or False or '(' [1] ')' (subexpression in parentheses)
"""
return formatted_bool_eval(create_token_lst(s))
Простые тесты дают:
>>> print nested_bool_eval('')
True
>>> print nested_bool_eval('False')
False
>>> print nested_bool_eval('True or False')
True
>>> print nested_bool_eval('True and False')
False
>>> print nested_bool_eval('(True or False) and (True or False)')
True
>>> print nested_bool_eval('(True or False) and (True and False)')
False
>>> print nested_bool_eval('(True or False) or (True and False)')
True
>>> print nested_bool_eval('(True and False) or (True and False)')
False
>>> print nested_bool_eval('(True and False) or (True and (True or False))')
True
[Частично вне темы возможно]
Обратите внимание: вы можете легко настроить маркеры (оба операнда и операторы), которые вы используете с предоставленными средствами перевода зависимостей бедных (token_to_char=token_to_char
и друзей), чтобы одновременно иметь несколько разных оценщиков (просто сбросив "глобальные переменные по умолчанию" оставят вас с одним поведением).
Например:
def fuzzy_bool_eval(s):
"""as normal, but:
- an argument 'Maybe' may be :)) present
- algebra is:
[one of 'True', 'False', 'Maybe'] [one of 'or', 'and'] 'Maybe' -> 'Maybe'
"""
Maybe = 'Maybe' # just an object with nice __str__
def or_op(left, right):
return (Maybe if Maybe in [left, right] else (left or right))
def and_op(left, right):
args = [left, right]
if Maybe in args:
if True in args:
return Maybe # Maybe and True -> Maybe
else:
return False # Maybe and False -> False
return left and right
str_to_token = {'True':True,
'False':False,
'Maybe':Maybe,
'and':and_op,
'or':or_op,
'(':'(',
')':')'}
token_lst = create_token_lst(s, str_to_token=str_to_token)
return formatted_bool_eval(token_lst)
дает:
>>> print fuzzy_bool_eval('')
True
>>> print fuzzy_bool_eval('Maybe')
Maybe
>>> print fuzzy_bool_eval('True or False')
True
>>> print fuzzy_bool_eval('True or Maybe')
Maybe
>>> print fuzzy_bool_eval('False or (False and Maybe)')
False
Ответ 3
Если вы настроили dicts с локалями и глобальными переменными, о которых вы заботитесь, тогда вы сможете безопасно передать их вместе с выражением в eval()
.
Ответ 4
Звучит как кусок пирога с использованием логического модуля SymPy. У них даже есть пример этого в документах: http://docs.sympy.org/0.7.1/modules/logic.html
Ответ 5
Я пишу это, потому что у меня было решение аналогичной проблемы сегодня, и я был здесь, когда искал подсказки. (Логический парсер с произвольными строковыми токенами, которые позже конвертируются в логические значения).
После рассмотрения различных вариантов (самостоятельного внедрения решения или использования какого-либо пакета) я остановился на Lark, https://github.com/lark-parser/lark
Это простой в использовании и довольно быстрый, если вы используете LALR (1)
Вот пример, который может соответствовать вашему синтаксису
from lark import Lark, Tree, Transformer
base_parser = Lark("""
expr: and_expr
| or_expr
and_expr: token
| "(" expr ")"
| and_expr " " and " " and_expr
or_expr: token
| "(" expr ")"
| or_expr " " or " " or_expr
token: LETTER
and: "and"
or: "or"
LETTER: /[A-Z]+/
""", start="expr")
class Cleaner(Transformer):
def expr(self, children):
num_children = len(children)
if num_children == 1:
return children[0]
else:
raise RuntimeError()
def and_expr(self, children):
num_children = len(children)
if num_children == 1:
return children[0]
elif num_children == 3:
first, middle, last = children
return Tree(data="and_expr", children=[first, last])
else:
raise RuntimeError()
def or_expr(self, children):
num_children = len(children)
if num_children == 1:
return children[0]
elif num_children == 3:
first, middle, last = children
return Tree(data="or_expr", children=[first, last])
else:
raise RuntimeError()
def get_syntax_tree(expression):
return Cleaner().transform(base_parser.parse(expression))
print(get_syntax_tree("A and (B or C)").pretty())
Примечание: регулярное выражение, которое я выбрал, специально не соответствует пустой строке (Lark по какой-то причине не позволяет).