Есть ли способ обобщить этот код TrieMap?

Ниже представлена простая программа Haskell, которая вычисляет равенства на деревьях:

Предположим, что у вас есть список ассоциаций деревьев [(Tree, a)], и вы хотите найти запись для данного дерева. (Можно подумать об этом как о упрощенной версии проблемы поиска экземпляров класса типа). Наивно нам нужно было бы работать O (n * s), где n - количество деревьев, а s - размер каждого дерева.

Мы можем сделать лучше, если мы используем trie-карту для представления нашего списка ассоциаций:

Наш поиск теперь занимает только O (s). Этот алгоритм является строгим обобщением предыдущего, поскольку мы можем проверить равенство, создав singleton TreeMap (), а затем посмотрим, вернемся ли мы назад Just (). Но по практическим соображениям мы бы предпочли не делать этого, так как это связано с созданием TreeMap, а затем сразу же срывает его.

Есть ли способ обобщить две части кода выше на новую функцию, которая может работать как на Tree, так и на TreeMap? Кажется, что существует некоторое сходство в том, как структурирован код, но неясно, как отвлечь различия.

Ответы

Ответ 1

Изменить. Я вспомнил очень полезный факт о логарифмах и деривативах, которые я обнаружил, пока отвратительно висел на другом диване. К сожалению, этот друг (покойный великий Костас Турлас) уже не с нами, но я помню его, отвратительно вися на другом диване друга.

Позвольте напомнить себе о попытках. (Многие из моих товарищей работали над этими структурами в ранних новизнах: Ральф Хинзе, Торстен Альтенкирх и Питер Хэнкок spring сразу на ум в этом отношении.) Что действительно происходит, так это то, что мы вычисляем экспоненту типа t, помня, что t -> x является способом записи x ^ t.

То есть мы ожидаем оснастить тип t функтором Expo t таким образом, чтобы Expo t x представлял t -> x. Мы должны ожидать, что Expo t будет аппликативным (zippily). Изменить: Хэнкок называет такие функторы "Naperian", потому что они имеют логарифмы, и они применяются так же, как и функции, причем pure является комбинатором K, а <*> - S. что Expo t () должно быть изоморфным с (), причем const (pure ()) и const () выполняют (не много) работу.

class Applicative (Expo t) => EXPO t where
  type Expo t :: * -> *
  appl  :: Expo t x -> (t -> x)       -- trie lookup
  abst  :: (t -> x) -> Expo t x       -- trie construction

Другой способ выразить это то, что t является логарифмом Expo t.

(Я почти забыл: поклонники исчисления должны проверить, что t изоморфен ∂ (Expo t) (). Этот изоморфизм может быть весьма полезным. Изменить: он чрезвычайно полезен, и мы добавим его до EXPO позже.)

Нам понадобится материал для набора компонентов. Функтор тождества является zippiy аппликативным...

data I     ::                         (* -> *) where
  I   :: x -> I x
  deriving (Show, Eq, Functor, Foldable, Traversable)

instance Applicative I where
  pure x = I x
  I f <*> I s = I (f s)

... и его логарифм является единичным типом

instance EXPO () where
  type Expo () = I
  appl (I x) () = x
  abst f        = I (f ())

Продукты zippy-аппликаций zippily applative...

data (:*:) :: (* -> *) -> (* -> *) -> (* -> *) where
  (:*:) :: f x -> g x -> (f :*: g) x
  deriving (Show, Eq, Functor, Foldable, Traversable)

instance (Applicative p, Applicative q) => Applicative (p :*: q) where
  pure x = pure x :*: pure x
  (pf :*: qf) <*> (ps :*: qs) = (pf <*> ps) :*: (qf <*> qs)

... и их логарифмы представляют собой суммы.

instance (EXPO s, EXPO t) => EXPO (Either s t) where
  type Expo (Either s t) = Expo s :*: Expo t
  appl (sf :*: tf) (Left s)  = appl sf s
  appl (sf :*: tf) (Right t) = appl tf t
  abst f = abst (f . Left) :*: abst (f . Right)

Композиции zippy-аппликаций zippily аппликативные...

data (:<:) :: (* -> *) -> (* -> *) -> (* -> *) where
  C :: f (g x) -> (f :<: g) x
  deriving (Show, Eq, Functor, Foldable, Traversable)

instance (Applicative p, Applicative q) => Applicative (p :<: q) where
  pure x          = C (pure (pure x))
  C pqf <*> C pqs = C (pure (<*>) <*> pqf <*> pqs)

и их логарифмы являются произведениями.

instance (EXPO s, EXPO t) => EXPO (s, t) where
  type Expo (s, t) = Expo s :<: Expo t
  appl (C stf) (s, t) = appl (appl stf s) t
  abst f = C (abst $ \ s -> abst $ \ t -> f (s, t))

Если мы включим достаточно материала, мы можем теперь написать

newtype Tree    = Tree (Either () (Tree, Tree))
  deriving (Show, Eq)
pattern Leaf     = Tree (Left ())
pattern Node l r = Tree (Right (l, r))

newtype ExpoTree x = ExpoTree (Expo (Either () (Tree, Tree)) x)
  deriving (Show, Eq, Functor, Applicative)

instance EXPO Tree where
  type Expo Tree = ExpoTree
  appl (ExpoTree f) (Tree t) = appl f t
  abst f = ExpoTree (abst (f . Tree))

Тип TreeMap a в вопросе, будучи

data TreeMap a
    = TreeMap {
        tm_leaf :: Maybe a,
        tm_node :: TreeMap (TreeMap a)
      }

точно Expo Tree (Maybe a), причем lookupTreeMap является flip appl.

Теперь, учитывая, что Tree и Tree -> x - это совсем другие вещи, мне кажется странным, что код работает "на обоих". Тест равенства деревьев является особым случаем поиска только в том смысле, что тест равенства деревьев - это любая старая функция, действующая на дерево. Однако есть совпадение совпадений: чтобы проверить равенство, мы должны превратить каждое дерево в собственный самопознаватель. Изменить:, что именно то, что log-diff iso делает.

Структура, которая дает тест равенства, - это некоторое понятие соответствия. Вот так:

class Matching a b where
  type Matched a b :: *
  matched :: Matched a b -> (a, b)
  match   :: a -> b -> Maybe (Matched a b)

То есть мы ожидаем, что Matched a b будет представлять собой как-то пару из a и a b, которые совпадают. Мы должны иметь возможность извлечь пару (забыв, что они совпадают), и мы должны иметь возможность брать любую пару и пытаться их сопоставить.

Неудивительно, что мы можем сделать это для типа единицы, довольно успешно.

instance Matching () () where
  type Matched () () = ()
  matched () = ((), ())
  match () () = Just ()

Для продуктов мы работаем покомпонентно, поскольку единственная опасность представляет собой несоответствие компонентов.

instance (Matching s s', Matching t t') => Matching (s, t) (s', t') where
  type Matched (s, t) (s', t') = (Matched s s', Matched t t')
  matched (ss', tt') = ((s, t), (s', t')) where
    (s, s') = matched ss'
    (t, t') = matched tt'
  match (s, t) (s', t') = (,) <$> match s s' <*> match t t'

Суммы предлагают некоторую вероятность несоответствия.

instance (Matching s s', Matching t t') =>
    Matching (Either s t) (Either s' t') where
  type Matched (Either s t) (Either s' t')
    = Either (Matched s s') (Matched t t')
  matched (Left  ss') = (Left s,  Left s')  where (s, s') = matched ss'
  matched (Right tt') = (Right t, Right t') where (t, t') = matched tt'
  match (Left s)  (Left s')  = Left  <$> match s s'
  match (Right t) (Right t') = Right <$> match t t'
  match _         _          = Nothing

Интересно, что теперь мы можем получить тест равенства для деревьев так же легко, как

instance Matching Tree Tree where
  type Matched Tree Tree = Tree
  matched t = (t, t)
  match (Tree t1) (Tree t2) = Tree <$> match t1 t2

(Кстати, подкласс Functor, который фиксирует понятие соответствия, будучи

class HalfZippable f where  -- "half zip" comes from Roland Backhouse
  halfZip :: (f a, f b) -> Maybe (f (a, b))

к сожалению, пренебрегают. Морально, для каждого такого f мы должны иметь

Matched (f a) (f b) = f (Matched a b)

Веселое упражнение - показать, что если (Traversable f, HalfZippable f), то свободная монада на f имеет алгоритм унификации первого порядка.)

Я предполагаю, что мы можем построить "списки ассоциаций одиночной сети" следующим образом:

mapOne :: forall a. (Tree, a) -> Expo Tree (Maybe a)
mapOne (t, a) = abst f where
  f :: Tree -> Maybe a
  f u = pure a <* match t u

И мы могли бы попытаться объединить их с этим гаджетом, используя zippiness всех Expo t s...

instance Monoid x => Monoid (ExpoTree x) where
  mempty = pure mempty
  mappend t u = mappend <$> t <*> u

... но, опять же, полная глупость экземпляра Monoid для Maybe x продолжает расстраивать чистый дизайн.

Мы можем по крайней мере управлять

instance Alternative m => Alternative (ExpoTree :<: m) where
  empty = C (pure empty)
  C f <|> C g = C ((<|>) <$> f <*> g)

Забавное упражнение состоит в том, чтобы слить abst с match, и, возможно, это то, на что действительно стоит вопрос. Пусть рефакторинг Matching.

class EXPO b => Matching a b where
  type Matched a b :: *
  matched :: Matched a b -> (a, b)
  match'  :: a -> Proxy b -> Expo b (Maybe (Matched a b))

data Proxy x = Poxy  -- I'm not on GHC 8 yet, and Simon needs a hand here

Для (), что нового является

instance Matching () () where
  -- skip old stuff
  match' () (Poxy :: Proxy ()) = I (Just ())

Для сумм нам нужно отметить успешные совпадения и заполнить безуспешные части великолепно гласвеевским pure Nothing.

instance (Matching s s', Matching t t') =>
    Matching (Either s t) (Either s' t') where
  -- skip old stuff
  match' (Left s) (Poxy :: Proxy (Either s' t')) =
    ((Left <$>) <$> match' s (Poxy :: Proxy s')) :*: pure Nothing
  match' (Right t) (Poxy :: Proxy (Either s' t')) =
    pure Nothing :*: ((Right <$>) <$> match' t (Poxy :: Proxy t'))

Для пар нам нужно собрать соответствие последовательно, выйдя раньше, если первый компонент не работает.

instance (Matching s s', Matching t t') => Matching (s, t) (s', t') where
  -- skip old stuff
  match' (s, t) (Poxy :: Proxy (s', t'))
    = C (more <$> match' s (Poxy :: Proxy s')) where
    more Nothing  = pure Nothing
    more (Just s) = ((,) s <$>) <$> match' t (Poxy :: Proxy t')

Итак, мы видим, что существует связь между конструктором и trie для его соединителя.

Домашнее задание: плавкий предохранитель abst с match', эффективно табулирующий весь процесс.

Edit:пишу match', мы припарковали каждый субатчер в позиции trie, соответствующей подструктуре. И когда вы думаете о вещах в определенных позициях, вы должны думать о молниях и дифференциальном исчислении. Напомню.

Нам понадобятся функториальные константы и копродукты для управления выбором "где дыра".

data K     :: * ->                    (* -> *) where
  K :: a -> K a x
  deriving (Show, Eq, Functor, Foldable, Traversable)

data (:+:) :: (* -> *) -> (* -> *) -> (* -> *) where
  Inl :: f x -> (f :+: g) x
  Inr :: g x -> (f :+: g) x
  deriving (Show, Eq, Functor, Foldable, Traversable)

И теперь мы можем определить

class (Functor f, Functor (D f)) => Differentiable f where
  type D f :: (* -> *)
  plug :: (D f :*: I) x -> f x
  -- there should be other methods, but plug will do for now

Применяются обычные законы исчисления, причем композиция дает пространственную интерпретацию правила цепи.

instance Differentiable (K a) where
  type D (K a) = K Void
  plug (K bad :*: I x) = K (absurd bad)

instance Differentiable I where
  type D I = K ()
  plug (K () :*: I x) = I x

instance (Differentiable f, Differentiable g) => Differentiable (f :+: g) where
  type D (f :+: g) = D f :+: D g
  plug (Inl f' :*: I x) = Inl (plug (f' :*: I x))
  plug (Inr g' :*: I x) = Inr (plug (g' :*: I x))

instance (Differentiable f, Differentiable g) => Differentiable (f :*: g) where
  type D (f :*: g) = (D f :*: g) :+: (f :*: D g)
  plug (Inl (f' :*: g) :*: I x) = plug (f' :*: I x) :*: g
  plug (Inr (f :*: g') :*: I x) = f :*: plug (g' :*: I x)

instance (Differentiable f, Differentiable g) => Differentiable (f :<: g) where
  type D (f :<: g) = (D f :<: g) :*: D g
  plug ((C f'g :*: g') :*: I x) = C (plug (f'g :*: I (plug (g' :*: I x))))

Это не повредит нам утверждать, что Expo t дифференцируема, поэтому продолжим класс EXPO. Что такое "три с дырой"? Это trie, в котором отсутствует выходная запись для одного из возможных входов. И это ключ.

class (Differentiable (Expo t), Applicative (Expo t)) => EXPO t where
  type Expo t :: * -> *
  appl  :: Expo t x -> t -> x
  abst  :: (t -> x) -> Expo t x
  hole  :: t -> D (Expo t) ()
  eloh  :: D (Expo t) () -> t

Теперь hole и eloh будут свидетелями изоморфизма.

instance EXPO () where
  type Expo () = I
  -- skip old stuff
  hole ()     = K ()
  eloh (K ()) = ()

Случай с модулем был не очень захватывающим, но суммарный случай начинает проявлять структуру:

instance (EXPO s, EXPO t) => EXPO (Either s t) where
  type Expo (Either s t) = Expo s :*: Expo t
  hole (Left s)  = Inl (hole s  :*: pure ())
  hole (Right t) = Inr (pure () :*: hole t)
  eloh (Inl (f' :*: _)) = Left (eloh f')
  eloh (Inr (_ :*: g')) = Right (eloh g')

См? A Left отображается в trie с отверстием слева; a Right отображается в trie с отверстием справа.

Теперь для продуктов.

instance (EXPO s, EXPO t) => EXPO (s, t) where
  type Expo (s, t) = Expo s :<: Expo t
  hole (s, t) = C (const (pure ()) <$> hole s) :*: hole t
  eloh (C f' :*: g') = (eloh (const () <$> f'), eloh g')

А для пары это правая тройка, заполненная внутри левого треугольника, поэтому отверстие для определенной пары найдено путем создания отверстия для правого элемента в конкретном подтриге для левого элемента.

Для деревьев создаем другую оболочку.

newtype DExpoTree x = DExpoTree (D (Expo (Either () (Tree, Tree))) x)
  deriving (Show, Eq, Functor)

Итак, как мы превращаем дерево в свой trie-распознаватель? Во-первых, мы хватаем "всех, кроме меня", и мы заполняем все эти выходы с помощью False, затем мы вставляем True для отсутствующей записи.

matchMe :: EXPO t => t -> Expo t Bool
matchMe t = plug ((const False <$> hole t) :*: I True)

Домашний намек: D f :*: I - это comonad.

Отсутствуют друзья!

Ответ 2

Это наивное решение. Класс BinaryTree описывает, как оба Tree и TreeMap являются бинарными деревьями.

{-# LANGUAGE RankNTypes, MultiParamTypeClasses, FlexibleInstances #-}

class BinaryTree t a where
    leaf :: MonadPlus m => t a -> m a
    node :: MonadPlus m => (forall r. BinaryTree t r => t r -> m r) ->
                           (forall r. BinaryTree t r => t r -> m r) ->
                           t a -> m a

Неловкие BinaryTree t r ограничения и класс с несколькими параметрами необходимы только потому, что Tree не имеют a на своих листах до return. Если ваш реальный Tree богаче, этот морщин, вероятно, исчезнет.

lookupTreeMap можно записать в терминах BinaryTree вместо Tree или TreeMap

lookupTreeMap' :: BinaryTree t r => Tree -> t r -> Maybe r
lookupTreeMap' Leaf = leaf
lookupTreeMap' (Node l r) = node (lookupTreeMap' l) (lookupTreeMap' r)

TreeMap имеет простой экземпляр BinaryTree.

instance BinaryTree TreeMap a where
    leaf = maybe empty return . tm_leaf
    node kl kr = tm_node >.> kl >=> kr

Tree не может иметь экземпляр BinaryTree, поскольку он имеет неправильный вид. Это легко фиксируется с помощью newtype:

newtype Tree2 a = Tree2 {unTree2 :: Tree}

tree2 :: Tree -> Tree2 ()
tree2 = Tree2

Tree2 может быть оснащен экземпляром BinaryTree.

instance BinaryTree Tree2 () where
    leaf (Tree2 Leaf) = return ()
    leaf _ = empty

    node kl kr (Tree2 (Node l r)) = kl (tree2 l) >> kr (tree2 r)
    node _ _ _ = empty

Я не думаю, что вышеупомянутое является особенно элегантным решением или что оно обязательно упростит что-либо, если реализация lookupTreeMap не является тривиальной. В качестве дополнительного улучшения я бы рекомендовал рефакторинг Tree в базовый функтор

data TreeF a = Leaf | Node a a

data Tree = Tree (TreeF Tree)

Мы можем разделить проблему на сопоставление базового функтора с самим собой,

-- This looks like a genaralized version of Applicative that can fail
untreeF :: MonadPlus m => TreeF (a -> m b) -> TreeF a -> m (TreeF b)
untreeF Leaf         Leaf       = return Leaf
untreeF (Node kl kr) (Node l r) = Node <$> kl l <*> kr r
untreeF _            _          = empty

сопоставление базового функтора с Tree s,

untree :: MonadPlus m => TreeF (Tree -> m ()) -> Tree -> m () 
untree tf (Tree tf2) = untreeF tf tf2 >> return ()

и сопоставление базового функтора с TreeMap.

-- A reader for things that read from a TreeMap to avoid impredicative types.
data TMR m = TMR {runtmr :: forall r. TreeMap r -> m r}

-- This work is unavoidable. Something has to say how a TreeMap is related to Trees
untreemap :: MonadPlus m => TreeF (TMR m) -> TMR m
untreemap Leaf = TMR $ maybe empty return . tm_leaf
untreemap (Node kl kr) = TMR $ tm_node >.> runtmr kl >=> runtmr kr

Как и в первом примере, мы определяем пересечение дерева только один раз.

-- This looks suspiciously like a traversal / transform
lookupTreeMap' :: (TreeF a -> a) -> Tree -> a
lookupTreeMap' un = go
  where
    go (Tree Leaf) = un Leaf
    go (Tree (Node l r)) = un $ Node (go l) (go r)
    -- If the traversal is trivial these can be replaced by
    -- go (Tree tf) = un $ go <$> tf

Операции, специализированные для Tree и TreeMap, могут быть получены из единственного определения обхода.

eqTree :: Tree -> Tree -> Maybe ()
eqTree = lookupTreeMap' untree

lookupTreeMap :: MonadPlus m => Tree -> TreeMap a -> m a
lookupTreeMap = runtmr . lookupTreeMap' untreemap