Топологическая сортировка с использованием LINQ

У меня есть список элементов, которые отношение частичного порядка, i. e, список можно рассматривать как частично упорядоченный набор. Я хочу отсортировать этот список так же, как в этом question. Как правильно ответил там, это называется топологическая сортировка.

Существует достаточно простой известный алгоритм для решения проблемы. Я хочу реализовать LINQ-подобную реализацию.

Я уже пытался использовать метод расширения OrderBy, но я уверен, что он не сможет сделать топологическую сортировку. Проблема в том, что интерфейс IComparer<TKey> не может представлять частичный порядок. Это происходит потому, что метод Compare может возвращать в основном 3 вида значений: ноль, отрицательный и положительный, что означает , меньше, а - больше, а затем, соответственно. Рабочее решение было бы возможно только в том случае, если бы был способ вернуть несвязанные.

С моей предвзятой точки зрения ответ, который я ищу, может состоять из интерфейса IPartialOrderComparer<T> и метода расширения следующим образом:

public static IOrderedEnumerable<TSource> OrderBy<TSource, TKey>(
    this IEnumerable<TSource> source,
    Func<TSource, TKey> keySelector,
    IPartialOrderComparer<TKey> comparer
);

Как это будет реализовано? Как выглядит интерфейс IPartialOrderComparer<T>? Вы порекомендовали бы другой подход? Я очень хочу это увидеть. Может быть, есть лучший способ представить частичный порядок, я не знаю.

Ответы

Ответ 1

Я бы предложил использовать тот же интерфейс IComparer, но написал метод расширения, чтобы интерпретировать 0 как не относящийся. В частичном порядке, если элементы a и b равны, их порядок не имеет значения, так же, если они не связаны друг с другом - вам нужно только упорядочить их по отношению к элементам, с которыми они определили отношения.

Здесь пример, который выполняет частичное упорядочение четных и нечетных целых чисел:

namespace PartialOrdering
{
    public static class Enumerable
    {
        public static IEnumerable<TSource> PartialOrderBy<TSource, TKey>(this IEnumerable<TSource> source, Func<TSource, TKey> keySelector, IComparer<TKey> comparer)
        {
            List<TSource> list = new List<TSource>(source);
            while (list.Count > 0)
            {
                TSource minimum = default(TSource);
                TKey minimumKey = default(TKey);
                foreach (TSource s in list)
                {
                    TKey k = keySelector(s);
                    minimum = s;
                    minimumKey = k;
                    break;
                }
                foreach (TSource s in list)
                {
                    TKey k = keySelector(s);
                    if (comparer.Compare(k, minimumKey) < 0)
                    {
                        minimum = s;
                        minimumKey = k;
                    }
                }
                yield return minimum;
                list.Remove(minimum);
            }
            yield break;
        }

    }
    public class EvenOddPartialOrdering : IComparer<int>
    {
        public int Compare(int a, int b)
        {
            if (a % 2 != b % 2)
                return 0;
            else if (a < b)
                return -1;
            else if (a > b)
                return 1;
            else return 0; //equal
        }
    }
    class Program
    {
        static void Main(string[] args)
        {
            IEnumerable<Int32> integers = new List<int> { 8, 4, 5, 7, 10, 3 };
            integers = integers.PartialOrderBy<Int32, Int32>(new Func<Int32, Int32>(delegate(int i) { return i; }), new EvenOddPartialOrdering());
        }
    }
}

Результат: 4, 8, 3, 5, 7, 10

Ответ 2

Это моя оптимизированная и отредактированная версия ответа tehMick.

Одно изменение, которое я сделал, это замена реального списка значений, оставшихся для вывода для логического списка. Для этого у меня два массива размера одинакового размера. У одного есть все значения, а остальные содержат флажки, указывающие, было ли получено каждое значение. Таким образом, я избегаю затрат на изменение размера реального List<Key>.

Еще одно изменение заключается в том, что я читаю все ключи только один раз в начале итерации. По причинам, которые я не могу вспомнить сейчас (возможно, это был мой инстинкт) мне не нравится идея вызвать функцию keySelector несколько раз.

Последнее касалось проверки параметров и дополнительной перегрузки, которая использует неявный ключ-сопоставитель. Надеюсь, код достаточно читаем. Проверьте это.

public static IEnumerable<TSource> PartialOrderBy<TSource, TKey>(
    this IEnumerable<TSource> source,
    Func<TSource, TKey> keySelector)
{
    return PartialOrderBy(source, keySelector, null);
}

public static IEnumerable<TSource> PartialOrderBy<TSource, TKey>(
    this IEnumerable<TSource> source,
    Func<TSource, TKey> keySelector,
    IComparer<TKey> comparer)
{
    if (source == null) throw new ArgumentNullException("source");
    if (keySelector == null) throw new ArgumentNullException("keySelector");
    if (comparer == null) comparer = (IComparer<TKey>)Comparer<TKey>.Default;

    return PartialOrderByIterator(source, keySelector, comparer);
}

private static IEnumerable<TSource> PartialOrderByIterator<TSource, TKey>(
    IEnumerable<TSource> source,
    Func<TSource, TKey> keySelector,
    IComparer<TKey> comparer)
{
    var values = source.ToArray();
    var keys = values.Select(keySelector).ToArray();
    int count = values.Length;
    var notYieldedIndexes = System.Linq.Enumerable.Range(0, count).ToArray();
    int valuesToGo = count;

    while (valuesToGo > 0)
    {
        //Start with first value not yielded yet
        int minIndex = notYieldedIndexes.First( i => i >= 0);

        //Find minimum value amongst the values not yielded yet
        for (int i=0; i<count; i++)
        if (notYieldedIndexes[i] >= 0)
        if (comparer.Compare(keys[i], keys[minIndex]) < 0) {
            minIndex = i;
        }

        //Yield minimum value and mark it as yielded
        yield return values[minIndex];
        notYieldedIndexes[minIndex] = -1;
        valuesToGo--;
    }
}

Ответ 3

Ну, я не уверен, что этот способ обращения с ним - лучший способ, но я могу ошибаться.

Типичным способом обработки топологической сортировки является использование графика, и для каждой итерации удаляются все узлы, у которых нет входящего соединения, и одновременно удаляются все соединения, исходящие от этих узлов. Удаленные узлы - это результат итерации. Повторяйте, пока вы не сможете удалить больше узлов.

Однако, чтобы получить эти соединения, в первую очередь, с помощью вашего метода вам понадобится:

  • Метод (ваш компаратор), который мог бы сказать "это до этого", но также "нет информации для этих двух"
  • Итерировать все комбинации, создавая соединения для всех комбинаций, которые компаратор возвращает для заказа.

Другими словами, метод, вероятно, будет определен следующим образом:

public Int32? Compare(TKey a, TKey b) { ... }

а затем верните null, когда он не имеет окончательного ответа для двух ключей.

Проблема, о которой я думаю, это часть "итерации всех комбинаций". Возможно, есть лучший способ справиться с этим, но я этого не вижу.

Ответ 4

Я считаю, что ответ Lasse V. Karlsen находится на правильном пути, но мне не нравится скрывать метод Compare (или отдельный интерфейс для этого который не простирается от IComparable<T>).

Вместо этого я бы предпочел бы что-то вроде этого:

public interface IPartialOrderComparer<T> : IComparer<T>
{
    int? InstancesAreComparable(T x, T y);
}

Таким образом, у вас все еще есть реализация IComparer<T>, которую можно использовать в других местах, для которых требуется IComparer<T>.

Однако для этого также требуется указать связь экземпляров T друг с другом с возвращаемым значением следующим образом (аналогично IComparable<T>):

  • null - экземпляры не сопоставимы друг с другом.
  • 0 - экземпляры сопоставимы друг с другом.
  • 0 - x является сопоставимым ключом, но y не является.

  • < 0 - y является сопоставимым ключом, но x не является.

Конечно, вы не будете получать частичный заказ при передаче реализации этого ко всему, что ожидает IComparable<T> (и следует отметить, что ответ Лассе В. Карлсена тоже не решает), как то, что вам нужно не может быть представлен простым методом сравнения, который принимает два экземпляра T и возвращает int.

Чтобы завершить решение, вы должны предоставить собственный метод OrderBy (а также ThenBy, OrderByDescending и ThenByDescending), который примет новый параметр экземпляра (как вы уже указали). Реализация будет выглядеть примерно так:

public static IOrderedEnumerable<TSource> OrderBy<TSource, TKey>(      
    this IEnumerable<TSource> source,      
    Func<TSource, TKey> keySelector,      
    IPartialOrderComparer<TKey> comparer)
{
    return Enumerable.OrderBy(source, keySelector,
        new PartialOrderComparer(comparer);
}

internal class PartialOrderComparer<T> : IComparer<T>
{
    internal PartialOrderComparer(IPartialOrderComparer<T> 
        partialOrderComparer)
    {
        this.partialOrderComparer = partialOrderComparer;
    }

    private readonly IPartialOrderComparer<T> partialOrderComparer;

    public int Compare(T x, T y)
    {
        // See if the items are comparable.
        int? comparable = partialOrderComparable.
            InstancesAreComparable(x, y);

        // If they are not comparable (null), then return
        // 0, they are equal and it doesn't matter
        // what order they are returned in.
        // Remember that this only to determine the
        // values in relation to each other, so it's
        // ok to say they are equal.
        if (comparable == null) return 0;

        // If the value is 0, they are comparable, return
        // the result of that.
        if (comparable.Value == 0) return partialOrderComparer.Compare(x, y);

        // One or the other is uncomparable.
        // Return the negative of the value.
        // If comparable is negative, then y is comparable
        // and x is not.  Therefore, x should be greater than y (think
        // of it in terms of coming later in the list after
        // the ordered elements).
        return -comparable.Value;            
    }
}

Ответ 5

Интерфейс для определения отношения частичного порядка:

interface IPartialComparer<T> {
    int? Compare(T x, T y);
}

Compare должен возвращать -1, если x < y, 0, если x = y, 1, если y < x и null, если x и y не сопоставимы.

Наша цель - вернуть порядок элементов в частичном порядке, который учитывает перечисление. То есть мы ищем последовательность e_1, e_2, e_3, ..., e_n элементов в частичном порядке так, что если i <= j и e_i сравнимо с e_j, то e_i <= e_j. Я сделаю это, используя поиск по глубине.

Класс, реализующий топологическую сортировку с использованием поиска по глубине:

class TopologicalSorter {
    class DepthFirstSearch<TElement, TKey> {
        readonly IEnumerable<TElement> _elements;
        readonly Func<TElement, TKey> _selector;
        readonly IPartialComparer<TKey> _comparer;
        HashSet<TElement> _visited;
        Dictionary<TElement, TKey> _keys;
        List<TElement> _sorted;

        public DepthFirstSearch(
            IEnumerable<TElement> elements,
            Func<TElement, TKey> selector,
            IPartialComparer<TKey> comparer
        ) {
            _elements = elements;
            _selector = selector;
            _comparer = comparer;
            var referenceComparer = new ReferenceEqualityComparer<TElement>();
            _visited = new HashSet<TElement>(referenceComparer);
            _keys = elements.ToDictionary(
                e => e,
                e => _selector(e), 
                referenceComparer
            );
            _sorted = new List<TElement>();
        }

        public IEnumerable<TElement> VisitAll() {
            foreach (var element in _elements) {
                Visit(element);
            }
            return _sorted;
        }

        void Visit(TElement element) {
            if (!_visited.Contains(element)) {
                _visited.Add(element);
                var predecessors = _elements.Where(
                    e => _comparer.Compare(_keys[e], _keys[element]) < 0
                );
                foreach (var e in predecessors) {
                    Visit(e);
                }
                _sorted.Add(element);
            }
        }
    }

    public IEnumerable<TElement> ToplogicalSort<TElement, TKey>(
        IEnumerable<TElement> elements,
        Func<TElement, TKey> selector, IPartialComparer<TKey> comparer
    ) {
        var search = new DepthFirstSearch<TElement, TKey>(
            elements,
            selector,
            comparer
        );
        return search.VisitAll();
    }
}

Класс помощника, необходимый для маркировки узлов при посещении при выполнении поиска по глубине:

class ReferenceEqualityComparer<T> : IEqualityComparer<T> {
    public bool Equals(T x, T y) {
        return Object.ReferenceEquals(x, y);
    }

    public int GetHashCode(T obj) {
        return obj.GetHashCode();
    }
}

Я не утверждаю, что это лучшая реализация алгоритма, но я считаю, что это правильная реализация. Кроме того, я не возвращал IOrderedEnumerable по вашему запросу, но это легко сделать, когда мы находимся на этом этапе.

Алгоритм работает путем выполнения поиска по глубине через элементы, добавляющие элемент e к линейному упорядочению (представленному _sorted в алгоритме), если мы уже добавили все предшественники e уже был добавлен к заказу. Следовательно, для каждого элемента e, если мы его еще не посетили, посетите его предшественники, а затем добавьте e. Таким образом, это ядро ​​алгоритма:

public void Visit(TElement element) {
    // if we haven't already visited the element
    if (!_visited.Contains(element)) {
        // mark it as visited
        _visited.Add(element);
        var predecessors = _elements.Where(
            e => _comparer.Compare(_keys[e], _keys[element]) < 0
        );
        // visit its predecessors
        foreach (var e in predecessors) {
            Visit(e);
        }
        // add it to the ordering
        // at this point we are certain that
        // its predecessors are already in the ordering
        _sorted.Add(element);
    }
}

В качестве примера рассмотрим частичный порядок, определенный на подмножествах {1, 2, 3}, где x < y, если x - подмножество y. Я реализую это следующим образом:

public class SetComparer : IPartialComparer<HashSet<int>> {
    public int? Compare(HashSet<int> x, HashSet<int> y) {
        bool xSubsety = x.All(i => y.Contains(i));
        bool ySubsetx = y.All(i => x.Contains(i));
        if (xSubsety) {
            if (ySubsetx) {
                return 0;
            }
            return -1;
        }
        if (ySubsetx) {
            return 1;
        }
        return null;
    }
}

Затем с sets, определяемым как список подмножеств {1, 2, 3}

List<HashSet<int>> sets = new List<HashSet<int>>() {
    new HashSet<int>(new List<int>() {}),
    new HashSet<int>(new List<int>() { 1, 2, 3 }),
    new HashSet<int>(new List<int>() { 2 }),
    new HashSet<int>(new List<int>() { 2, 3}),
    new HashSet<int>(new List<int>() { 3 }),
    new HashSet<int>(new List<int>() { 1, 3 }),
    new HashSet<int>(new List<int>() { 1, 2 }),
    new HashSet<int>(new List<int>() { 1 })
};
TopologicalSorter s = new TopologicalSorter();
var sorted = s.ToplogicalSort(sets, set => set, new SetComparer());

Это приводит к упорядочению:

{}, {2}, {3}, {2, 3}, {1}, {1, 3}, {1, 2}, {1, 2, 3}

который учитывает частичный порядок.

Это было очень весело. Спасибо.

Ответ 6

Большое спасибо всем, начиная с ответа Эрика Микельсена. Я придумал свою версию, поскольку я предпочитаю использовать нулевые значения, чтобы не указывать никакого отношения, как сказал Лассе В. Карлсен.

public static IEnumerable<TSource> PartialOrderBy<TSource>(
        this IEnumerable<TSource> source,            
        IPartialEqualityComparer<TSource> comparer)
    {
        if (source == null) throw new ArgumentNullException("source");
        if (comparer == null) throw new ArgumentNullException("comparer");


        var set = new HashSet<TSource>(source);
        while (!set.IsEmpty())
        {
            TSource minimum = set.First();                

            foreach (TSource s in set)
            {                    
                var comparison = comparer.Compare(s, minimum);
                if (!comparison.HasValue) continue;
                if (comparison.Value <= 0)
                {
                    minimum = s;                        
                }
            }
            yield return minimum;
            set.Remove(minimum);
        }
    }

public static IEnumerable<TSource> PartialOrderBy<TSource>(
       this IEnumerable<TSource> source,
       Func<TSource, TSource, int?> comparer)
    {
        return PartialOrderBy(source, new PartialEqualityComparer<TSource>(comparer));
    }

то у меня есть следующий интерфейс для сравнения

public interface IPartialEqualityComparer<T>
{
    int? Compare(T x, T y);
}

и этот вспомогательный класс

internal class PartialEqualityComparer<TSource> : IPartialEqualityComparer<TSource>
{
    private Func<TSource, TSource, int?> comparer;

    public PartialEqualityComparer(Func<TSource, TSource, int?> comparer)
    {
        this.comparer = comparer;
    }

    public int? Compare(TSource x, TSource y)
    {
        return comparer(x,y);
    }
}

что позволяет немного улучшить использование, поэтому мои тесты могут выглядеть следующим образом:

 var data = new int[] { 8,7,6,5,4,3,2,1,0 };
 var partiallyOrdered = data.PartialOrderBy((x, y) =>
     {
        if (x % 2 == 0 && y % 2 != 0) return null;
        return x.CompareTo(y);
     });