Linq для объектов: производительность внутреннего запроса

Во время ответа на один из questions я увидел 2 примера кода LINQ, которые должны работать точно так же. Но мне было интересно о производительности, и я обнаружил, что один код намного быстрее, чем другой код. И я не понимаю, почему.

тогда я написал простые тестовые тесты (используется benchmarkdotnet библиотека)

UPD Я включил все тесты, которые были запрошены

Я попытался изменить исходные данные (параметры n и m), но результаты были стабильными, TestTym был быстрее TestJon каждый раз. И TestIvan является самым быстрым из всех тестов. Я просто хочу понять, почему это быстрее? Или, может быть, я ошибся во время тестирования?

Ответы

Ответ 1

Так как в итоге оба выражения отфильтровывают все элементы, разница во времени обусловлена разным количеством раз, когда промежуточный итератор возвращает значение в объединенной цепочке операторов.

Чтобы понять, что происходит, рассмотрите реализацию SelectMany из справочного источника, с удалением аргументов:

public static IEnumerable<TResult> SelectMany<TSource, TResult>(this IEnumerable<TSource> source, Func<TSource, IEnumerable<TResult>> selector) {
    return SelectManyIterator<TSource, TResult>(source, selector);
}
static IEnumerable<TResult> SelectManyIterator<TSource, TResult>(IEnumerable<TSource> source, Func<TSource, IEnumerable<TResult>> selector) {
    foreach (TSource element in source) {
        foreach (TResult subElement in selector(element)) {
            yield return subElement;
        }
    }
}

Select реализуется с серией различных итераторов, основанных на типе подсчитываемой коллекции - WhereSelectArrayIterator, WhereSelectListIterator или WhereSelectEnumerableIterator.

В тестовом коде генерируются случаи, в которых A находятся в диапазоне от нуля до трех, включительно:

Select(y => new Strc() { A = y % 4, B = y })
//                       ^^^^^^^^^

Следовательно, условие Where(ls => ls.A > 3) не дает совпадений.

В TestJon примере yield return внутри SelectMany попадает 10 000 раз, потому что перед фильтрацией все выбрано. После этого Select использует WhereSelectEnumerableIterator, который не находит совпадений. Количество итераторов, возвращающих значение на обоих этапах, составляет, следовательно, 10 000 + 0 = 10000.

TestTym, с другой стороны, фильтрует все во время первого состояния. SelectMany получает IEnumerable пустого IEnumerable s, поэтому объединенное количество раз, когда итератор возвращает значение во время любого из двух этапов, равно 0 + 0 = 0.

Я изменил conditon в запросах на Where(l => true), а Tym теперь медленнее, чем Jon. Почему?

Теперь общее количество предметов, возвращенных на обоих этапах, одинаковое, 10 000 + 10 000 = 20 000. Теперь разница сводится к тому, как работает вложенный цикл SelectMany:

foreach (TResult subElement in selector(element)) {
    yield return subElement; //^^^^^^^^^^^^^^^^^
}

В Jon case selector(element) возвращает List<Strc>. Похоже, что foreach показывает это, и выполняет итерацию по нему с меньшими накладными расходами, чем в случае Tym, который создает и возвращает новые объекты итератора.

Добавление Select(v => v) в Jon исключает возможность применения этой оптимизации, поэтому результаты во втором обновлении находятся в пределах погрешности.