IEnumerable вопрос: Лучшая производительность?
Быстрый вопрос:
Какой из них быстрее?
foreach (Object obj in Collection)
{
if(obj.Mandatory){ ... }
}
или
foreach (Object obj in Collection.FindAll(o => o.Mandatory))
{
...
}
и если вы знаете более быстрое предложение, я был бы рад узнать.
Спасибо
Ответы
Ответ 1
Следующий тестовый код печатает системные тики (1 тик = 100 наносекунд) для итерации через 10 миллионов объектов. FindAll является самым медленным, и цикл for является самым быстрым, как ожидалось.
Но накладные расходы итерации измеряются в наносекундах за элемент даже в худшем случае. Если вы делаете что-либо существенное в цикле (например, что-то, что занимает микросекунду на элемент), то разница в скорости итерации полностью несущественна.
Так что для любви к Тьюрингу сейчас не запрещайте foreach в ваших правилах кодирования. Это не делает каких-либо практических различий, и инструкции LINQ уверены, что их легче читать.
public class Test
{
public bool Bool { get; set; }
}
class Program
{
static void Main(string[] args)
{
// fill test list
var list = new List<Test>();
for (int i=0; i<1e7; i++)
{
list.Add(new Test() { Bool = (i % 2 == 0) });
}
// warm-up
int counter = 0;
DateTime start = DateTime.Now;
for (int i = 0; i < list.Count; i++)
{
if (list[i].Bool)
{
counter++;
}
}
// List.FindAll
counter = 0;
start = DateTime.Now;
foreach (var test in list.FindAll(x => x.Bool))
{
counter++;
}
Console.WriteLine(DateTime.Now.Ticks - start.Ticks); // prints 7969158
// IEnumerable.Where
counter = 0;
start = DateTime.Now;
foreach (var test in list.Where(x => x.Bool))
{
counter++;
}
Console.WriteLine(DateTime.Now.Ticks - start.Ticks); // prints 5156514
// for loop
counter = 0;
start = DateTime.Now;
for (int i = 0; i < list.Count; i++)
{
if (list[i].Bool)
{
counter++;
}
}
Console.WriteLine(DateTime.Now.Ticks - start.Ticks); // prints 2968902
}
Ответ 2
Если ваш Collection
является List<T>
, тогда FindAll
реализуется путем создания нового List<T>
и копирования всех элементов, соответствующих предикату. Это, очевидно, медленнее, чем просто перечисление коллекции и принятие решения по каждому элементу, если предикат имеет место.
Если вы используете .NET 3.5, вы можете использовать LINQ, который не будет создавать копию и похож на ваш первый пример:
foreach (object obj in someCollection.Where(o => o.Mandatory))
{
...
}
Обратите внимание, что это не обязательно самое быстрое решение. Легко видеть, что метод, который выделяет память и перечисляет коллекцию, медленнее, чем метод, который перечисляет только коллекцию. Если производительность критическая: измерьте ее.
Ответ 3
Первый будет несколько быстрее.
Во втором случае вы используете List<T>.FindAll
, чтобы создать временный список, соответствующий вашим критериям. Это копирует список, затем выполняет итерацию по нему.
Однако вы можете выполнить одно и то же, с той же скоростью, что и ваш первый вариант, выполнив:
foreach (Object obj in Collection.Where(o => o.Mandatory))
{
}
Это связано с тем, что Enumerable.Where использует потоковое воспроизведение для возврата IEnumerable<T>
, которое генерируется при повторении. Копия не выполнена.
Ответ 4
Самое быстрое, что вы могли бы получить, не распараллеливая перечисление на несколько потоков с учетом количества процессоров и т.д.:
for (int i = 0; i < Collection.Count; i++)
{
var item = Collection[i];
if (item.Mandatory) { ... }
}
Я бы порекомендовал вам хотя бы всегда использовать Linq вместо написания циклов for
или foreach
, потому что в будущем он станет настолько умным, что он действительно сможет распределять работу над процессорами и учитывать специфику оборудования (см. PLinq), и в конечном итоге это будет быстрее, чем если бы вы сами написали петли: декларативное и императивное программирование.
Ответ 5
FindAll - это просто синтаксический сахар. Например:
List<string> myStrings = new List<string>();
foreach (string str in myStrings.FindAll(o => o.Length > 0))
{
}
Скомпилируется:
List<string> list = new List<string>();
if (CS$<>9__CachedAnonymousMethodDelegate1 == null)
{
CS$<>9__CachedAnonymousMethodDelegate1 = new Predicate<string>(MyClass.<RunSnippet>b__0);
}
using (List<string>.Enumerator enumerator = list.FindAll(CS$<>9__CachedAnonymousMethodDelegate1).GetEnumerator())
{
while (enumerator.MoveNext())
{
string current = enumerator.Current;
}
}
public List<T> FindAll(Predicate<T> match)
{
if (match == null)
{
ThrowHelper.ThrowArgumentNullException(ExceptionArgument.match);
}
List<T> list = new List<T>();
for (int i = 0; i < this._size; i++)
{
if (match(this._items[i]))
{
list.Add(this._items[i]);
}
}
return list;
}
private static bool <RunSnippet>b__0(string o)
{
return (o.Length > 0);
}
Ответ 6
Если производительность под вопросом, это, вероятно, не является узким местом, однако вы считаете, что используете параллельную библиотеку или PLINQ? см. ниже:
Parallel.ForEach(Collection, obj =>
{
if (obj.Mandatory)
{
DoWork();
}
});
http://msdn.microsoft.com/en-us/library/dd460688(v=vs.110).aspx
Кроме того, хотя, возможно, немного несвязанный, кажется, что производительность заглядывает в вашу любопытство, если вы имеете дело с очень большими наборами данных, двоичный поиск может быть полезен. В моем случае у меня есть два отдельных списка данных. Мне приходится иметь дело со списками миллионов записей, и это спасло меня буквально экспоненциальным количеством времени на выполнение. Единственным недостатком является то, что он ТОЛЬКО полезен для очень больших коллекций и должен быть отсортирован заранее. Вы также заметите, что это использует класс ConcurrentDictionary, который обеспечивает значительные накладные расходы, но он является потокобезопасным и требовался из-за требований и количества потоков, которыми я управляю асинхронно.
private ConcurrentDictionary<string, string> items;
private List<string> HashedListSource { get; set; }
private List<string> HashedListTarget { get; set; }
this.HashedListTarget.Sort();
this.items.OrderBy(x => x.Value);
private void SetDifferences()
{
for (int i = 0; i < this.HashedListSource.Count; i++)
{
if (this.HashedListTarget.BinarySearch(this.HashedListSource[i]) < 0)
{
this.Mismatch.Add(items.ElementAt(i).Key);
}
}
}
Это изображение было изначально опубликовано в замечательной статье, найденной здесь: http://letsalgorithm.blogspot.com/2012/02/intersecting-two-sorted-integer-arrays.html
Надеюсь, это поможет!