Статический полиморфизм с возможностью выбора варианта одного посетителя против нескольких посетителей и динамического полиморфизма

Я сравниваю производительность следующих методов полиморфизма С++:

Метод [1]. статический полиморфизм с использованием вариантов форсирования с отдельным посетителем для каждого метода Метод [2]. статический полиморфизм с использованием вариантов boost с одним посетителем, который вызывает другой метод с использованием перегрузки метода Метод [3]. Обычный статический динамический полиморфизм

Платформа: - Intel x86 64-бит Red Hat, современный многоядерный процессор, 32 ГБ оперативной памяти - gcc (GCC) 4.8.1 с оптимизацией -O2 - Boost 1.6.0

Мой вопрос в том, почему метод [2], где я использую посетителя, но используя перегрузку метода для вызова правильного метода, дает худшую производительность, чем виртуальные методы. Я ожидал бы, что статический полиморфизм будет лучше, чем динамический полиморфизм. Я понимаю, что есть некоторая стоимость дополнительного параметра, который передается в методе [2], чтобы определить, какой метод посещения() класса вызывает и, возможно, еще большее разветвление из-за перегрузки метода? Но разве это не превосходит виртуальные методы?

Ответы

Ответ 1

Метод 2 в основном неэффективно выполняет динамическую диспетчеризацию. Когда у вас есть:

shape->rotate();
shape->spin();

Это включает поиск правильной функции в vtable и ее вызов. Неэффективность этого поиска. Но когда у вас есть:

boost::apply_visitor(mv, shape, add);

Это грубо всплывает (при условии, что шаблон функции add<>, который является просто reinterpret_cast без проверки):

if (shape.which() == 0) {
    if (add.which() == 0) {
        mv(shape.as<TSquare&>(), add.as<ADD&>());
    }
    else if (add.which() == 1) {
        mv(shape.as<TSquare&>(), add.as<DEL&>());
    }
    else {
        // ???
    }
}
else if (shape.which() == 1) {
    if (add.which() == 0) {
        mv(shape.as<TCircle&>(), add.as<ADD&>());
    }
    else if (add.which() == 1) {
        mv(shape.as<TCircle&>(), add.as<DEL&>());
    }
    else {
        // ???
    }
}
else {
   // ???
}

Здесь мы имеем комбинаторный взрыв ветвей (что нам не нужно было делать в методе 1), но мы действительно должны проверять каждый возможный статический тип каждого варианта, чтобы выяснить, что мы должны были сделать (что мы сделали не нужно делать в методе 3). И эти ветки не смогут быть предсказаны, так как каждый раз вы принимаете разные, поэтому вы не можете конвейерного кода какого-либо кода, не дожидаясь остановки.

Перегрузка на mv() бесплатна - выясняется, что мы называем mv, а это не так. Обратите внимание также на время дельта, которое будет происходить, основываясь на изменении любой из двух осей:

+---------------+----------------+----------------+----------+
|               |    Method 1    |    Method 2    | Method 3 |
+---------------+----------------+----------------+----------+
|    New Type   | More Expensive | More Expensive |   Free   |
| New Operation |      Free      | More Expensive |   Free*  |
+---------------+----------------+----------------+----------+

Метод 1 становится дороже при добавлении новых типов, потому что мы должны явно перебирать все наши типы. Добавление новых операций бесплатное, так как не имеет значения, что такое операция.

Способ 3 может добавлять новые типы и освобождать для добавления новых операций - единственное изменение - увеличение vtable. Это будет иметь некоторые эффекты из-за размера объекта, но обычно будет меньше, чем увеличенная итерация по типам.