Тайные времена исполнения - программирование

Проблема заключается в получении некоторых разрывов в последовательности выполнения для различных размеров ввода. В частности, я пробовал этот код:

Я попробовал код для различных значений N. Однако что-то действительно странное происходит вокруг N = 500. Время выполнения указано ниже. (Это выходы кода для различных значений N.

Я много раз пробовал N = 500, а также на другой машине, чтобы получить аналогичные результаты.

Ответы

Ответ 1

Ваша программа может иметь переполнения с плавающей запятой и операции, которые приводят к NaN для определенных случаев (если расчет приводит к бесконечности /NaN, то он распространяется для вашего алгоритма, поэтому почти все числа становятся бесконечными /NaN. Это зависит от rand() Если вы измените семя с помощью srand(), вы можете не замедлить работу для случая N=500).

И поскольку вы используете long double, скомпилированная программа использует FPU (вы можете воспроизвести это с помощью float или double, если вы скомпилируете FPU вместо SSE). Кажется, что FPU обрабатывает бесконечные числа намного медленнее, чем нормальные числа.

Вы можете легко воспроизвести эту проблему с помощью этого фрагмента:

int main() {
    volatile long double z = 2;

    for (int i=0; i<10000000; i++) {
        z *= z;
    }

    return z;
}

Если вы используете 2 для z, эта программа выполняется медленно (z будет переполняться). Если вы замените его на 1, он станет быстрым (z не будет переполняться).

Подробнее об этом можно прочитать здесь: https://randomascii.wordpress.com/2012/05/20/thats-not-normalthe-performance-of-odd-floats/

Здесь соответствующая часть:

Влияние производительности на FPU x87

Производительность модулей Intels x87 на этих NaN и бесконечных довольно плохо. [...] Даже сегодня, на процессоре SandyBridge, x90 FPU вызывает <сильное > замедление около 370 к одному на NaN и бесконечности.