Суровые различия в сборке сборок с плавающей запятой <и> =

Я экспериментирую с созданной сборкой и нашел интересную вещь. Есть две функции, выполняющие одинаковые вычисления. Единственное различие между ними - это способ суммирования результатов.

Сборка, сгенерированная с помощью x86 clang 3.7 с -O2 на gcc.godbolt.org, пока еще очень отличается и неожиданна. (компиляция на gcc приводит к аналогичной сборке)

func1 компилируется в ветвящуюся сборку с гораздо меньшими инструкциями, чем func2. таким образом, func2 ожидается намного медленнее, чем func1.

Может ли кто-нибудь объяснить это поведение?

Ответы

Ответ 1

Причина такого поведения операторов сравнения < или >= отличается от того, является ли ваш double NaN или не NaN. Все сравнения, в которых один из операндов NaN возвращает false. Таким образом, ваш x*x < 0.0 всегда будет ложным независимо от того, является ли x NaN или нет. Таким образом, компилятор может безопасно оптимизировать это. Однако случай x * x >= 0 будет вести себя по-разному для значений NaN и non NaN, поэтому компилятор оставляет условные переходы в сборке.

Это то, что cppreference говорит о сравнении с участием NaN:

значения операндов после преобразования сравниваются в обычном математическом смысле (за исключением того, что положительные и отрицательные нули сравниваются равными, и любое сравнение с использованием значения NaN возвращает ноль)