Почему компилятор g++ не обрабатывает эти две функции одинаково?

У меня есть массив A с нулями и единицами. Я хочу найти сумму всех чисел в A. Я хочу проверить две функции:

Я использовал PAPI library для подсчета количества инструкций, вот весь эксперимент:

Это результат, который я получаю от функции first, когда размер A равен 111,111

Это результат, который я получаю от функции второй, когда размер A равен 111,111

Почему разница в результатах? Инструкции сокращаются наполовину, неверные предсказания отрасли почти устранены. Что здесь происходит?

Ответы

Ответ 1

Ваша вторая функция является хвостовой рекурсивной. Это означает, что компилятор может оптимизировать его для чего-то вроде:

void test2(int curIndex){
  while(true)
  {
    if(curIndex == size) return;
    s+=A[curIndex];
    curIndex = curIndex + 1;
  }
}

Это значительно уменьшает количество инструкций. Он также уменьшает количество кадров стека, необходимых (не более) одному. В результате он использует намного меньше памяти, что приводит к уменьшению промахов в кэше.

Компилятор не может выполнить эту оптимизацию для первой функции.

UPDATE: Некоторые люди спрашивают, почему компилятор не может сделать эту оптимизацию для первой функции.

Пусть начнется с наблюдения, функция не является хвост-рекурсивной. Функция является хвостовой рекурсивной, если последнее, что происходит, - это рекурсивный вызов той же функции, за которым следует возвращение результата этого рекурсивного вызова (если есть).

Ясно, что это не так для первой функции, s+=A[curIndex]; выполняется после рекурсивного вызова.

Итак, люди спросили, почему компилятор не может превратить первую функцию во вторую.

Вопрос: почему g++ не имеет этой функции? Ответ на этот вопрос всегда один и тот же. По умолчанию функции не реализованы; g++ не имеет этой функции, поскольку никто не проектировал, не реализовал и не отправил эту функцию клиентам.

Это должно быть концом этого, но, конечно, люди захотят узнать, почему никто не проектировал, не реализовывал и не тестировал эту функцию. Ну, может быть, никто не думал об этом. Но что более важно, функция будет далека от тривиальной.

Прежде всего, компилятор должен был бы понять, что

test1(curIndex+1);
s+=A[curIndex];

s+=A[curIndex];
test1(curIndex+1);

эквивалентны. Это нетривиальное наблюдение, учитывая, что с механической точки зрения они не эквивалентны! В самом деле, первый из них эффективно проходит от конца массива до начала, тогда как второй - от начала до конца. Это то же самое? Это дает тот же результат, когда A является int * (и s в int), но он не в других случаях (например, когда A является двойным * и s является двойным). Мы ожидаем, что компилятор будет таким умным?

Итак, у нас есть потенциальная возможность с высокой стоимостью для реализации. Но стоимость может стоить того, если выгода высока. Выгода высокая? Я бы предположил, что это происходит очень мало в реальном коде, т.е. Разработчики, скорее всего, напишут вторую форму. Итак, у вас есть это: дорогая функция с небольшой пользой. IMHO, разработчики компиляторов разумно тратить свое драгоценное время на более полезные функции.