Оптимизационный барьер для микрообъектов в MSVC: скажите оптимизатору, что вы clobber-память?

Чандлер Каррут представил две функции в своем

& крестик; Чтобы понять, почему оптимизатор должен думать таким образом, представьте, был ли блок сборки циклом, добавляющим 1 к каждому байту в памяти.

Ответы

Ответ 1

Учитывая ваше приближение escape(), вы также должны быть в порядке со следующей аппроксимацией clobber() (обратите внимание, что это проектная идея, откладывающая некоторые из решение для реализации функции nextLocationToClobber()):

// always returns false, but in an undeducible way
bool isClobberingEnabled();

// The challenge is to implement this function in a way,
// that will make even the smartest optimizer believe that
// it can deliver a valid pointer pointing anywhere in the heap,
// stack or the static memory.
volatile char* nextLocationToClobber();

const bool clobberingIsEnabled = isClobberingEnabled();
volatile char* clobberingPtr;

inline void clobber() {
    if ( clobberingIsEnabled ) {
        // This will never be executed, but the compiler
        // cannot know about it.
        clobberingPtr = nextLocationToClobber();
        *clobberingPtr = *clobberingPtr;
    }
}

UPDATE

Вопрос. Как бы вы гарантировали, что isClobberingEnabled возвращает false "неуправляемым образом"? Конечно, было бы тривиально поместить определение в другую единицу перевода, но как только вы включите LTCG, эта стратегия будет побеждена. Что вы имели в виду?

Ответ. Мы можем воспользоваться труднодостижимым свойством из теории чисел, например Fermat Last Теорема:

bool undeducible_false() {
    // It took mathematicians more than 3 centuries to prove Fermat's
    // last theorem in its most general form. Hardly that knowledge
    // has been put into compilers (or the compiler will try hard
    // enough to check all one million possible combinations below).

    // Caveat: avoid integer overflow (Fermat theorem
    //         doesn't hold for modulo arithmetic)
    std::uint32_t a = std::clock() % 100 + 1;
    std::uint32_t b = std::rand() % 100 + 1;
    std::uint32_t c = reinterpret_cast<std::uintptr_t>(&a) % 100 + 1;

    return a*a*a + b*b*b == c*c*c;
}

Ответ 2

Я использовал вместо escape следующее.

#ifdef _MSC_VER
#pragma optimize("", off)
template <typename T>
inline void escape(T* p) {
    *reinterpret_cast<char volatile*>(p) =
        *reinterpret_cast<char const volatile*>(p); // thanks, @milleniumbug
}
#pragma optimize("", on)
#endif

Это не идеально, но это достаточно близко, я думаю.

К сожалению, у меня нет способа подражать clobber.