Как работает маскирование веток в CryENGINE 3?

Эта часть заголовков CryENGINE SDK привлекла мое внимание:

Может кто-нибудь бросить краткое объяснение, как именно эти функции предназначены для сокращения ветвей? ILINE Я предполагаю, что это предопределенная сила, встроенная или что-то в этом роде. Я искал Google об этом, но все, что я нашел, это копии заголовков CryENGINE, загруженных на разных сайтах, но никаких обсуждений об этом конкретном не было.

Ответы

Ответ 1

Эти функции возвращают бит-маски, которые могут быть получены с результатами других вычислений, для выполнения операций без условных выражений и, таким образом, без введения ветвей.

Например:

nz2mask возвращает 0, если аргумент 0 и 0xffffffff в противном случае.
msb2mask возвращает 0, если верхний бит аргумента 0 и 0xffffffff, если он 1.

Итак, если у вас есть код (с инструкциями x86 для справки):

if(a != 0) x += y;
    //  test        ebx,ebx  
    //  je          skip  
    //  add         dword ptr [x],eax  
    // skip:

Вы можете заменить его на:

x += y & (nz2mask(a));
    //  mov     ecx,ebx  
    //  neg     ecx  
    //  or      ecx,ebx  
    //  sar     ecx,1Fh  
    //  and     ecx,eax  
    //  add     ecx,dword ptr [x]

Он создает больше инструкций (по крайней мере, на x86), но избегает ветки.

Затем есть дополнительные функции, такие как iselmask(), которые позволяют выбирать любой вход на основе маски, поэтому вы можете заменить:

x = (a != 0) ? r1 : r2;

x = iselmask(nz2mask(a), r1, r2);

Опять же, эти функции должны встроить и скомпилировать до относительно эффективного ассемблера, торгуя с лишним математическими вычислениями без ветвления.