Unsigned modulos: альтернативный подход?
Мне нужно оптимизировать эту действительно крошечную, но надоедливую функцию.
unsigned umod(int a, unsigned b)
{
while(a < 0)
a += b;
return a % b;
}
Прежде чем вы начнете кричать "Вам не нужно его оптимизировать", имейте в виду, что эта функция называется 50% всей продолжительности жизни программы, так как она называется 21495808 раз для самого маленького теста.
Эта функция уже встроена в компилятор, поэтому не предлагайте добавить ключевое слово inline
.
Ответы
Ответ 1
Это должно сделать это:
unsigned umod(int a, unsigned b)
{
if (a < 0)
{
unsigned r = (-a % b);
if (r)
return b - r;
else
return 0;
}
else
return a % b;
}
Протестировано для соответствия оригиналу. Ограничение заключается в том, что a > INT_MIN
на машинах с дополнением 2s.
Ответ 2
Это позволяет избежать цикла:
int tmp = a % b;
if (tmp < 0) tmp += b;
Обратите внимание, что должны быть подписаны как a, так и b.
Ответ 3
Использование символа ~:)
unsigned umod(int a, unsigned b)
{
if (a<0) return b-1-~a%b;
return a%b;
}
%
имеет более высокий приоритет, чем -
Если это нормально, чтобы вернуть b вместо 0, когда -a кратно b, вы можете сохранить некоторые операционные системы
unsigned umod(int a, unsigned b)
{
if (a<0) return b - (-a % b);
return a%b;
}
слегка голая версия:)
unsigned umod(int a, unsigned b)
{
return(a<0)?b-(-a%b):a%b;
}
Вот результирующая сборка
1 .globl umod3
2 .type umod3, @function
3 umod3:
4 .LFB3:
5 .cfi_startproc
6 testl %edi, %edi
7 js .L18
8 movl %edi, %eax
9 xorl %edx, %edx
10 divl %esi
11 movl %edx, %eax
12 ret
13 .p2align 4,,10
14 .p2align 3
15 .L18:
16 movl %edi, %eax
17 xorl %edx, %edx
18 negl %eax
19 divl %esi
20 subl %edx, %esi
21 movl %esi, %edx
22 movl %edx, %eax
23 ret
Ответ 4
Так как циклическая версия кажется довольно быстрой, попробуйте исключить разделение:)
unsigned umod(int a, unsigned b){
while(a>0)a-=b;
while(a<0)a+=b;
return a;
}
Ответ 5
Портативная версия, все еще с одним делением, без ветвления и без умножения:
unsigned umod(int a, unsigned b) {
int rem = a % (int) b;
return rem + (-(rem < 0) & b);
}
Ответ 6
В исходной функции вы могли бы вернуться после завершения цикла while для отрицательных чисел, тем самым пропустив мод. Это в том же духе, заменив цикл на умножение - хотя его можно было бы сделать с меньшим количеством символов...
unsigned int umod2(int a, unsigned int b)
{
return (a < 0) ? a + ((-a/b)+1)*b : a % b;
}
Здесь версия цикла:
unsigned int umod2_works(int a, unsigned int b)
{
if (a < 0)
{
while (a < 0)
a += b;
return a;
} else {
return a % b;
}
}
Оба были протестированы в соответствии с исходной функцией OP.
Ответ 7
В a % b
, если какой-либо из операндов unsigned
, оба преобразуются в unsigned
. Это означает, что если a
отрицательно, вы получите значение modulo UINT_MAX + 1
вместо a
. Если UINT_MAX+1
равномерно делится на b
, тогда все будет хорошо, и вы можете просто вернуть a % b
. Если нет, вы делаете modulo в типе int
.
unsigned int umod(int a, unsigned int b)
{
int ret;
if (a >= 0) return a % b;
if (b > INT_MAX) return a + b;
ret = a % (int)b;
if (ret < 0) ret += b;
return ret;
}
Изменить: обновлено, но вы должны использовать ответы в качестве более простого (или, может быть, нет?!). Это здесь для записи.
Ответ 8
int temp;
temp= (a > 0)? ( a % b ) : b -( (-a) % b ) ;
ниже:
int main()
{
int a;
unsigned b;
int temp;
printf("please enter an int and a unsigned number\n");
scanf("%d",&a);
scanf("%u",&b);
modulus(a,b);
temp= (a > 0)? ( a % b ) : b -( (-a) % b ) ;
printf("\n temp is %d", temp);
return 0;
}
void modulus(int x,unsigned y)
{
int c;
if(x>0)
{
c=x%y;
printf("\n%d\n",c);}
else
{
while(x<0)
x+=y;
printf("\n%d\n",x);}
}
./a.out
please enter an int and a unsigned number
-8 3
1
temp is 1
Ответ 9
Здесь, который работает во всем диапазоне без знака без ветвления, но использует умножения и 2 деления
unsigned umod(int a, unsigned b)
{
return (a>0)*a%b+(a<0)*(b-1-~a%b);
}
Ответ 10
Если a и b оба намного меньше, чем int, тогда вы можете просто добавить достаточно большой кратный b для каждого значения до вашего мода.
unsigned umod(int a, unsigned b)
{
return (unsigned)(a + (int)(b * 256)) % b;
}
Конечно, этот трюк не работает, если + (b * 256) может переполняться, но для многих видов использования, которые я вижу для этого кода, вы можете быть уверены, что он никогда не будет.
Ответ 11
Кроме цикла while, не уверен, может ли операция% быть оптимизирована в целом, но оптимизация может произойти по шаблону значений для a и b.
Если в течение этих 21495808 раз выполняется операция.
Если вероятность передачи значения для a, которое меньше b (a < b), составляет по меньшей мере половину этого.
Добавление следующего утверждения, безусловно, улучшит общую производительность функции.
if ( abs(a) < b ) // not specifically the abs function, can be your own implementation.
return 0;
else
return a%b;
Если b является степенью 2 для не более 80% случаев, мы можем использовать побитовые операторы, как в
return ( abs(a) & (b-1) );
Если ожидается, что числа будут чем-то меньшим, это снизит производительность, так как нам нужно проверить, является ли b мощностью 2 [даже после использования побитовых операторов для того же самого] для всего.
Даже функциональность для достижения абс (а) может быть оптимизирована с использованием побитовых операторов с их собственными ограничениями, но быстрее, чем проверка того, является ли значение < 0.
n = (a ^ (a >> 31)) - (a >> 31); // instead of n = a < 0 ? -a : a;
Было бы больше таких вещей, если вы можете исследовать.
Ответ 12
Мое предпочтительное решение - в два раза. Я не пробовал это в C/С++ или с unsigned, но мои тестовые примеры работают на Java:
((a % b) + b) % b
Преимущество - это не ветвление и простота. Недостатком является двойной мод. Я не сравнивал производительность, но я понимаю, что это ветвление, которое вредит производительности в наши дни.