Ответ 1
%
можно избежать по причинам производительности в этом примере.
div
/rem
медленнее даже на уровне архитектуры ЦП; не только на Java. Например, минимальная латентность инструкции idiv
на Haswell составляет около 10 циклов, но только 1 цикл для add
.
Давайте проверим с помощью JMH.
import org.openjdk.jmh.annotations.*;
@State(Scope.Benchmark)
public class Modulo {
@Param("16")
int len;
int i;
@Benchmark
public int baseline() {
return i;
}
@Benchmark
public int conditional() {
return i = (i + 1 < len) ? i + 1 : 0;
}
@Benchmark
public int mask() {
return i = (i + 1) & (len - 1);
}
@Benchmark
public int mod() {
return i = (i + 1) % len;
}
}
Результаты:
Benchmark (len) Mode Cnt Score Error Units
Modulo.baseline 16 avgt 10 2,951 ± 0,038 ns/op
Modulo.conditional 16 avgt 10 3,517 ± 0,051 ns/op
Modulo.mask 16 avgt 10 3,765 ± 0,016 ns/op
Modulo.mod 16 avgt 10 9,125 ± 0,023 ns/op
Как вы можете видеть, использование %
на ~ 2.6x медленнее условного выражения. JIT не может оптимизировать это автоматически в обсуждаемом коде ThreadLocal
, потому что делитель (table.length
) является переменным.