Почему массив [idx++] + = "a" увеличивает idx один раз в Java 8, но дважды в Java 9 и 10?

Чтобы справиться с проблемой, один игрок-гольфист кода написал следующий код:

import java.util.*;
public class Main {
  public static void main(String[] args) {
    int size = 3;
    String[] array = new String[size];
    Arrays.fill(array, "");
    for(int i = 0; i <= 100; ) {
      array[i++%size] += i + " ";
    }
    for(String element: array) {
      System.out.println(element);
    }
  }
}

При запуске этого кода в Java 8 мы получаем следующий результат:

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100 
2 5 8 11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80 83 86 89 92 95 98 101 
3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99 

При запуске этого кода в Java 10 мы получаем следующий результат:

2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 102 
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 

Нумерация полностью отключена с помощью Java 10. Итак, что здесь происходит? Это ошибка в Java 10?

Следите за комментариями:

  • Проблема возникает при компиляции с Java 9 или более поздней версией (мы нашли ее на Java 10). Компиляция этого кода на Java 8, а затем запуск в Java 9 или любой более поздней версии, включая ранний доступ Java 11, дает ожидаемый результат.
  • Этот тип кода является нестандартным, но действителен в соответствии со спецификацией. Он был найден Кевином Круйссеном в обсуждении в игре в гольф, и, следовательно, встретился странный случай использования.
  • Дидье Л узнал, что проблема может быть воспроизведена с гораздо меньшим и понятным кодом:

    class Main {
      public static void main(String[] args) {
        String[] array = { "" };
        array[test()] += "a";
      }
      static int test() {
        System.out.println("evaluated");
        return 0;
      }
    }
    

    Результат при компиляции в Java 8:

    evaluated
    

    Результат при компиляции в Java 9 и 10:

    evaluated
    evaluated
    
  • Кажется, что проблема ограничивается оператором конкатенации строк и присваивания (+=) с выражением с побочным эффектом (s) в качестве левого операнда, как в array[test()]+="a", array[ix++]+="a", test()[index]+="a" или test().field+="a". Чтобы включить конкатенацию строк, по крайней мере одна из сторон должна иметь тип String. Попытка воспроизвести это на других типах или конструкциях не удалась.

Ответы

Ответ 1

Это ошибка в javac начиная с JDK 9 (что внесло некоторые изменения в отношении конкатенации строк, которые, как я подозреваю, является частью проблемы), что подтверждается командой javac под идентификатором ошибки JDK-8204322. Если вы посмотрите на соответствующий байт-код для строки:

array[i++%size] += i + " ";

Это:

  21: aload_2
  22: iload_3
  23: iinc          3, 1
  26: iload_1
  27: irem
  28: aload_2
  29: iload_3
  30: iinc          3, 1
  33: iload_1
  34: irem
  35: aaload
  36: iload_3
  37: invokedynamic #5,  0 // makeConcatWithConstants:(Ljava/lang/String;I)Ljava/lang/String;
  42: aastore

Где последняя aaload - фактическая нагрузка от массива. Однако часть

  21: aload_2             // load the array reference
  22: iload_3             // load 'i'
  23: iinc          3, 1  // increment 'i' (doesn't affect the loaded value)
  26: iload_1             // load 'size'
  27: irem                // compute the remainder

Что примерно соответствует array[i++%size] выражений array[i++%size] (минус фактическая загрузка и сохранение), находится там дважды. Это неверно, поскольку спецификация говорит в jls-15.26.2:

Составляющее выражение присваивания формы E1 op= E2 эквивалентно E1 = (T) ((E1) op (E2)), где T - тип E1, за исключением того, что E1 оценивается только один раз.

Итак, для array[i++%size] += я + " "; выражений array[i++%size] += я + " "; , array[i++%size] должен оцениваться только один раз. Но он оценивается дважды (один раз для загрузки и один раз для магазина).

Так что да, это ошибка.


Некоторые обновления:

Исправлена ошибка в JDK 11, и в JDK 10 был бы обратный порт (но не JDK 9, поскольку он больше не получает общедоступных обновлений).

Алексей Шипилев упоминает на странице JBS (и @DidierL в комментариях здесь):

Обход -XDstringConcat=inline: скомпилируйте с помощью -XDstringConcat=inline

Это приведет к использованию StringBuilder для выполнения конкатенации и не будет содержать ошибку.