Почему производительность ArrayList отличается, если на нее ссылаются как на List?

Однако, если мы действительно передадим ArrayList в вышеуказанных методах и проверим list instanceof RandomAccess, это будет верно в обоих случаях. Итак, мой первый вопрос: , почему Java VM должна интерпретировать это как последовательный список в первом методе?

Я изменил тесты из статьи, чтобы проверить это поведение на моей машине. Когда тест выполняется на ideone, он показывает результаты, похожие на kjellkod's. Но когда я запускал его локально, я получил неожиданные результаты, которые противоречат объяснению статьи, а также моему пониманию. Похоже, что в моем случае ArrayList, как итерация List, на 5-25% быстрее, чем ссылка на ArrayList:

Как объяснить эту разницу? Зависит ли она от архитектуры или количества процессорных ядер? Моя рабочая конфигурация машины - Windows 7 Professional x64, Intel Core i5-3470 (4 ядра, 4 потока), 16 ГБ оперативной памяти.

Ответы

Ответ 1

Итак, мой первый вопрос - почему Java VM должна интерпретировать это как последовательный список в первом методе?

JVM не имеет понятия последовательных или произвольных списков доступа. (Помимо интерфейса маркера) Это разработчик реализации, который распознает, что ArrayList выполняет поиск в произвольном порядке в O (1) раз, а не O (n).

Это зависит от архитектуры или количества процессорных ядер?

Нет, вы увидите разницу между -client например. 32-битные Windows и -server, например. любой 64-разрядной JVM.

Я подозреваю, что вы запустили второй тест List. Скорее всего, это будет быстрее, поскольку код будет более предупрежден как в JIT, так и в кеше процессора. Я предлагаю вам выполнить каждый тест как минимум три раза, сначала выполнив самые длинные тесты и проигнорировав первый запуск.

Примечание: contains() - это O (n) для списка, поэтому ваши тайминги растут O (n ^ 2). Очевидно, вы не использовали бы List, если бы вы хотели игнорировать дубликаты и рассматривали поведение действительно неэффективных код может быть запутанным, так как вы очень восприимчивы к тонкостям того, что оптимизируется, а что нет. Вы получите гораздо более значимые результаты от сравнения кода, который уже достаточно оптимален.

Ответ 2

Несмотря на то, что в обоих методах один и тот же код по-прежнему теоретически, может быть разница, поскольку на уровне JVM вызов метода интерфейса отличается от вызова метода класса. Это две различные операции байт-кода: invokeinterface и invokevirtual. См. http://bobah.net/d4d/source-code/misc/invokevirtual-vs-invokeinterface-performance-benchmark