Когда использовать Array, Buffer или direct Buffer

При написании класса Matrix для использования с библиотеками OpenGL я столкнулся с вопросом о том, использовать ли Java-массивы или стратегию Buffer для хранения данных (JOGL предлагает прямую копию буфера для операций Matrix). Чтобы проанализировать это, я написал небольшую программу тестирования производительности, которая сравнивает относительные скорости циклов и объемных операций в массивах против буферов против прямых буферов.

Я хотел бы поделиться с вами своими результатами (как я нахожу их довольно интересными). Пожалуйста, не стесняйтесь комментировать и/или указывать на любые ошибки.
Код можно просмотреть на pastebin.com/is7UaiMV.

Примечания

Заключение

В почти всех ситуациях настоятельно рекомендуется использовать внутренние массивы Java. Мало того, что скорость put/get значительно выше, JIT также способен выполнять намного лучшие оптимизации в конечном коде.

Буферы должны использоваться только, если и применяется следующее:

Обратите внимание, что в буфере с резервной копией имеется массив Java, поддерживающий содержимое буфера. Рекомендуется выполнять операции над этим обратным буфером вместо цикла put/get.

Прямые буферы должны использоваться только, если вы беспокоитесь о использовании памяти и никогда не обращаетесь к базовым данным. Они немного медленнее, чем непрямые буферы, намного медленнее, если доступ к базовым данным осуществляется, но использует меньше памяти. Кроме того, при использовании прямого буфера есть дополнительные накладные расходы при преобразовании небайтовых данных (например, массивов с плавающей запятой) в байты.

Примеры результатов

Примечание. Проценты предназначены только для удобства чтения и не имеют реального значения.

Использование массивов размера 16 с 10 000 000 итераций...

Использование массивов размером 1000 с 100 000 итераций...

Использование массивов размером 10000 с 100 000 итераций...

Ответы

Ответ 1

Прямые буферы не предназначены для ускорения доступа с Java-кода. (Если бы это было возможно, что-то не так с реализацией собственного массива JVM.)

Эти байтовые буферы предназначены для взаимодействия с другими компонентами, так как вы можете записать буфер байта в ByteChannel, и вы можете использовать прямые буферы в в сочетании с собственным кодом, например, с упомянутыми вами библиотеками OpenGL. Его целью было ускорить эту операцию. Использование чипа графических карт для рендеринга может ускорить общую операцию до степени, более чем компенсирующей возможно более медленный доступ к буфере из кода Java.

Кстати, если вы измеряете скорость доступа в буфер байта, особенно в буферах прямого байта, стоит изменить порядок байтов на собственный байтовый порядок, прежде чем приобретать FloatBuffer:

FloatBuffer bufferD = ByteBuffer.allocateDirect(SIZE * 4)
                                .order(ByteOrder.nativeOrder())
                                .asFloatBuffer();

Ответ 2

TL;DR:

Используйте только прямые буферы только, если нам нужно делать эффективные высокоскоростные I/O.

Если нам нужны эффективные высокоскоростные операции не-I/O, массив по умолчанию - лучший выбор.

Если нам нужно выполнить операции с буфером в массиве по умолчанию, , и мы можем позволить себе быть медленным, а затем использовать буфер с поддержкой массива.

TSDR:

Ваши тесты не тестировали какие-либо операции ввода-вывода, и поэтому вывод не соответствует действительности.

В вашем заключении говорится (не мой):

Прямые буферы должны использоваться только, если вы беспокоитесь о памяти использование и никогда не обращаться к базовым данным. Они немного медленнее чем непрямые буферы, намного медленнее, если базовые данные доступ к ним, но использование меньше памяти. Кроме того, есть дополнительные накладные расходы при преобразовании небайтовых данных (таких как float-массивы) в байты, когда используя прямой буфер.

Это явно неправильно. Прямые буферы предназначены для решения проблем скорости, а не проблем с памятью. Прямые буферы должны использоваться всякий раз, когда вам нужен высокопроизводительный доступ ввода/вывода. Это включает в себя операции с файлами/сетью и т.д. Это определенно быстрее при правильном использовании, и на самом деле это самый быстрый, который Java API предоставляет из коробки.

При выполнении операций с файлами/сетями при преобразовании небайтовых данных в байты возникают дополнительные накладные расходы. Это справедливо для всего, а не только для прямых буферов.

В вашем заключении также говорится:

Обратите внимание, что буфер с резервной копией имеет Java-массив, поддерживающий содержимое буфер. Рекомендуется выполнять операции над этим обратным буфером вместо looping put/get.

Это верно, но вам не хватает всего буфера с поддержкой массива. Буферы с поддержкой массива - это шаблон фасада поверх массивов. Буферы с поддержкой массива никогда не будут быстрее, чем сами массивы, поскольку изнутри они должны использовать массив.

Таким образом, они доступны для удобства, а не для скорости. Другими словами, если вам нужна скорость, рекомендуется выбрать массив поверх массива-фасада. Если вам нужна удобство/удобочитаемость, рекомендуется выбрать массив-фасад над массивом для операций с буфером в массиве.

Также читайте: