Целочисленные вычисления на графическом процессоре

Для моей работы особенно интересно делать целочисленные вычисления, для которых, очевидно, не подходят графические процессоры. Мой вопрос: совместимы ли современные графические процессоры с эффективными целыми операциями? Я понимаю, что это должно быть легко понять для себя, но я нахожу противоречивые ответы (например yes vs нет), поэтому я подумал, что лучше спросить.

Кроме того, существуют ли библиотеки/методы для целых чисел точности на графических процессорах?

Ответы

Ответ 1

Во-первых, вам необходимо рассмотреть аппаратное обеспечение, которое вы используете: производительность устройств GPU сильно отличается от конструктора к другому.
Во-вторых, это также зависит от рассмотренных операций: например, добавление может быть быстрее, чем умножает.

В моем случае я использую только устройства NVIDIA. Для такого оборудования: официальная документация объявляет эквивалентную производительность как для 32-битных целых чисел, так и для 32-битных одноточечных поплавков с новой архитектурой (Fermi). Предыдущая архитектура (Tesla), используемая для обеспечения эквивалентной производительности для 32-битных целых чисел и поплавков, но только при рассмотрении добавлений и логических операций.

Но еще раз это может быть неверным в зависимости от используемого устройства и инструкций.