Ответ 1
Следующая статья (загрузка в формате PDF) представляет собой сравнительное исследование алгоритмов параллельной сортировки на разных архитектурах:
Алгоритмы параллельной сортировки по различным архитектурам
В соответствии с этой статьей выборка лучше всего подходит для многих типов параллельной архитектуры.
Обновить для адреса Отметить проблему возраста:
Вот более свежие статьи, в которых говорится о чем-то более новом (с 2007 года, который, кстати, по-прежнему сравнивается с образцом):
Улучшения в сортировке образцов
AA-Sort
Край кровотечения (около 2010 года, некоторые только пару месяцев):
Параллельный шаблон сортировки
Многоядерная параллельная сортировка на основе графического процессора
гибридный процессор/графический параллельный ролик
Рандомизированный алгоритм параллельной сортировки с экспериментальным исследованием
Высоко масштабируемая параллельная сортировка
Сортировка N-элементов с использованием естественного порядка: новый подход адаптивной сортировки
Обновление за 2013 год:
Вот кратковременное кровотечение около января 2013 года. (Примечание: несколько ссылок связаны с документами на Citeseer и требуют бесплатной регистрации):
Университетские лекции:
Параллельное разделение для выбора и сортировки
Алгоритмы параллельной сортировки Лекция
Алгоритмы параллельной сортировки Лекция 2
Алгоритмы параллельной сортировки Лекция 3
Другие источники и документы:
Новый алгоритм сортировки для многоядерных архитектур на основе адаптивной битной сортировки
Высоко масштабируемая параллельная сортировка 2
Параллельное слияние
Параллельное слияние 2
Параллельная саморазборка системы для объектов
Сравнение производительности последовательных алгоритмов быстрой сортировки и параллельной быстрой сортировки
Общая память, передача сообщений и гибридные сортировки для автономных и кластеризованных SMP
Различные параллельные алгоритмы (сортировка и др.), включая реализации
GPU и CPU/GPU гибридные источники и документы:
Метод OpenCL для алгоритмов параллельной сортировки для архитектуры графического процессора
Сортировка данных с использованием единиц графической обработки
Эффективные алгоритмы сортировки на графических процессорах
Разработка эффективных алгоритмов сортировки для многопользовательских графических процессоров
Детерминированный выбор проб для графических процессоров
Быстрая сортировка на месте с CUDA на основе битной сортировки
Быстрый параллельный GPU-сортировка с использованием гибридного алгоритма
Алгоритмы быстрой параллельной сортировки на графических процессорах
Быстрая сортировка по процессорам и графическим процессорам: случай для полосы пропускания SIMD-сортировки
Сортировка образцов GPU
GPU-ABiSort: Оптимальная параллельная сортировка на потоковых архитектурах
GPUTeraSort: высокопроизводительная сортировка графического сопроцессора для управления большими базами данных
Высокопроизводительный алгоритм сортировки на основе сравнения на многоядерных графических процессорах
Параллельная внешняя сортировка для графических процессоров с поддержкой CUDA с балансировкой нагрузки и низкими затратами на передачу
Сортировка на графических процессорах для крупномасштабных наборов данных: тщательное сравнение