Задайте количество потоков с помощью omp_set_num_threads() до 2, но omp_get_num_threads() возвращает 1
У меня есть следующий код C/С++ с использованием OpenMP:
int nProcessors=omp_get_max_threads();
if(argv[4]!=NULL){
printf("argv[4]: %s\n",argv[4]);
nProcessors=atoi(argv[4]);
printf("nProcessors: %d\n",nProcessors);
}
omp_set_num_threads(nProcessors);
printf("omp_get_num_threads(): %d\n",omp_get_num_threads());
exit(0);
Как вы можете видеть, я пытаюсь установить количество процессоров для использования на основе аргумента, переданного в командной строке.
Однако я получаю следующий вывод:
argv[4]: 2 //OK
nProcessors: 2 //OK
omp_get_num_threads(): 1 //WTF?!
Почему не omp_get_num_threads()
возвращает 2?!!!
Как уже указывалось, я вызываю omp_get_num_threads()
в последовательной области, поэтому функция возвращает 1
.
Однако у меня есть следующий параллельный код:
#pragma omp parallel for private(i,j,tid,_hash) firstprivate(firstTime) reduction(+:nChunksDetected)
for(i=0;i<fileLen-CHUNKSIZE;i++){
tid=omp_get_thread_num();
printf("%d\n",tid);
int nThreads=omp_get_num_threads();
printf("%d\n",nThreads);
...
который выводит:
0 //tid
1 //nThreads - this should be 2!
0
1
0
1
0
1
...
Ответы
Ответ 1
Вызов omp_get_num_threads()
возвращает 1 в последовательном разделе кода. См. Ссылка
Итак, вам нужно иметь параллельный код, чтобы получить правильное значение, вот как выглядит ваш код:
#include <iostream>
#include <omp.h>
int main (int argc, const char * argv[])
{
int nProcessors = omp_get_max_threads();
std::cout<<nProcessors<<std::endl;
omp_set_num_threads(nProcessors);
std::cout<<omp_get_num_threads()<<std::endl;
#pragma omp parallel for
for(int i = 0; i < 5; i++){
int tid = omp_get_thread_num();
std::cout<<tid<<"\t tid"<<std::endl;
int nThreads = omp_get_num_threads();
std::cout<<nThreads<<"\t nThreads"<<std::endl;
}
exit(0);
}
Этот код создает:
2
1
0 tid
2 nThreads
0 tid
2 nThreads
0 tid
2 nThreads
1 tid
2 nThreads
1 tid
2 nThreads
Кажется, что у вас есть либо открытый mp не включен, либо ваш цикл не в форме, которая может быть парализована openmp
Ответ 2
вы используете неправильную функцию. используйте omp_get_max_threads
, чтобы проверить максимальное количество разрешенных потоков.
Ответ 3
Уже указано, что omp_get_num_threads()
возвращает 1
в последовательных разделах кода. Соответственно, даже если для параметра omp_set_num_threads()
установлено общее число потоков больше 1
, любой вызов omp_get_num_threads()
будет возвращать 1
, если мы не находимся в параллельном разделе. Пример ниже пытается прояснить этот момент
#include <stdio.h>
#include <omp.h>
int main() {
const int maxNumThreads = omp_get_max_threads();
printf("Maximum number of threads for this machine: %i\n", maxNumThreads);
printf("Not yet started a parallel Section: the number of threads is %i\n", omp_get_num_threads());
printf("Setting the maximum number of threads...\n");
omp_set_num_threads(maxNumThreads);
printf("Once again, not yet started a parallel Section: the number of threads is still %i\n", omp_get_num_threads());
printf("Starting a parallel Section...\n");
#pragma omp parallel for
for (int i = 0; i < maxNumThreads; i++) {
int tid = omp_get_thread_num();
printf("This is thread %i announcing that the number of launched threads is %i\n", tid, omp_get_num_threads());
}
}