Пользовательские типы в ядре OpenCL
Можно ли использовать пользовательские типы в ядре OpenCL, например, в типах gmp (mpz_t, mpq_t,...)?
Чтобы иметь что-то вроде этого (это ядро не построено только из-за #include <gmp.h>
):
#include <gmp.h>
__kernel square(
__global mpz_t* input,
__global mpz_t number,
__global int* output,
const unsigned int count)
{
int i = get_global_id(0);
if(i < count)
output[i] = mpz_divisible_p(number,input[i]);
}
Возможно, добавив разные аргументы в четвертый параметр (параметры) clBuildProgram
?
Или у OpenCL уже есть типы, которые могут обрабатывать большие числа?
Ответы
Ответ 1
Вы можете использовать пользовательские типы, но все, что используется в ядре, должно быть специально написано для OpenCL. Проверьте этот веб-сайт, возможно, для того, как реализовать большие числа точности: FP128
Изменить: NVIDIA CUDA SDK имеет тип данных с комплексными номерами, он не идеален, но может дать вам некоторые идеи о том, как они это делают, OpenCL должен быть похож.
Ответ 2
Как правило, вы можете использовать любые типы в программе OpenCL. Но поскольку импорт не работает, вы должны переопределить их в одной программе. Например:
typedef char my_char[8];
typedef struct tag_my_struct
{
long int id;
my_char chars[2];
int numerics[4]
float decimals[4];
} my_struct;
__kernel void foo(__global my_struct * input,
__global int * output)
{
int gid = get_global_id(0);
output[gid] = input[gid].numerics[3]== 2 ? 1 : 0;
}
Однако вам, очевидно, необходимо сохранить определения внутри и снаружи OpenCL. Также убедитесь, что тип имеет одинаковый размер как на устройстве, так и на хосте (с помощью sizeof(my_struct)
должен сделать трюк). В некоторых случаях мне приходилось корректировать определения, чтобы иметь соответствующие размеры.
Ответ 3
Я использовал ответ VHristov и комментарий к диете, чтобы получить работу на шахте. Этот код работает для меня в OpenCL 1.2
ядро
typedef struct tag_my_struct{
int a;
char b;
}my_struct;
__kernel void myKernel(__global my_struct *myStruct)
{
int gid = get_global_id(0);
(myStruct+gid)->a = gid;
(myStruct+gid)->b = gid + 1;
}
хост
typedef struct tag_my_struct{
cl_int a;
cl_char b;
}my_struct;
void runCode()
{
cl_int status = 0;
my_struct* ms = new my_struct[5];
cl_mem mem = clCreateBuffer(*context, 0, sizeof(my_struct)*5, NULL, &status);
clEnqueueWriteBuffer(*queue, mem, CL_TRUE, 0, sizeof(my_struct)*5, &ms, 0, NULL, NULL);
status = clSetKernelArg(*kernel, 0, sizeof(ms), &mem);
size_t global[] = {5};
status = clEnqueueNDRangeKernel(*queue, *kernel, 1, NULL, global, NULL, 0, NULL, NULL);
status = clEnqueueReadBuffer(*queue, mem, CL_TRUE, 0, sizeof(my_struct)*5, ms, 0, NULL, NULL);
for(int i = 0; i < 5; i++)
cout << (ms+i)->a << " " << (ms+i)->b << endl;
}
Выход
0 ☺
1 ☻
2 ♥
3 ♦
4 ♣
Ответ 4
Если вы хотите включить файлы заголовков в файл ядра, вы можете добавить -l dir в качестве аргумента в clBuildProgram, где dir - это каталог с файлами заголовков.
Подробнее здесь: включить заголовки в файл OpenCL.cl
Источник: http://www.khronos.org/registry/cl/sdk/1.0/docs/man/xhtml/clBuildProgram.html