coder.gpu.kernel
编译指示映射为
-循环到GPU内核
描述
coder.gpu.kernel ()
是循环级的pragma,必须立即放在for循环之前。它生成一个由循环参数计算出的维数的内核。
请注意
的coder.gpu.kernel
Pragma覆盖软件执行的所有并行循环分析检查。使用coder.gpu.kernelfun
的更高级功能之前coder.gpu.kernel
编译指示。
coder.gpu.kernel (B、T)
是循环级的pragma,必须立即放在for循环之前。它生成一个具有指定维度的内核B
而且T
.B (Bx, 1)
数组是否定义网格中沿维度的块数x
而且y
(z
不习惯)。T (Tx,泰,Tz)
数组是否定义了块中的线程数x
,y
,z
.
的值为-1B
而且T
表示GPU Coder™必须自动推断网格和块尺寸。的coder.gpu.kernel
Pragma为无效的网格和块尺寸生成错误。
coder.gpu.kernel (B T M,名称)
预计相同B
而且T
参数。可以指定可选参数米
而且的名字
.米
是一个正整数,指定每个流多处理器的最小块数。有时,增加米
可以减少内核内的寄存器使用并提高内核占用率。的值为-1米
表示GPU Coder必须使用默认值“1”。的名字
是一个字符数组,允许您自定义生成的内核的名称。
指定内核pragma将覆盖所有并行循环分析检查。这种覆盖允许在并行循环分析不能证明所有迭代彼此独立的情况下并行化循环。首先,确保循环是安全的并行化。
这个函数是一个代码生成函数。在MATLAB中没有效果®.
例子
版本历史
介绍了R2017b