thread_rank
产 品 支 持 情 况
- Ascend 950PR/Ascend 950DT:支 持
- Atlas A3 训 练 系 列 产 品/Atlas A3 推 理 系 列 产 品:不 支 持
- Atlas A2 训 练 系 列 产 品/Atlas A2 推 理 系 列 产 品:不 支 持
- Atlas 200I/500 A2 推 理 产 品:不 支 持
- Atlas 推 理 系 列 产 品AI Core:不 支 持
- Atlas 推 理 系 列 产 品Vector Core:不 支 持
- Atlas 训 练 系 列 产 品:不 支 持
功 能 说 明
获 取 当 前 线 程 在 所 属 的thread_block_tile组 内 的 排 名,排 名 从0开 始。
函 数 原 型
C++
unsigned long long thread_rank() const
参 数 说 明
无
返 回 值 说 明
当 前 线 程 在 所 属 的thread_block_tile组 内 的 排 名。
约 束 说 明
无
调 用 示 例
示 例 代 码 中 以4个 线 程 为 一 组 划 分 线 程 块,各 线 程 在 所 属 的thread_block_tile组 内 的 排 名 如 下 图 所 示。
图 1 thread_rank接 口 返 回 值 示 意 图
SIMT编 程 场 景:
C++using namespace cooperative_groups; __global__ void simt_kernel(...) { ... thread_block block = this_thread_block(); auto tile4 = tiled_partition<4>(block); unsigned long long rank = tile4.thread_rank(); ... }SIMD与SIMT混 合 编 程 场 景:
C++using namespace cooperative_groups; __simt_vf__ inline void simt_kernel(...) { ... thread_block block = this_thread_block(); auto tile4 = tiled_partition<4>(block); unsigned long long rank = tile4.thread_rank(); ... }