WaitPreBlock
产 品 支 持 情 况
功 能 说 明
头 文 件 路 径 为:"basic_api/kernel_operator_determine_compute_sync_intf.h"。
WaitPreBlock和NotifyNextBlock是 核 间 同 步 控 制 接 口。NotifyNextBlock通 过 写 全 局 内 存 来 通 知 其 他 核 当 前 核 已 执 行 完 成,其 他 核 可 以 继 续 往 下 执 行;WaitPreBlock通 过 读 取 全 局 内 存,判 断 当 前 核 是 否 可 以 继 续 往 下 执 行。
WaitPreBlock和NotifyNextBlock必 须 与InitDetermineComputeWorkspace接 口 配 合 使 用,这 三 个 接 口 组 合 使 用 能 够 确 保 多 个AIV核 严 格 按 照blockIdx的 升 序 执 行,适 用 于 要 求 确 定 性 计 算 的 场 景,确 定 性 计 算 的 具 体 含 义 请 参 考原 子 操 作-确 定 性 计 算。
函 数 原 型
C++
__aicore__ inline void WaitPreBlock(GlobalTensor<int32_t>& gmWorkspace, LocalTensor<int32_t>& ubWorkspace)
参 数 说 明
表 1 接 口 参 数 说 明
| 参 数 名 称 | 输 入/输 出 | 含 义 |
|---|---|---|
| gmWorkspace | 输 入 | 临 时 空 间,通 过 读 取gmWorkspace,判 断 当 前 核 是 否 可 以 继 续 往 下 执 行,类 型 为GlobalTensor。 |
| ubWorkspace | 输 入 | 临 时 空 间,用 于 操 作gmWorkspace,类 型 为LocalTensor。 |
返 回 值 说 明
无
约 束 说 明
- 要 实 现 确 定 性 计 算,需 要 保 证 每 个 核 调 用NotifyNextBlock/WaitPreBlock接 口 的 次 数 相 同。如 果 调 用 了NotifyNextBlock没 有 与 之 配 对 的WaitPreBlock,会 导 致 非 确 定 性 计 算、输 出 结 果 可 能 不 符 合 预 期;如 果 调 用 了WaitPreBlock没 有 与 之 配 对 的NotifyNextBlock,会 导 致 程 序 卡 死。
- 使 用 接 口 前,请 确 保 已 经 调 用InitDetermineComputeWorkspace接 口,初 始 化 共 享 内 存。
- gmWorkspace申 请 的 空 间 最 少 要 求 为:GetBlockNum()*32Bytes,ubWorkspace申 请 的 空 间 最 少 要 求 为:GetBlockNum()*32+32Bytes。
- 使 用 该 接 口 进 行 多 核 同 步 时,仅 对AIV核 生 效,WaitPreBlock和NotifyNextBlock之 间 仅 支 持 插 入 矢 量 计 算 相 关 指 令,对 矩 阵 计 算 相 关 指 令 不 生 效。
- 使 用 该 接 口 进 行 多 核 控 制 时,算 子 调 用 时 指 定 的 逻 辑AI Core核 数numBlocks必 须 保 证 不 大 于 实 际 运 行 该 算 子 的AI处 理 器 核 数,否 则 框 架 进 行 多 轮 调 度 时 会 插 入 异 常 同 步,导 致Kernel“卡 死”现 象。
调 用 示 例
完 整 样 例 请 参 考调 用 示 例。