DataSyncBarrier(ISASI)
产 品 支 持 情 况
功 能 说 明
头 文 件 路 径 为:"basic_api/kernel_operator_block_sync_intf.h"。
阻 塞 后 续 的 指 令 执 行,直 到 所 有 之 前 的 内 存 访 问 指 令(需 要 等 待 的 内 存 位 置 可 通 过 参 数 控 制)执 行 结 束,用 于 解 决Scalar的 内 存 依 赖。
函 数 原 型
C++
template <MemDsbT arg0>
__aicore__ inline void DataSyncBarrier()
参 数 说 明
表 1 模 板 参 数 说 明
| 参 数 名 | 描 述 |
|---|---|
| arg0 | 模 板 参 数,表 示 需 要 等 待 的 内 存 位 置,类 型 为MemDsbT,可 取 值 为: • ALL,等 待GM和UB的 访 问 指 令(不 包 括 其 他 内 存 位 置,例 如L0C Buffer、L1 Buffer)。 • DDR,等 待GM访 问 指 令。 • UB,等 待UB访 问 指 令。 • SEQ,等 待SEQ访 问 指 令。 |
返 回 值 说 明
无
约 束 说 明
等 待 的 内 存 位 置 取 值 为ALL时,只 能 等 待GM和UB的 访 问 指 令,不 包 括 其 他 内 存 位 置,例 如L0C Buffer、L1 Buffer。
调 用 示 例
C++
if (blockIdx == 0) {
// 先 写 入 被 依 赖 数 据,再 通 过DataSyncBarrier等 待GM访 问 完 成。
AscendC::WriteGmByPassDCache<T>(reinterpret_cast<__gm__ T *>(srcGm) + 1, DATA_VALUE);
// DataSyncBarrier<DDR>阻 塞 后 续GM写,确 保 上 一 条GM写 对 其 他 核 可 见。
AscendC::DataSyncBarrier<AscendC::MemDsbT::DDR>();
// 最 后 写 入 同 步 标 记,block 1读 到 该 标 记 后 即 可 安 全 读 取srcGm[1]。
AscendC::WriteGmByPassDCache<T>(reinterpret_cast<__gm__ T *>(srcGm), SYNC_FLAG);
}
if (blockIdx == 1) {
while (true) {
__gm__ T *addr = const_cast<__gm__ T *>(srcGlobal.GetPhyAddr());
// 轮 询GM第0个 元 素,等 待block 0写 入 同 步 标 记。
T flagValue = AscendC::ReadGmByPassDCache<T>(addr);
if (flagValue == SYNC_FLAG) {
// DataSyncBarrier保 证 同 步 标 记 之 前 的srcGm[1]写 入 已 完 成。
T dataValue = AscendC::ReadGmByPassDCache<T>(addr + 1);
AscendC::WriteGmByPassDCache<T>(reinterpret_cast<__gm__ T *>(dstGm), 2 * dataValue);
return;
}
}
}
完 整 样 例 请 参 考DataSyncBarrier接 口 样 例。