Skip to content
版 本

SetFlag/WaitFlag(ISASI)

产 品 支 持 情 况

产 品

是 否 支 持

Ascend 950PR/Ascend 950DT

Atlas A3 训 练 系 列 产 品/Atlas A3 推 理 系 列 产 品

Atlas A2 训 练 系 列 产 品/Atlas A2 推 理 系 列 产 品

Atlas 200I/500 A2 推 理 产 品

x

Atlas 推 理 系 列 产 品AI Core

Atlas 推 理 系 列 产 品Vector Core

x

Atlas 训 练 系 列 产 品

Kirin X90

Kirin 9030

功 能 说 明

头 文 件 路 径 为:"basic_api/kernel_operator_block_sync_intf.h"

如 图1所 示,SetFlag/WaitFlag接 口 用 于 核 内 多 流 水 间 的 同 步:

  • SetFlag:当 源 流 水 的 前 序 指 令 的 所 有 读 写 操 作 都 完 成 之 后,当 前 指 令 开 始 执 行,并 将 硬 件 中 的 对 应 标 志 位 设 置 为1。SetFlag只 是 设 置 硬 件 中 的 对 应 标 志 位,并 不 会 阻 塞 源 流 水 中 的 下 一 个 指 令。
  • WaitFlag:当 目 的 流 水 执 行 到 该 指 令 时,如 果 发 现 硬 件 中 对 应 标 志 位 为0,目 的 流 水 的 后 续 指 令 将 一 直 被 阻 塞;如 果 发 现 硬 件 中 对 应 标 志 位 为1,则 将 硬 件 中 对 应 标 志 位 设 置 为0,同 时 目 的 流 水 的 后 续 指 令 开 始 执 行。

图 1 SetFlag/WaitFlag接 口 功 能 示 意 图

函 数 原 型

C++
template <HardEvent event>
__aicore__ inline void SetFlag(int32_t eventID)
template <HardEvent event>
__aicore__ inline void WaitFlag(int32_t eventID)

参 数 说 明

表 1 参 数 说 明

参 数 名输 入/输 出描 述
event输 入模 板 参 数。
同 步 事 件,数 据 类 型 为HardEvent。同 一 核 内 的 不 同 流 水 之 间,在 存 在 数 据 访 问 依 赖 时,需 要 根 据 数 据 访 问 的 先 后 顺 序,插 入 对 应 的 同 步 事 件。HardEvent用 来 表 示 对 应 的 同 步 事 件。HardEvent命 名 规 则 为<源 流 水_目 标 流 水>,其 中 源 流 水 的 指 令 先 执 行、目 标 流 水 中 的 指 令 后 执 行。例 如MTE2_V,代 表PIPE_MTE2为 源 流 水,PIPE_V为 目 标 流 水,标 识 从PIPE_MTE2到PIPE_V的 同 步,PIPE_V等 待PIPE_MTE2。由 于 硬 件 架 构 版 本 代 际 间 的 差 异,不 同 硬 件 架 构 上 的 事 件 存 在 差 异。
eventID输 入事 件ID。数 据 类 型 为int32_t类 型。eventID的 取 值 范 围 与 产 品 型 号 有 关,具 体 请 参 考约 束 说 明

返 回 值 说 明

约 束 说 明

  • SetFlag只 是 设 置 硬 件 标 志 位,不 会 阻 塞 源 流 水 中 的 下 一 个 指 令。

  • SetFlag和WaitFlag必 须 成 对 使 用,且SetFlag和WaitFlag的 参 数 必 须 完 全 一 致(包 括 模 板 参 数event和 输 入 参 数eventID)。如 果 不 匹 配,会 引 发timeout问 题。例 如,SetFlag<HardEvent::S_MTE3>(1)WaitFlag<HardEvent::MTE3_MTE1>(1)并 不 匹 配,因 为 其 模 板 参 数event不 同。

  • 使 用TPipe和TQue编 程 方 式时,eventID需 要 通 过AllocEventID或 者FetchEventID来 获 取。

  • 在 使 用静 态Tensor编 程 方 式时,事 件 的 类 型 和 事 件ID由 开 发 者 自 行 管 理,建 议 使 用 事 件ID0-5,事 件ID6用 于 系 统 内 部 规 划(当 前 未 使 用),事 件ID7用 于TPipe编 程 中 的自 动 同 步功 能,目 前 暂 不 建 议 直 接 使 用 事 件ID6-7。

  • eventID的 取 值 范 围 如 下:

Text
- Ascend 950PR/Ascend 950DT,数 据 范 围 为:0-7。
- Atlas A3 训 练 系 列 产 品/Atlas A3 推 理 系 列 产 品,数 据 范 围 为:0-7。
- Atlas A2 训 练 系 列 产 品/Atlas A2 推 理 系 列 产 品,数 据 范 围 为:0-7。
- Atlas 推 理 系 列 产 品AI Core,数 据 范 围 为:0-7。
- Atlas 训 练 系 列 产 品,数 据 范 围 为:0-3。

调 用 示 例

C++
AscendC::DataCopy(src1Local, src1Global[i * tileLength], tileLength);
    AscendC::DataCopy(src0Local, src0Global[i * tileLength], tileLength);
    
    // 循 环 内 依 赖:先“DataCopy(PIPE_MTE2)写src0Local”,后“Maxs和Mins(PIPE_V)读src0Local”。
    // 由 于PIPE_V需 要 等 待PIPE_MTE2,所 以 需 要 插 入 以 下 同 步。
    AscendC::SetFlag<AscendC::HardEvent::MTE2_V>(EVENT_ID0);
    AscendC::WaitFlag<AscendC::HardEvent::MTE2_V>(EVENT_ID0);

    AscendC::Maxs(tmpTensor1, src0Local, inputVal, tileLength);
    AscendC::Mins(tmpTensor2, src0Local, inputVal, tileLength);

免 责 声 明:本 站 内 容 由 asc-devkit 仓 master 分 支 自 动 编 译 生 成,属 于 持 续 开 发 版 本,可 能 存 在 缺 陷,仅 供 预 览 与 参 考。如 需 稳 定 及 商 用 资 料,请 查 阅 官 方 昇 腾 社 区