asc_mem_bar
产 品 支 持 情 况
| 产 品 | 是 否 支 持 |
|---|---|
| Ascend 950PR/Ascend 950DT | √ |
功 能 说 明
Reg计 算 宏 函 数 内 不 同 流 水 线 之 间 的 同 步 指 令。该 同 步 指 令 指 定 源 流 水 线 和 目 的 流 水 线,如 下 图 所 示,目 的 流 水 线 将 等 待 源 流 水 线 上 所 有 指 令 完 成 才 进 行 执 行。 读 写 场 景 下,当 读 指 令 使 用 的 寄 存 器 和 写 指 令 使 用 的 寄 存 器 相 同 时,可 以 触 发 寄 存 器 保 序,指 令 将 会 按 照 代 码 顺 序 执 行,不 需 要 插 入 同 步 指 令,而 当 使 用 的 寄 存 器 不 同 时,如 果 要 确 保 读 写 指 令 执 行,则 需 要 插 入 同 步 指 令。写 写 场 景 同 理。

函 数 原 型
C++
__simd_callee__ inline void asc_mem_bar(MEM_TYPE mem_type)
参 数 说 明
表1参 数 说 明
| 参 数 名 | 输 入/输 出 | 描 述 |
|---|---|---|
| mem_type | 输 入 | 同 步 流 水 线 的 类 型,类 型 为MEM_TYPE,取 值 范 围 见 表2 mem_type取 值 说 明。 |
表2 mem_type取 值 说 明(源 流 水 线/目 的 流 水 线 表 示 的 含 义 见 表3 Reg计 算 流 水 线 说 明)
| 值 | 源 流 水 线 | 目 的 流 水 线 |
|---|---|---|
| VV_ALL | VEC_ALL | VEC_ALL |
| VST_VLD | VEC_STORE | VEC_LOAD |
| VLD_VST | VEC_LOAD | VEC_STORE |
| VST_VST | VEC_STORE | VEC_STORE |
| VS_ALL | VEC_ALL | SCALAR_ALL |
| VST_LD | VEC_STORE | SCALAR_LOAD |
| VLD_ST | VEC_LOAD | SCALAR_STORE |
| VST_ST | VEC_STORE | SCALAR_STORE |
| SV_ALL | SCALAR_ALL | VEC_ALL |
| ST_VLD | SCALAR_STORE | VEC_LOAD |
| LD_VST | SCALAR_LOAD | VEC_STORE |
| ST_VST | SCALAR_STORE | VEC_STORE |
| SS_ALL | SCALAR_ALL | SCALAR_ALL |
| ST_LD | SCALAR_STORE | SCALAR_LOAD |
| LD_ST | SCALAR_LOAD | SCALAR_STORE |
| ST_ST | SCALAR_STORE | SCALAR_STORE |
表3 Reg计 算 流 水 线 说 明
| 流 水 线 | 含 义 |
|---|---|
| VEC_STORE | SIMD_VF函 数 内 矢 量 写UB流 水 线。 对 应 寄 存 器 到UB的 搬 运 指 令,例 如asc_store。 |
| VEC_LOAD | SIMD_VF函 数 内 矢 量 读UB流 水 线。 对 应UB到 寄 存 器 的 搬 运 指 令,例 如asc_load。 |
| SCALAR_STORE | SIMD_VF函 数 内 标 量 写UB流 水 线。 对 应 标 量 写 入UB的 指 令,例 如asc_duplicate_scalar。 |
| SCALAR_LOAD | SIMD_VF函 数 内 标 量 读UB流 水 线。 对 应UB读 取 标 量 的 指 令。 |
| VEC_ALL | SIMD_VF函 数 内 所 有 矢 量 读 写UB流 水 线。 |
| SCALAR_ALL | SIMD_VF函 数 内 所 有 标 量 读 写UB流 水 线。 |
返 回 值 说 明
无
流 水 类 型
PIPE_S
约 束 说 明
无
调 用 示 例
如 下 示 例 中,for循 环 中 后 一 次 循 环 中 读UB矢 量 搬 运,和 前 一 次 循 环 中 写UB矢 量 搬 运,操 作 了 同 一 块UB地 址 空 间。因 此 后 一 次 循 环 中 读UB矢 量 搬 运 需 要 等 待 前 一 次 循 环 中 写UB矢 量 搬 运 执 行 完 成 后 才 能 执 行,需 要 插 入VEC_LOAD等 待VEC_STORE的 同 步VST_VLD。
C++
// ub_addr是 外 部 输 入 的UB内 存 空 间 地 址
__ubuf__ half* ub_addr;
vector_half dst;
vector_half src0;
vector_half src1;
vector_bool mask;
uint16_t repeatTime = 8;
uint16_t repeatSize = 64;
for (uint16_t i = 1; i < repeatTime; i++) {
asc_mem_bar(VST_VLD);
asc_loadalign(src0, ub_addr[0]);
asc_loadalign(src1, ub_addr[i * repeatSize]);
asc_add(dst, src0, src1, mask);
asc_storealign(ub_addr[0], dst, mask);
}