Skip to content
版 本

LoadUnzipIndex

产 品 支 持 情 况

产 品

是 否 支 持

Ascend 950PR/Ascend 950DT

x

Atlas A3 训 练 系 列 产 品/Atlas A3 推 理 系 列 产 品

x

Atlas A2 训 练 系 列 产 品/Atlas A2 推 理 系 列 产 品

x

Atlas 200I/500 A2 推 理 产 品

x

Atlas 推 理 系 列 产 品AI Core

Atlas 推 理 系 列 产 品Vector Core

x

Atlas 训 练 系 列 产 品

x

功 能 说 明

加 载GM上 的 压 缩 索 引 表 到 内 部 寄 存 器。

索 引 表 为LoadDataUnzip压 缩 信 息,例 如 压 缩 长 度 等,以 获 取 压 缩 后 的 数 据。

索 引 表 由 压 缩 工 具 根 据 对 应 的 权 重 数 据 离 线 生 成。一 个LoadUnzipIndex指 令 可 以 加 载 多 个 索 引 表,而 每 个LoadDataUnzip指 令 只 能 消 耗 一 个 索 引 表。因 此,索 引 表 之 间 的 顺 序 应 该 由 用 户 来 确 定,以 确 保 其 与 压 缩 数 据 的 对 应 性。

函 数 原 型

Text
template <typename T = int8_t, typename Std::enable_if<Std::is_same<PrimT<T>, int8_t>::value, bool>::type = true> 
__aicore__ inline void LoadUnzipIndex(const GlobalTensor<T>& src, uint32_t numOfIndexTabEntry)

参 数 说 明

表 1 模 板 参 数 说 明

参 数 名

描 述

T

src的 数 据 类 型。

  • 当src使 用 基 础 数 据 类 型 时, 其 数 据 类 型 必 须 为uint8_t,否 则 编 译 失 败。
  • 当src使 用TensorTrait类 型 时, src数 据 类 型T的LiteType必 须 为int8_t,否 则 编 译 失 败。

最 后 一 个 模 板 参 数 仅 用 于 上 述 数 据 类 型 检 查,用 户 无 需 关 注。

表 2 参 数 说 明

参 数 名 称

输 入/输 出

含 义

src

输 入

源 操 作 数,索 引 表 地 址,类 型 为GlobalTensor。

src地 址 必 须2字 节 对 齐。src长 度 必 须 是512字 节 的 整 数 倍,最 大 为32KB。

numOfIndexTabEntry

输 入

输 入 数 据,表 示 加 载 的 索 引 表 个 数。索 引 表 个 数 必 须 大 于0。

返 回 值 说 明

约 束 说 明

  • 操 作 数 地 址 对 齐 要 求 请 参 见通 用 地 址 对 齐 约 束
  • LoadUnzipIndex必 须 在 任 何LoadDataUnzip指 令 之 前 执 行。
  • LoadUnzipIndex加 载 的 索 引 表 个 数 必 须 大 于 或 等 于LoadDataUnzip指 令 执 行 的 次 数。

调 用 示 例

该 调 用 示 例 支 持 的 运 行 平 台 为Atlas 推 理 系 列 产 品AI Core。详 细 用 例 请 参 考LoadDataUnzip

Text
indexGlobal.SetGlobalBuffer((__gm__ int8_t*)indexGm);
AscendC::LoadUnzipIndex(indexGlobal, numOfIndexTabEntry);

免 责 声 明:本 站 内 容 由 asc-devkit 仓 master 分 支 自 动 编 译 生 成,属 于 持 续 开 发 版 本,可 能 存 在 缺 陷,仅 供 预 览 与 参 考。如 需 稳 定 及 商 用 资 料,请 查 阅 官 方 昇 腾 社 区