Cast(多 类 型 转float)
产 品 支 持 情 况
| 产 品 | 是 否 支 持 |
|---|---|
Ascend 950PR/Ascend 950DT | √ |
Atlas A3 训 练 系 列 产 品/Atlas A3 推 理 系 列 产 品 | √ |
Atlas A2 训 练 系 列 产 品/Atlas A2 推 理 系 列 产 品 | √ |
Atlas 200I/500 A2 推 理 产 品 | x |
Atlas 推 理 系 列 产 品AI Core | x |
Atlas 推 理 系 列 产 品Vector Core | x |
Atlas 训 练 系 列 产 品 | x |
功 能 说 明
头 文 件 路 径 为:"basic_api/kernel_operator_scalar_intf.h"。
该 接 口 将 输 入 数 据 转 换 为float类 型。
函 数 原 型
以 下 函 数 原 型 仅 支 持:
- Atlas A2 训 练 系 列 产 品/Atlas A2 推 理 系 列 产 品
- Atlas A3 训 练 系 列 产 品/Atlas A3 推 理 系 列 产 品
bfloat16_t类 型 转 换 为float类 型:
C++
__aicore__ inline float Cast(const bfloat16_t& bVal)
以 下 函 数 原 型 仅 支 持Ascend 950PR/Ascend 950DT:
支 持 多 种 数 据 类 型 转 换 为float类 型:
C++
template <typename T, typename U = float,
typename = Std::enable_if_t<
(Std::is_same<T, bfloat16_t>::value || Std::is_same<T, hifloat8_t>::value ||
Std::is_same<T, fp8_e5m2_t>::value || Std::is_same<T, fp8_e4m3fn_t>::value ||
Std::is_same<T, fp4x2_e1m2_t>::value || Std::is_same<T, fp4x2_e2m1_t>::value),
void>>
__aicore__ constexpr inline U Cast(T bVal)
参 数 说 明
表 1 模 板 参 数 说 明
| 参 数 名 | 描 述 |
|---|---|
| T | 操 作 数 数 据 类 型。 |
| U | 返 回 值 数 据 类 型。 |
表 2 接 口 参 数 说 明
| 参 数 名 称 | 输 入/输 出 | 含 义 |
|---|---|---|
| bVal | 输 入 | 待 转 换 的 标 量 数 据。 |
数 据 类 型
支 持 的 操 作 数 数 据 类 型 如 下:
- Ascend 950PR/Ascend 950DT,支 持fp4x2_e2m1_t、fp4x2_e1m2_t、hifloat8_t、fp8_e5m2_t、fp8_e4m3fn_t、bfloat16_t。
- Atlas A3 训 练 系 列 产 品/Atlas A3 推 理 系 列 产 品,支 持bfloat16_t。
- Atlas A2 训 练 系 列 产 品/Atlas A2 推 理 系 列 产 品,支 持bfloat16_t。
- fp4x2_e1m2_t和fp4x2_e2m1_t类 型 为 了 满 足1byte数 据 大 小,构 造 时 由 两 个 四 位 标 量 数 据 拼 接 生 成。转 换 时,被 转 换 的 是fp4x2_e1m2_t和fp4x2_e2m1_t标 量 数 据 中 低 位4bit的 值,即[0:3]位。
支 持 的 返 回 值 数 据 类 型 为float。
返 回 值 说 明
转 换 后 的float类 型 标 量 数 据。
约 束 说 明
输 入 参 数 为 立 即 数 时,需 要 使 用 显 式 类 型 转 换,例 如:
C++
// 错 误 写 法,AscendC暂 不 支 持 整 数 类 型 转float,编 译 报 错
float x = AscendC::Cast(1);
// 正 确 写 法
float x = AscendC::Cast((bfloat16_t)1);
调 用 示 例
C++
float fVal = 3.14159;
bfloat16_t bVal = AscendC::Cast(fVal); // 返 回3.140625
fVal = AscendC::Cast(bVal); // 返 回3.140625