asc.language.adv.get_special_basic_config【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyascasc.language.adv.get_special_basic_config(basic_m: int, basic_n: int, basic_k: int, single_core_m: int, single_core_n: int, single_core_k: int, step_m: int, step_n: int, intrinsics_limit: bool | None False, batch_loop: bool | None False, bmm_mode: BatchMode | None BatchMode.BATCH_LESS_THAN_L1) → MatmulConfig用于配置SpecialBasicBlock模板的参数获取自定义SpecialBasicBlock模板。当前为预留接口。对应的Ascend C函数原型__aicore__ constexpr MatmulConfig GetSpecialBasicConfig(const uint32_t basicM, const uint32_t basicN, const uint32_t basicK, const uint32_t singleCoreM, const uint32_t singleCoreN, const uint32_t singleCoreK, const uint32_t stepM, const uint32_t stepN, const bool intrinsicsLimit false, const bool batchLoop false, const BatchMode bmmMode BatchMode::BATCH_LESS_THAN_L1)参数说明basic_m: 用于设置参数basicM。与TCubeTiling结构体中的baseM参数含义相同Matmul计算时base块M轴长度以元素为单位。basic_n: 用于设置参数basicN。与TCubeTiling结构体中的baseN参数含义相同Matmul计算时base块N轴长度以元素为单位。basic_k: 用于设置参数basicK。与TCubeTiling结构体中的baseK参数含义相同Matmul计算时base块K轴长度以元素为单位。single_core_m: 用于设置参数singleCoreM。单核内M轴shape大小以元素为单位。single_core_n: 用于设置参数singleCoreN。单核内N轴shape大小以元素为单位。single_core_k: 用于设置参数singleCoreK。单核内K轴shape大小以元素为单位。step_m: 用于设置参数stepM。左矩阵在A1中缓存的bufferM方向上baseM的倍数。step_n: 用于设置参数stepN。右矩阵在B1中缓存的bufferN方向上baseN的倍数。intrinsics_limit: 用于设置参数intrinsicsCheck。 当左矩阵或右矩阵在单核上内轴即尾轴大于等于65535元素个数时是否使能循环执行数据从Global Memory到 L1 Buffer的搬入。例如左矩阵A[M, K]单核上的内轴数据singleCoreK大于65535配置该参数为true后API 内部通过循环执行数据的搬入。参数取值如下False当左矩阵或右矩阵在单核上内轴大于等于65535时不使能循环执行数据的搬入默认值。True当左矩阵或右矩阵在单核上内轴大于等于65535时使能循环执行数据的搬入。batch_loop: 用于设置参数isNBatch。 是否多Batch输入多Batch输出。仅对BatchMatmul有效使能该参数后仅支持Norm模板且需调用IterateNBatch实现多 Batch输入多Batch输出。参数取值如下False不使能多Batch默认值。True使能多Batch。bmm_mode: 用于设置参数batchMode。 BatchMatmul场景中Layout类型为NORMAL时设置BatchMatmul输入A/B矩阵的多batch数据总和与L1 Buffer的大小关系。 参数取值如下batchMode::BATCH_LESS_THAN_L1多batch数据总和L1 Buffer Size。batchMode::BATCH_LARGE_THAN_L1多batch数据总和L1 Buffer Size。batchMode::SINGLE_LARGE_THAN_L1单batch数据总和L1 Buffer Size。返回值说明MatmulConfig结构体。【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考