CANN发布管理9.0.0-beta.1
CANN 9.0.0-beta.1【免费下载链接】release-managementCANN版本发布管理仓库项目地址: https://gitcode.com/cann/release-management版本下载地址https://www.hiascend.com/cann/download版本配套1、CANN与Ascend HDK版本配套关系|CANN版本 | 配套Ascend HDK版本| |--|--| | CANN 9.0.0-beta.1| Ascend HDK 25.5.1|2、 CANN组合包版本配套关系 |ops版本 |配套toolkit版本 ||--|--| | ascend-cann-ops 9.0.0-beta.1| ascend-cann-toolkit 9.0.0-beta.1 |3、 CANN独立升级子包版本配套关系| CANN子包版本 | 版本源码标签 | 配套CANN版本 | | ------------------------------------------------------------ | ------------------------------------------------------------ | ----------------- | | cann-ops-math 9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-ops-nn 9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-ops-cv 9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-ops-transformer 9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-hccl 9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-hixl 9.0.0-beta.1 | CANN 9.0.0-beta.1 |4、CANN开源子包版本配套关系| CANN子包版本 | 版本源码标签 | 配套CANN版本 | | ---------------------------------- | ------------------------------------------------------------ | ----------------- | | cann-opbase 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-oam-tools 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-asc-tools 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-asc-devkit 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-pto-isa 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-ge-compiler 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-ge-executor 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-graph-autofusion 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-metadef 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-dflow-executor 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-hcomm 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 | | cann-npu-runtime 9.0.0-beta.1 | v9.0.0-beta.1 | CANN 9.0.0-beta.1 |子包独立升级的具体操作请参考子包独立升级。新增特性算子库ops-nn库低bit类算子和融合算子支持更多数据类型fp8/mxfp8/hifp8/mxfp4等并支持pertensor/perchannel/pertoken/pergroup/perblock等不同量化和组合方式全量化融合算子:quant_batch_matmul_v4。伪量化融合算子:weight_quant_batch_matmul_v2。mx动态量化算子:dynamic_mx_quant。非mx动态量化算子:dynamic_quant_v2。mx动态量化算子:grouped_dynamic_mx_quant。非mx动态量化算子:grouped_dynamic_block_quant。提供matmul、卷积、norm和hash类算子编程的优秀实践MatMul算子VCV性能优化实践与效果分析。MatMul算子性能优化实践与效果分析。新增的算子开发样例!620。支持编译生成静态库发布的nn独立组件包携带静态库!391。ops-transformer库transformer相关算子在Atlas A3系列产品上能力完善MC2 dispatch和combine算子支撑性能维测能力、类deepep接口和扩展泛化能力:moe_distribute_dispatch。SparseFlashAttentionGrad算子能力强化支持确定性计算等:sparse_flash_attention_grad。SparseFlashAttentionGrad算子能力强化支持确定性计算等:incre_flash_attention。MoeInitRoutingV2等算子能力强化支持int4和smoothquant等:moe_init_routing_v2。transformer相关算子在Atlas A2系列产品上能力完善新增AllToAllMatmul和MatmulAllToAll算子。支持QuantMatmulAllToAll算子A8W8。支持AllToAllQuantMatmul A16W8和A16W4。ops-math库算子工程支持kernel并行编译!779。算子工程日志优化#192。算子CI支持算子增量UT与冒烟!774 !817。算子构建脚本支持导出预编译文件降低算子问题定位难度#536。支持Docker部署!547。通信库集合通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品支持alltoallv算子aicpu展开模式通信task缓存功能#269。集合通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品支持单机多容器部署。集合通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品支持通信域粒度的超平面QoS配置#283。集合通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品支持aicpuhost 自定义算子场景的profiling信息上报能力提升自定义通信算子的维测能力#102 #374。集合通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品AICPU自定义算子场景支持host和aicpu间的kernel同步#90。单边通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品超节点内HCCS场景下支持D2rH直传能力本端device内存与远端host内存通信能力#33。图引擎ES构图提供多种场景的sample!72 、!123。ES构图Readable Dump支持子图的友好展示。自定义pass改图能力增强新增原图优化之后改图的能力。图模式多流场景nopadding连续内存支持内存复用。算子编程迁移高阶API样例ascendc-api-adv仓并使用调用方式。联合毕昇编译器优化融合编译性能。运行时提供包版本号查询接口根据包名查询返回数值版本号和字符串版本号接口如下aclError aclsysGetVersionStr(char *pkgName, char * versionStr)aclError aclsysGetVersionNum(char *pkgNameint32_t * versionNum)支持查询指定流Stream的优先级接口如下aclError aclrtStreamGetPriority(aclrtStream stream, uint32_t *priority)支持查询创建Stream时设置的flag标志接口如下aclError aclrtStreamGetFlags(aclrtStream stream, uint32_t *flags)支持获取Device的唯一标识UUIDUniversally Unique Identifier接口如下aclError aclrtDeviceGetUuid (int32_t deviceId, aclrtUuid *uuid)支持获取待查询地址所属内存块的起始地址以及内存块大小接口如下aclError aclrtMemGetAddressRange(void *ptr, void **pbase, size_t *psize)支持设置和查询强一致性计算的参数相关接口如下aclError aclrtSetSysParamOpt(aclSysParamOpt opt, int64_t value)aclError aclrtGetSysParamOpt(aclSysParamOpt opt, int64_t *value)aclError aclrtCtxSetSysParamOpt(aclSysParamOpt opt, int64_t value)aclError aclrtCtxGetSysParamOpt(aclSysParamOpt opt, int64_t *value)开发与维测工具性能调优工具多业务进程采集msprof动态profiler支持一次性配置多个进程pid支撑客户同时采集多个业务进程数据#45。支持开启对称内存新增-m 参数支持开启对称内存#44。AMCT模型压缩工具支持HIF8/MXFPx等低比特数据格式的量化能力新增HIF8/FP8/FP4/MXFP8/MXFP4量化数据类型新增HIF8匹配的OFMR量化算法#20。删除和废弃特性不涉及。已知问题无。已修复问题集合通信优化快恢时的状态迁移及超时机制解决快恢失败的问题。集合通信修复了大规模集群的通信域初始化失败问题在rootinfo集群信息收集阶段。漏洞修补列表版本开源及第三方软件漏洞修复情况详见漏洞修补列表。子包独立升级使用场景子包独立升级提供了灵活的按需升级功能。使用场景举例某用户已安装了a.b.c版本的组合包Ascend-cann-toolkit和Ascend-cann-ops由于业务需要要求将单边通信库能力更新至x.y.z版本此时可通过独立升级子包cann-hixl来实现。其中a.b.c和x.y.z请替换为实际版本号。操作步骤升级子包前请确保已安装配套版本的组合包Ascend-cann-toolkit和Ascend-cann-ops。如未安装请参考《CANN软件安装指南》进行安装。子包的升级路径应与组合包的安装路径保持一致。所有子包的升级操作相同以下以升级 cann-hixl_x.y.z_linux-aarch64.run 为例进行说明。升级场景一组合包Ascend-cann-toolkit和Ascend-cann-ops安装在默认路径下即安装时未使用“--install-path”参数chmod x cann-hixl_x.y.z_linux-aarch64.run ./cann-hixl_x.y.z_linux-aarch64.run --upgrade升级场景二组合包Ascend-cann-toolkit和Ascend-cann-ops安装在指定路径“/home/custom_path”即安装时指定“--install-path/home/custom_path”chmod x cann-hixl_x.y.z_linux-aarch64.run ./cann-hixl_x.y.z_linux-aarch64.run --upgrade --install-path/home/custom_path【免费下载链接】release-managementCANN版本发布管理仓库项目地址: https://gitcode.com/cann/release-management创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考