CANN ascend-transformer-boost aclnn与ATB算子混搭示例
aclnnPluginOperation与ATBOperation混搭组图示例【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库基于华为Ascend AI处理器提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost介绍本用例为aclnnPluginOperation与ATBOperation混搭组图的运行示例该用例整体分为五个部分aclnn算子部分、ATB算子部分、model部分、基础设施部分、主函数。aclnn算子部分实现了aclnn算子对ATB的接入。ATB算子部分使用ATB原生算子构建了一个ATB图算子。model部分主要使用了ATB算子部分与aclnn算子部分生成的算子构建了一个更大的图算子并且包含ATB图算子相关的调用逻辑。基础设施部分主要包含日志与内存池用于辅助问题定位及加快显存分配速度。主函数部分承载着程序入口的功能同时多线程功能也在主函数中实现。用例运行进入到atb-aclnn目录下:cd ${用例所在目录}/atb-aclnn设置CANN环境变量如source /usr/local/Ascend/ascend-toolkit/set_env.sh:source ${toolkit安装目录}/set_env.sh设置ATB环境变量如source /usr/local/Ascend/nnal/atb/set_env.sh:source ${nnal安装目录}/atb/set_env.sh执行build.sh脚本:bash ./build.sh执行用例:./build/test_model说明当前用例根据物理机上的device卡数创建线程若需要调整线程个数请自行修改main.cpp中的线程创建个数。保证demo的ABI版本与ATB一致。ATB的abi版本的查看方法env | grep ATB_HOME_PATHdemo的ABI版本查看方法通过查看CMakeList中的如下命令来查看ABI版本为0或1OFF表示0ON表示1。下面的代码则表示ABI版本为0。option(USE_CXX11_ABI USE_CXX11_ABI OFF)【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库基于华为Ascend AI处理器提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考