IT之家 11 月 12 日音书,摩尔线程通知开源高性能线性代数模板库 MUTLASS,以便成就者大意更高效针对摩尔线程全功能 GPU 的 MUSA Core 及 Tensor Core 等单位进行编程,加快基于国产 GPU 的算子成就以及算法革命。
看成摩尔线程专为 MUSA 架构优化的高性能蓄意库,MUTLASS(MUSA Templates for Linear Algebra Subroutines)是基于开源模板库 CUTLASS 进行的 MUSA 适配和定制化成就、优化。
针对矩阵乘法及连络变种,MUTLASS 提供了一系列高性能的 C++ 模板组件,并领受了与 muDNN 库相同的分层明白及数据搬运计策,以确保性能的充分默契。
在本次开源的版块中,摩尔线程适配了 CuTe 后端库,为其加多了第三代 MUSA 架构的 MMA 蓄意原语,救济 TF32 / FP16 / BF16 / INT8 等多种数据精度,并以此为基础,初步杀青了矩阵乘法、默许实例库、性能测试器及连络器具包的救济。
IT之家附 MUTLASS 开源地址:https://github.com/MooreThreads/mutlass开yun体育网
