
适配,适配代码同步开源。这是寒武纪连续第二次在DeepSeek新模型发布首日便推出国产芯片适配方案。针对DeepSeek-V4全新结构,寒武纪通过自研高性能融合算子库Torch-MLU-Ops,对Compressor、mHC等模块专项加速;并运用BangC编程语言编写稀疏/压缩Attention、GroupGemm等热点算子的极致优化Kernel,充分释放硬件底层潜力。此前双方通过软硬件协同优化,
当前文章:http://wy780j.ruocenqi.cn/464g/ia54x.html
发布时间:09:30:28

