摩尔线程发布“花港”GPU新架构，万卡AI训练与推理能力，剑指英伟达_科技

摩尔线程发布“花港”GPU新架构，万卡AI训练与推理能力，剑指英伟达

凤凰网科技

2025-12-21 17:20:48

凤凰网科技讯 12月21日，摩尔线程于12月20日在北京首届MUSA开发者大会（MDC2025）上公布了新一代全功能GPU架构“花港”，并展示了其万卡规模AI训练集群及多项技术进展。

摩尔线程发布“花港”GPU新架构，万卡AI训练与推理能力，剑指英伟达

此次发布的核心内容涵盖架构升级、集群能力与推理性能等方面。新架构“花港”支持从FP4到FP64的全精度计算，算力密度提升50%，能效实现10倍提升。基于该架构，公司计划推出专注于AI训练与推理的“华山”芯片，以及面向图形渲染的“庐山”芯片。

在训练集群方面，摩尔线程推出“夸娥”万卡智算集群，称其具备全精度通用计算能力，训练算力利用率在稠密模型上达到60%，在混合专家模型上达40%，训练线性扩展效率为95%。在推理侧，公司与硅基流动合作，在DeepSeek R1 671B模型上实现单卡Prefill吞吐量超过4000 tokens/s，Decode吞吐量超过1000 tokens/s。

软件生态方面，MUSA 5.0版本对编程模型、计算库和编译器进行了优化，核心计算库muDNN的GEMM与FlashAttention效率超过98%，通信效率达97%。公司还计划逐步开源部分核心组件，包括计算加速库与系统管理框架。

在图形领域，新架构集成硬件光线追踪加速引擎，并支持自研的AI生成式渲染技术。摩尔线程还展示了在具身智能、AI for Science等前沿领域的布局，推出仿真训练平台MTLambda以及基于“长江”SoC的AI算力本MTT AIBOOK。

此外，公司公布了面向下一代超大规模智算中心的MTTC256超节点架构设计，着眼于高密度硬件与能效优化。

此次大会，摩尔线程系统展示了从芯片架构、集群基础设施到端侧设备的全栈技术布局，目标是为国内AI计算生态的发展提供硬件与软件支持。因此行业人士普遍认为，摩尔线程正全面对标英伟达，提前发布架构，以便提升软件生态信心。

上一篇：三星将推出搭载谷歌Gemini的AI冰箱，可识别食材、推荐菜谱

下一篇：刚刚，高中辍学生创办的AI公司，被英伟达花1400亿收购了