凤凰网科技讯 12月21日,摩尔线程于12月20日在北京首届MUSA开发者大会(MDC2025)上公布了新一代全功能GPU架构“花港”,并展示了其万卡规模AI训练集群及多项技术进展。

此次发布的核心内容涵盖架构升级、集群能力与推理性能等方面。新架构“花港”支持从FP4到FP64的全精度计算,算力密度提升50%,能效实现10倍提升。基于该架构,公司计划推出专注于AI训练与推理的“华山”芯片,以及面向图形渲染的“庐山”芯片。
在训练集群方面,摩尔线程推出“夸娥”万卡智算集群,称其具备全精度通用计算能力,训练算力利用率在稠密模型上达到60%,在混合专家模型上达40%,训练线性扩展效率为95%。在推理侧,公司与硅基流动合作,在DeepSeek R1 671B模型上实现单卡Prefill吞吐量超过4000 tokens/s,Decode吞吐量超过1000 tokens/s。
软件生态方面,MUSA 5.0版本对编程模型、计算库和编译器进行了优化,核心计算库muDNN的GEMM与FlashAttention效率超过98%,通信效率达97%。公司还计划逐步开源部分核心组件,包括计算加速库与系统管理框架。
在图形领域,新架构集成硬件光线追踪加速引擎,并支持自研的AI生成式渲染技术。摩尔线程还展示了在具身智能、AI for Science等前沿领域的布局,推出仿真训练平台MTLambda以及基于“长江”SoC的AI算力本MTT AIBOOK。
此外,公司公布了面向下一代超大规模智算中心的MTTC256超节点架构设计,着眼于高密度硬件与能效优化。
此次大会,摩尔线程系统展示了从芯片架构、集群基础设施到端侧设备的全栈技术布局,目标是为国内AI计算生态的发展提供硬件与软件支持。 因此行业人士普遍认为,摩尔线程正全面对标英伟达,提前发布架构,以便提升软件生态信心。