
【导读】摩尔线程发布新一代GPU架构“花港”等
中国基金报记者 卢鸰
12月20日上午,备受市场关注的摩尔线程首届MUSA开发者大会在北京中关村国际创新中心召开。在此次大会上,摩尔线程展示了以自主MUSA统一架构为核心的全栈技术成果,包括新一代GPU架构“花港”、未来将发布的“华山”芯片和“庐山”芯片,以及夸娥万卡智算集群。
发布新一代GPU架构“花港”
MUSA是摩尔线程自主研发的元计算统一计算架构,是其战略基石,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。
基于MUSA统一体系,摩尔线程揭晓新一代全功能GPU架构“花港”,该架构在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破,其核心特性包括:
1.计算性能显著提升:基于新一代指令集,算力密度提升50%,能效大幅优化;支持从FP4到FP64的全精度端到端计算,新增MTFP6/MTFP4及混合低精度支持。
2.异步编程与超大规模互联:集成新一代异步编程模型,优化任务调度与并行机制;通过自研MTLink高速互联技术,支持十万卡以上规模智算集群扩展。
3.图形与AI深度融合:内置AI生成式渲染架构,增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate,实现图形渲染与智能计算的高度协同。
基于“花港”架构,摩尔线程公布了未来将发布的两款芯片技术路线:
“华山”专注AI训推一体与超大规模智能计算,为万卡级智算集群提供稳定高效的算力支撑,是构建下一代“AI工厂”的坚实底座。
“庐山”专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量。
推出夸娥万卡智算集群
在此次大会上,摩尔线程还正式发布了夸娥万卡智算集群。该集群具备全精度、全功能通用计算能力,在万卡规模下能实现高效稳定的AI训练与推理。
据摩尔线程介绍,其核心突破包括:浮点运算能力达到10Exa-Flops,训练算力利用率(MFU)在Dense大模型上达60%,MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95%,与国际主流生态高度兼容,并在多项指标上具备显著能效优势。
不过,摩尔线程没有在现场展示上述产品。
而在12月18日的光合组织2025人工智能创新技术大会上,中科曙光发布了曙光scaleX万卡超集群系统,这是国产万卡级算力集群首次以真机形式公开亮相。
据介绍,中科曙光的scaleX万卡超集群在超节点架构、高速互连网络、存储性能优化、系统管理调度等方面实现了多项创新突破,部分技术与能力已超越英伟达研发路线图的2027年NVL576里程节点。
值得注意的是,面向更广阔的未来计算场景,摩尔线程已展开前瞻性布局,包括发布MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建了开发、仿真、训练的高效统一环境;推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群“端云结合”的MT Robot具身智能解决方案等。
校对:纪元
编辑:舰长
审核:许闻
版权声明
《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。
授权转载合作联系人:于先生(电话:0755-82468670)