全国重点城市联盟网站 百城联盟
手机报 电子版 微信公众号
您的位置:首页 > 滚动 > 正文

国产GPU赋能“AI工厂”,摩尔线程夸娥智算集群夯实算力根基

2025-09-28 17:24:12    来源:    责任编辑:

  在人工智能技术迭代加速、大模型训练算力需求激增的当下,构建高效稳定且自主可控的算力基础设施,成为产业高质量发展的关键。2025世界人工智能大会(WAIC)上,摩尔线程创始人兼CEO张建中首次提出“AI工厂”理念,将其定义为“AGI时代生产先进模型的超级工厂”。这一理念是涵盖底层芯片架构创新、集群架构优化、软件算法调优及资源调度升级的系统性变革,而作为“AI工厂”算力基础设施核心载体的夸娥(KUAE)智算集群,正以摩尔线程自主研发的全功能国产GPU为核心,构建软硬一体解决方案,为国产大模型训练提供高效、稳定、易用的算力平台。

  基石:一体化的全栈AI解决方案

  传统模式下,从算力建设、应用开发到运维运营平台搭建的商业化运营,需耗时数月。而摩尔线程自研夸娥智算集群采用一体化交付模式,预集成夸娥计算集群、RDMA网络、分布式存储及夸娥集群管理平台(KUAE Platform)及夸娥模型服务平台(KUAE ModelStudio),真正实现“开箱即用”,大幅缩短算力落地周期,为“AI工厂”快速启动奠定基石。

  效能:驱动“产线”的极致训练效率

  “工厂”的核心价值在于高效产出,夸娥智算集群通过多维度优化将训练效率拉满。在计算精度方面,摩尔线程支持从FP64至INT8的完整精度谱系,并通过FP8混合精度技术,在主流前沿大模型训练中实现20%~30%的性能跃升,为国产GPU的算力效率树立行业标杆。

  其创新的5D并行训练策略(融合数据、模型、张量、流水线、专家并行技术),搭配超大规模集群自动搜索最优并行策略的性能优化工具与秒级备份恢复能力,实现上千节点的高效协作,推动AI基础设施从单点优化迈向系统工程级突破。其中,KUAE2智算集群支持最高10,240颗GPU部署,训练性能行业领先;同时,依托于在FP8混合精度计算方面的原生优势,其精度与BF16几乎无损,FP8 GEMM利用率亦处于行业前列。此外,借助摩尔线程自主研发的Simumax工具自动搜索最优并行策略,精准模拟FP8混合精度训练与算子融合后,DeepSeek的训练性能指标大幅提升,为缩短模型训练周期提供科学支撑。

  保障:确保“AI工厂”连续稳定运行

  规模化训练的稳定性是“AI工厂”持续运转的关键,夸娥智算集群引入多重保障。“零中断”容错技术可在硬件故障时智能隔离问题节点组,其余节点训练不中断、备机无缝接入,有效训练时间占比超99%,大幅降低故障导致的“停产”损失;多维度训练洞察体系实现动态监测与智能诊断,异常处理效率提升50%,结合集群巡检与起飞检查,训练成功率提高10%,为大规模AI训练提供稳定保障。

  随着大模型技术向各行业深度渗透,算力基础设施的自主化、高效化逐渐成为产业升级的基础需求。作为国产GPU领域的先行者,摩尔线程正以“AI工厂”理念为核心,整合从芯片到软件生态的全栈技术能力,推动国产算力基础设施向规模化、高效率的模型训练方向升级。而以夸娥智算集群为核心依托的“AI工厂”,凭借国产GPU带来的核心算力支撑,以及一体化交付、高稳定性等优势,既能满足当前国产大模型训练对高效算力的需求,也将为中国人工智能产业自主创新与高质量发展筑牢算力基座。

相关新闻

互联网违法不良信息举报 意见反馈 新闻地图 旧版回顾
网站简介 - 联系方法 - 招聘信息 - 广告服务 - 网站地图
©1997-2018