CloudMatrix 384超节点以“系统级创新”撕裂技术“铁幕”
5月14日,美国商务部工业与安全局(BIS)发布一系列细则,其中警告使用中国先进计算芯片的企业,可能违反美国出口管制规定,并有可能受到美国商务部的处罚。而按照美国BIS的出口管制分类编号(ECCN)3A090的条件要求,昇腾系列芯片均位列其中。
一直以来,美国都将科技领先作为全球领导地位的核心支撑,但中国科技领域的崛起明显让美国感受到了重大威胁。
因为在一个月前,华为刚刚宣布推出CloudMatrix 384,这是一个由384张卡组成的超节点,可提供高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统的两倍。

如果说单卡的升级是在AI算力上单点创新,那么华为则通过系统工程能力的创新,形成了系统化的突破。这意味着华为有能力通过垂直整合,大幅降低成本提高效率。
从单点突破,迈向系统级创新
《系统论》表明,计算机生态是一个完整的系统,它的每一个组成部分都应该协同发展,单独某一项技术的飞跃,并不能带来整个计算机系统的提升。
单点创新解决关键部件“头疼医头,脚疼医脚”的问题,但并没有解决整个技术体系自主创新的系统性问题。

昇腾在单点创新上已经非常出色,但单点芯片性能再强,若缺乏高效的互联架构、散热设计、软件优化和生态支持,也无法充分发挥算力的最高价值。
而在网络层面,超节点的MatrixLink服务,可以将单层网络升级为两层高速网络,其中一层是超节点内部的ScaleUp总线网络,确保超节点内384卡全对等高速无阻塞互联,卡间超大带宽2.8T,纳秒级时延。
另一层,则是跨超节点间的ScaleOut网络,可支持微秒级时延,资源弹性扩展,最大支持128k组网规模。同时,基于全局拓扑感知的智能调度算法,对于流量冲突,可规划最佳流量路径,确保无阻塞交换。并以此实现了“以网强算”。
另外,传统方案中的GPU卡显存和算力绑定,要获取更多的内存,就必须购买NPU,造成算力浪费。对此,华为云推出了业界首创的EMS弹性内存存储, 以EMS替代NPU中的显存,使得首Token时延大幅降低,同时将原来在NPU中进行的KV计算卸载到CPU和EMS中,使得系统吞吐量提升100%以上。做到了“以存强算”。
不难发现, CloudMatrix 384的诞生,在算力层面绝不是硬件上的简单堆叠,而是通过“以网强算”和“以存强算”这样的核心技术突破,让每一分算力都更具价值。
这也正是美国所担忧的,系统级能力能绕过单点技术封锁,形成自主创新的强大算力。而在AI推理盛行的当下,CloudMatrix 384的价值还远不止于此。
系统级创新,做数字中国的算力底座
我们知道,MoE(混合专家)大模型,通过将任务分配给多个专家子模型显著提升推理效率,降低了计算成本,同时保持了模型性能。
DeepSeek又通过优化MoE架构的专家路由机制,提升模型推理效率,同时降低计算成本,使MoE更适合大规模部署。也让MoE在大模型时代更具竞争力,成为高效AI推理的重要解决方案。
可以说,更高的MoE“亲和力”代表了在AI推理的市场中具备领先的优势。而这恰是 “超节点”的重要设计细节之一。
传统模式采用是“单卡多专家”的小作坊模式,且MoE通信基于传统通信协议,整体性能低,计算时间漫长。而昇腾云的超节点模式则实现“一卡一专家”,基于专家并行处理,通过内部高速总线通信,汇聚请求到指定专家处理,同时还有多余的卡可以用来做热备,可以复制做负载均衡。这就像是大工厂模式,单卡的计算和通信效率都得到大幅提升。
当然,强化推理端的能力,并不意味着在训练端不强。
反而“超节点”支持“朝推夜训”,通过训推共池和灵活调度实现朝推夜训,白天进行模型推理,晚上闲时进行模型训练,提升超节点算力资源利用率,帮助企业避免算力闲置。
基于“朝推夜训”的特性,昇腾云也会推出训推共池方案,训练推理作业共用一个专属资源池,支撑提前划分训练、推理逻辑子池,通过逻辑子池动态配合调整,实现训推资源时分复用,助企业提升算力资源利用率。
“超节点”昼夜不休的“上强度”,很多人也有这样的疑问:大集群意味着运营运维复杂,难度高,那么稳定性是不是足够可靠?实际上,“长稳可靠”也恰是昇腾云的核心优势之一。
目前,昇腾云脑已实现了全栈故障感知、诊断与快速自动恢复。比如在故障感知方面,通过静默故障感知技术和算法,主动探测硬件进行功能或性能测试,根据测试结果及时发现并隔离性能衰减的“慢节点”,基于变化趋势,预测硬件的潜在故障风险,提前进行隔离或更换。硬件故障感知率从40%提升至90%;而在诊断与自动恢复方面,昇腾云脑全栈故障知识库,覆盖95%常见场景,一键故障诊断准确率可达到80%,大大缩短网络故障诊断时效。配合 “三层快恢技术” ,实现万卡集群故障10分钟恢复的效果。
客观地说,CloudMatrix 384这样的系统化创新,其本质并不是单纯为了站上技术的“巅峰”,而是要在企业实际的应用场景中发挥算力的价值,这才让“超节点”令人肃然起敬。这也代表着CloudMatrix 384所有展现出来的技术细节,都是在客户真实的业务场景中体现出来,而非实验室的数据。
这份实打实的系统化创新,才称得上是能扛起数字中国建设的算力底座。
超节点的启示:“陪跑”到“领跑”

CloudMatrix 384超节点的突破,标志着中国已从“单点突围”迈向“系统创新”的新阶段。更深层意义在于:系统级创新并不是简单技术整合,在其背后是核心技术、工程化能力、场景化能力的集大成,它是对自主技术体系的全新定义,更具普惠价值和战略韧性。
在性能领先方面,基于CloudMatrix的超节点集群通过系统性的架构创新,在算力、互联带宽,内存带宽等方面全面领先。同时,通过新型高速互联总线,打造成一个超级云服务器,CloudMatrix384超节点可提供高达300 Pflops的算力规模,比业界同类产品领先67%。甚至有有企业测试后表示,两个超节点可媲美现有的数千张GPU卡。
而在AI普惠方面,超节点更具备“即可即用”的特征。通过昇腾云服务,资源按需获取、按使用计费,随时享受最新的算力和技术,实现即开即用,让更多的企业和开发者能够享受到超节点带来的高稳定性和高可靠性。
据悉,目前CloudMatrix已经在华为云CloudOcean的3大节点:乌兰察布、贵安和芜湖上线。三大数据中心之间,华为云的光纤骨干网支持百TB级的带宽互联。同时,10毫秒时延圈覆盖了全国19个城市群,全国主要流量高地城市都能在10毫秒之内访问超节点资源。
当技术封锁遭遇系统级创新,规则的枷锁正在被逐渐打破。CloudMatrix 384超节点的意义并不止于一场算力竞赛,它标志着中国的自主创新,不仅能够“陪跑”,也能走向“领跑”。
热点资讯
- 2025-07-222025年7月12日湖北襄樊市蔬菜批发市场价格行情
- 2025-04-13年利润百万:县城的生意,比北上广更好做
- 2025-11-26轰动全国的罗大美被害案判了!全网欢呼,但妹妹那句话却扎心了
- 2025-10-29上海“高考状元”袁钧瑛:公派留美却未回国,如今作何反应?
- 2025-05-25魔鬼赛程?我才是魔鬼😈拉涅利率罗马19轮不败,硬刚各强队
- 2025-05-22CloudMatrix 384超节点以“系统级创新”撕裂技术“铁幕”
推荐资讯
- 2025年7月12日湖北襄樊市蔬菜批发市场价格行情
- 上海“高考状元”袁钧瑛:公派留美却未回国,如今作何反应?
- 轰动全国的罗大美被害案判了!全网欢呼,但妹妹那句话却扎心了
- 蒋璐霞在谈及林超贤导演的作品时,提到了自己的深刻感受
- 2025年3月28日全国主要批发市场芒果(金煌芒)价格行情

