
通讯寰宇网音尘(CWW)传统的AI干事器常常包含8张算力卡,一台干事器即为一个节点。干事器里面的8张算力卡传输速率较快,但干事器与干事器之间的传输速率则慢得多。跟着大模子波澜的到来,行业巨头需要纠合指不胜屈、乃至10万计的GPU算力卡,这使得互联和通讯成为行业发展的一浩劫题。
正如华为诡计家具线营销运作部部长张爱军在2026新春媒体沙龙上所共享的,现时大模子正从单模态走向全模态交融,模子迂回文长度、考试数据范围握续莳植,同期金融等场景对时延淡薄10毫秒以下的严苛条目,传统算力架构已难以适配。
系统工程破解算力互联困局
惩处这一不毛的要津,在于给与高速通讯技艺将更多算力卡交融成一个超节点。超节点内的扫数算力卡可罢了高速互联和通讯,进而大幅莳植算力集群的性能。
张爱军暗意,实在的超节点必须同期具备大带宽、低时延和内存长入编址三大中枢成分,若仅通过PCIe+RoCE公约互联,不支握内存长入编址,内容上还是传统干事器堆叠,并非实在的超节点。
华为发布的昇腾384超节点,恰是其诡计技艺突破的垂危体现,该超节点以384张昇腾算力卡构成,是现在已商用的超节点中单体范围最大的家具。依托华为自研灵衢UnifiedBus互联公约,其冲破了传统PCIe互联的带宽和时延瓶颈,通讯带宽较传统干事器架构莳植10倍,RTT通讯时延从7微秒降至3微秒,裁减50%以上,同期罢了128TB全局内存长入编址,让384张算力卡如合并个逻辑上的单一开辟协同使命,实在罢了“诡计不恭候通讯”。
这么的诡计技艺重构,背后触及基础软件、诡计、内存、通讯、架构、调治、散热、供电、高速互联等多个规模的协同研发,每个规模皆需要深厚的技艺蕴蓄。
张爱军在媒体沙龙上暗意,华为能罢了这一突破,收获于昔时几十年在通讯、硬件工程和基础软件规模等多规模积淀。华为在光通讯规模领有环球开头的技艺蕴蓄,能惩处极高速通讯中巩固性与传输距离的矛盾,同期将液冷散热、算力调治等技艺融入超节点假想。
华为通过系统化翻新,在公约、器件和工程层面罢了了永久巩固运转,确保超节点满负载运转时的可靠性,进一步印证了其诡计技艺的硬实力。
从商用落地来看,华为昇腾384超节点(Atlas 900 A3 SuperPoD)自上市以来,已累计部署跳动数百套,开云涵盖互联网、电信、制造等多个行业,让诡计技艺实在赋能产业发展。
构建开源生态,共建产业协同
算力平台的“能用”和“易用”分属两个不同维度的问题,而开源则是买通“易用”壁垒、让诡计技艺庸碌落地的要津。
思要让先进的诡计技艺实在干事于开发者和产业,还需要华为在生态上提供愈加全面的开源支握。
华为诡计开源业务总司理李永乐在媒体沙龙上提到,环球好多AI开发者民风使用PyTorch、TensorFlow框架,生态兼容性是诡计技艺落地的中枢,而开源恰是破解这一不毛的垂危旅途。对此,华为早已提前布局应付,将开源动作中枢策略,推动诡计技艺与开源生态深度交融。
{jz:field.toptypename/}李永乐详备先容了开源生态构建的具体举措:昇腾的异构诡计架构CANN从出身之日起,就支握包括PyTorch、TensorFlow在内的主流开源框架,且已于2025年8月全面开源灵通,开发者无需修改中枢代码,就能将原有模子移动至相关诡计平台运转,大幅裁减了开发者的适配资本。
同期,欧拉(openEuler)操作系统也已发布面向超节点的翻新版块,成为业界首个开源的超节点操作系统,为诡计技艺的开源落地提供了全方针复旧。
遗弃2026年1月,华为已发展380万+鲲鹏开发者、400万+昇腾开发者,合股9800+ISV伙伴打造了跳动2万个惩处有规画,变成了完善的开源生态体系,让诡计技艺通过开源罢了更庸碌的赋能。
值得禁绝的是,华为在诡计技艺突破的同期,并未将中枢技艺顽固起来,而是选拔全面开源,与产业链伙伴共建协同生态。遗弃媒体沙龙召开时,灵衢公约已累计下载近24000份,华为还规画设置了灵衢社区,与产业链伙伴共建超节点生态,助力中国构建无缺的超节点产业链,推动诡计技艺与开源生态双向赋能、共同发展。
华为在诡计规模的技艺突破和开源生态辅助,破解了AI算力互联不毛,为大模子发展提供了有劲算力复旧。将来,华为将握续鼓吹诡计技艺研发和开源生态完善,推动算力高效流动,以诡计和开源赋能各行业数字化转型,罢了双向共赢。