(资料图片)
通过深入研究AI 算力巨头英伟达近年的AI 超算方案,我们注意到,通信网络是制约数据中心算力高低的关键因素。在多线程并行计算下,通信成为制约算力的短板,只要有一条交换链路出现网络阻塞或丢包,就会产生I/O 延迟。因此,AI超算对于网络层数据传输速率和延时要求非常苛刻,需要高带宽、高速率的交换机和通信链路匹配。
交换网络的连接方案多样,AI 超算和DCI 场景中,主流是光模块+光纤、AOC(Active Optical Cables,有源光缆)和DAC(Direct Attach Cables,直连电缆),DAC 也可分为有源ACC、AEC 和无源DAC。
光模块+光缆最为主流,本身衍生出众多传输速率和封装类型,可以广泛、灵活应用于多种场景中,例如长距离电信传输网、中距离接入网和DCI、服务器架顶交换机皆可看到光模块家族的身影;光模块的I/O 端口也可以广泛适配各种光纤连接器,传输距离灵活可控。
AOC 将光模块和光缆集成化,避免光口被污染的可能性,以提升可靠性。AOC 是成本与性能折中的一种优化设计方案,减少光器件数、去除DDM(数字诊断)功能,专用于超短距离的架顶以太网或InfiniBand 交换机的互联场景,通常是100米传输距离。因为传输距离超短,所以AOC 使用的光模块通常是VCSEL 多模方案。
DAC 没有光电转换模块,线缆两头是简单的电缆连接头,因此成本非常低。DAC可以进一步细分为有源ACC、AEC 和无源DAC,有源ACC、AEC 相比无源DAC传输距离更长。由于铜的物理性能限制,DAC 传输距离极短,且带宽越大,有效传输距离就越短。在速率从400G 向800G 升级中,其传输距离将从3m 缩短到2m。
三种方案各有所长,适用场景各不相同。在传输场景上,光模块+光缆范围最广,从电信汇聚前传、中传网络,到数通交换机都可以使用;AOC 则适用于百米距离的大带宽架顶交换机互联;DAC 适用于服务器和GPU 连接到架顶交换机。从成本看,光模块+光纤成本较高,但组网灵活,从全成本角度考虑仍是海外云厂商最主流方案;AOC 因为是集成化设计,因此成本次之;DAC 无需光电转换,成本最低,但高速率下传输距离距离极大受限,我们认为,电信接入网的“光进铜退”
也将在AI 超算中上演,此前因为高速率光模块成本原因,AOC 方案优势不明显,但随着高速率光模块成本的降低,AI 超算时代DAC 方案有望加速向AOC 方案升级。
算力——
光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。算力设备:中兴通讯、紫光股份、锐捷网络、菲菱科思、恒为科技、工业富联、寒武纪、震有科技。云算力:光环新网、奥飞数据、数据港、润泽科技、科华数据。液冷:英维克、申菱环境、高澜股份、佳力图。边缘算力承载平台:美格智能、广和通、移远通信、初灵信息、龙宇股份、网宿科技、佳讯飞鸿。
数据要素——
运营商:中国电信、中国移动、中国联通。数据可视化:浩瀚深度、恒为科技、中新赛克。BOSS 系统:亚信科技、天源迪科、东方国信。
风险提示:AI 发展不及预期,算力需求不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。 (责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
标签:
要闻