报告由东吴证券发布,聚焦 AI 基建中的算力互联领域,核心解析英伟达、谷歌、亚马逊、Meta 四大科技巨头的算力芯片 Scale up(单机柜高密度互联)与 Scale out(跨机柜集群扩展)方案,指出光模块与铜缆双线共振,互联需求将迎来量价齐升,国产产业链迎来发展机遇。
ㅤ
- 核心背景
- AI 大模型训练需大规模 GPU/TPU 集群高频参数同步,对互联网络的带宽、时延、无阻塞传输提出极高要求。
- 行业形成 “Scale up+Scale out” 双轮驱动格局:Scale up 聚焦单机柜内高密度互联,铜缆凭借短距低耗、低成本成为最优解;Scale out 支撑超大规模集群扩展,光模块需求随集群扩容激增。
- 关键结论
- 2026 年商用 GPU 与 CSP ASIC 将大规模部署,光模块与 GPU 配比最高达 1:12,光芯片缺口凸显;铜缆在柜内互联场景需求爆发,行业迎来量价齐升。
- 投资主线聚焦光芯片与铜缆两大核心赛道,国产企业在细分领域具备替代潜力。
- 英伟达 Rubin:高带宽低时延标杆
- Scale up:依托第六代 NVLink 与 NVSwitch,单机柜 72 颗 Rubin GPU 实现 129.6TB/s 对称带宽,采用 224G 速率 1.6T AEC 铜缆互联。
- Scale out:基于胖树无阻塞拓扑,三层组网支撑 9216 颗 GPU 集群,满配 CPX 芯片时光模块与 GPU 比例达 1:12,无阻塞传输保障参数同步效率。
- 谷歌 TPU:3D Torus+OCS 低时延架构
- Scale up:64 卡机柜内 TPU 采用 3D Torus 拓扑,通过 PCB 走线(板内互联)、铜缆 / AOC(柜内跨板互联)、光模块 + OCS(跨机柜互联)多链路组合,单机柜光模块用量 96 个。
- Scale out:以 9216 颗 TPU 为基础 POD,经 Tor/Leaf/Spine 分层组网,搭配 64 台 300×300 端口 OCS 设备,实现 147456 颗 TPU 集群动态无阻塞互联。
- 亚马逊 Trainium3:高密度 + 灵活扩展
- Scale up:基于 PCIe6.0 与 Scropio X 交换芯片,144 颗 Trainium3 通过 AEC 铜缆实现 PCB、背板、跨机架三层互联,整机柜需 180 根背板铜缆 + 36 根跨机架铜缆。
- Scale out:采用 ENA(南北向流量)+EFA(东西向算力通信)双网分工,Clos 拓扑搭配高基数低速率交换机,集群规模可随交换机带宽升级线性扩展。
- Meta Minarva:超大规模 AI 训练定制化方案
- Scale up:单机柜 16 颗 MTIA 芯片与 4 颗 Tomahawk5 交换芯片,通过 112G PAM4 铜缆背板实现 204.8Tbps 对称互联,铜缆线对达 1024 对。
- Scale out:DSF 解耦架构,以 Jericho3 构建机柜级 RDSW、Ramon3 组成 Fabric 层 FDSW,1:1 收敛比保障非阻塞传输,18432 颗 MTIA 集群需 18.4 万个 800G 光模块。
- 光模块与光芯片
- 需求爆发:英伟达 Rubin 满配 CPX 时 9216 颗 GPU 需 11.06 万个光模块,Meta 超大规模集群光模块用量达 18.4 万个,800G/1.6T 光模块成为主流。
- 国产机会:长光华芯、源杰科技、仕佳光子等企业在光芯片领域持续突破,有望受益于光模块放量带来的上游需求。
- 铜缆
- 应用场景:英伟达、亚马逊、Meta 的 Scale up 方案均大量采用 AEC 铜缆,用于机柜内背板、板间及短距跨机架互联。
- 国产标的:华丰科技、兆龙互联、沃尔核材等企业具备铜缆研发与量产能力,契合柜内高密度互联需求。
- 算力互联需求不及预期,AI 算力建设投入力度未达预期;
- 国产企业客户拓展、份额提升或产品研发量产落地不及预期;
- 行业竞争加剧导致产品价格下滑或市场份额被侵蚀。
AI 基建算力互联进入 “光铜协同” 时代,Scale up 催生铜缆需求爆发,Scale out 带动光模块量价齐升。随着四大科技巨头方案落地,光芯片与铜缆产业链将充分受益,国产企业在细分领域的技术突破与进口替代进程值得关注,行业有望迎来持续增长。