用光取代电:AI数据中心的下一场革命学会了吗

发布时间:2026-04-21 09:25:06 作者:admin 来源:admin 浏览量(0) 点赞(0)
摘要:(来源:可遥笔记)铜线正在投降。数据中心里,芯片之间的数据传输靠的是铜。铜线便宜、可靠、低功耗,几十年来是数据中心互联的..._新浪网

  (来源:可遥笔记)

  铜线正在投降。

  数据中心里,芯片之间的数据传输靠的是铜。铜线便宜、可靠、低功耗,几十年来是数据中心互联的默认选择。行业有句老话:能用铜就用铜,不行才用光。

  但AI改变了游戏规则。

  当集群从几百颗GPU扩展到十万颗、百万颗,当机架之间的带宽需求每两年翻一倍,当单个AI训练任务需要跨越数千台服务器协同运算——铜线撑不住了。200G速率下,高质量铜缆的有效距离只有2米。超过这个距离,信号衰减急剧上升,22分贝的电气损耗让数据传输变成一场消耗战。

  美国银行最新发布的深度报告给出了一组数据:AI光连接市场将从2025年的140亿美元增长到2030年的730亿美元,年复合增长39%。到2030年,光学端口将占AI网络端口的71%,铜只剩29%。

  光正在全面接管。

  三条技术路线

  光连接不是一项技术,是一个技术族群。当前有三条主要路线在竞争,各有优势、各有局限。

  光收发器(Pluggables)——最成熟的方案。把光电转换模块做成可插拔的标准模块,插在交换机面板上。优点是灵活、标准化、易维护。缺点是功耗大——每个模块里都有一颗数字信号处理器(DSP),从10G时代的1瓦涨到了1.6T时代的30瓦。在一个大型AI集群里,光模块的功耗可以占到整个计算资源的10%。

  光收发器市场从2025年的130亿美元增长到2030年的450亿美元,800G和1.6T模块是增长主力。这条路线不会消失,但它正在接近物理极限。

  共封装光学(CPO)——下一代方案。把光学引擎直接封装到交换芯片的基板上,信号不再绕道铜线走PCB,而是在硅片上直接完成光电转换。距离更短,损耗从22分贝降到4分贝。功耗从30瓦降到9瓦——省了3.5倍。

  数字很漂亮,但CPO的挑战在于:光学器件和芯片封装在一起,坏了就得整块换。可插拔光模块坏一个换一个,CPO坏了要换整个交换机。这个可维护性问题一度让行业犹豫。

  转折发生在2025年。Meta在OCP大会上公布:博通的Bailly CPO交换机经过1500万设备小时测试,零故障。平均故障间隔从可插拔光模块的不到100万小时提升到250万小时以上。可靠性不是CPO的弱点——反而成了优势。在一个24000颗GPU的集群中,这意味着GPU利用率提升90%。

  美银预计CPO从2027年开始放量,到2030年市场规模达150亿美元,占AI光学端口的31%。3.2T端口中约三分之二会用CPO。

  英伟达的Spectrum-X光子交换机将在2026年下半年上市,512个800G端口,总带宽409.6TB/s。博通已经迭代到第三代CPO产品Davisson。Marvell收购了Celestial AI,其"光子织物"技术允许光学器件直接坐在芯片顶部而非边缘——更紧密的集成,更短的传输距离。

  光电路交换机(OCS)——最激进的方案。直接用光路由光,不做任何光电转换。信号以近光速通过微镜阵列(MEMS)或液晶面板被导向目标端口。功耗只有100到200瓦,而传统电交换机是千瓦级。

  谷歌是OCS的先驱。2022-2023年,谷歌在Project Apollo中用自研的Palomar光交换机替代了脊柱层(spine)电交换机。TPU集群采用3D环面架构——64颗TPU组成一个4x4x4的立方体,每个立方体连接48台光电路交换机。多个立方体拼接成超级集群,最大支持9216颗TPU,拓扑可以动态重配。

  Lumentum的R300是目前商用OCS的旗舰,300x300端口,插入损耗仅1.5分贝。Coherent用液晶技术做OCS,没有机械运动部件,可靠性来自30多年海底光缆的工程积累。

  美银预计OCS市场从2025年的10亿美元增长到2030年的43亿美元。谷歌之外,多家超大规模数据中心运营商也在部署OCS。

  为什么是现在?

  光取代铜不是新概念。二十年前就有人在讲这个故事。为什么这次不一样?

  速度在翻倍,铜在掉队。 网络带宽每两年翻一倍——100G、200G、400G、800G、1.6T、3.2T。铜线在每一代升级中都更吃力。200G SerDes下,铜缆需要更强的均衡和信号补偿,功耗飙升。光纤没有这个问题。速率越高,光的优势越大。

  AI集群在变大。 传统数据中心的网络是scale-out(横向扩展),服务器之间相对独立。AI训练需要scale-up(纵向扩展),成千上万颗加速器像一台机器一样协同工作。这对互联的带宽、延迟和可靠性提出了前所未有的要求。scale-up目前全部是铜域,但带宽需求是scale-out的9倍。CPO可能是唯一能满足下一代scale-up需求的技术。

  功耗成了硬约束。 英伟达Rubin时代的机架功率接近1兆瓦。如果光模块占10%的计算功耗,那就是100千瓦花在光电转换上。CPO省3.5倍功耗,在一个GW级数据中心里,这是巨大的成本节约。

  产业周期在叠加。 以前光模块的产品周期是5到7年,100G用了7年。现在800G和1.6T的周期高度重叠,3.2T也在赶来。多代产品同时在市场上扩张,行业进入超级景气周期。美银认为需求能见度至少延伸到2027年,下行风险很远。

  供应链:谁在赢?

  光连接的价值链很长——从衬底材料到激光器,从光学引擎到模块封装,从交换芯片到系统集成。

  激光器是核心。 三种激光器技术各有用武之地。VCSEL(垂直腔面发射激光器)便宜、低功耗,适合50米以内的短距离,是800G的主力。EML(电吸收调制激光器)信号质量更好,适合长距离,但贵得多——单颗10到15美元——而且严重缺货。英伟达锁定了多年供应。CW激光器(连续波激光器)是硅光子技术的搭档,成本低、产量大,CPO时代的主角。

  硅光子正在崛起。2025年AI光学模块中,硅光子占38%。到2030年,84%。从砷化镓(VCSEL)和磷化铟(EML)向硅基平台的大迁移,正在发生。

硅光子技术占比从38%升至84%(来源:BofA Global Research)

  Lumentum(LITE)是EML激光器的龙头,市占率超过50%,也是英伟达CPO光交换机的关键激光器供应商。英伟达给了20亿美元股权换取多年供应协议。同时,Lumentum在OCS领域同样领先,R300的订单积压已经达到4亿美元级别。

  Coherent(COHR)在磷化铟CW激光器上有优势,德州谢尔曼工厂正在扩产6英寸磷化铟晶圆。同样获得英伟达20亿美元股权换供应协议。在OCS领域,Coherent用液晶技术提供差异化方案。

  博通(AVGO)是CPO交换芯片的领导者,三代产品已经迭代到Davisson(TH6),声称比可插拔方案集成度提升100倍、功耗降低3.5倍以上。博通还与台积电合作,采用COUPE封装工艺把光子芯片和电子芯片3D集成。

  Marvell(MRVL)走了另一条路——通过收购Celestial AI获得光子织物技术,把光学引擎3D集成在芯片顶部。亚马逊是主要客户,Trainium4芯片预计2027年大规模部署CPO。

  中国供应链也在参与。 中际旭创是全球最大的光收发器供应商,服务英伟达、谷歌、亚马逊、Meta。其硅光子设计能力和Tower Semiconductor代工合作是竞争优势。天孚通信是英伟达CPO的重要光纤连接器供应商。通鼎互联和华工科技也在布局CPO产能。

  730亿美元市场的格局

  拆开来看这730亿美元:

  光收发器450亿美元——最大的一块,仍以可插拔模块为主,但增速在放缓。

  CPO 150亿美元——增长最快的方向,scale-up市场(90亿美元)比scale-out(56亿美元)更大。scale-up今天100%是铜域,CPO是一片蓝海。

  OCS 43亿美元——niche但高增长,谷歌带头,其他超大规模运营商跟进。

  LPO/LRO 51亿美元——介于传统光模块和CPO之间的过渡方案,去掉接收端DSP省功耗,但超过400G/lane就力不从心。

  整个AI网络市场(含交换、SmartNIC和光连接)到2030年是2450亿美元。光连接占39%,是增长最快的子领域。

  电子到光子的转折点

  退回来看大图。

  半导体行业过去六十年的故事是电子的故事——晶体管越做越小,集成度越来越高,摩尔定律推动一切。但芯片之间的连接,一直是铜线的领地。芯片在飞速进化,连接却在原地踏步。

  AI把这个矛盾推到了极限。当一颗芯片的算力已经足够强大,当瓶颈不再是计算而是通信,当数据在铜线上每走一米就损失一分信号——光就不再是"可选",而是"必须"。

  这是一个结构性转折。从铜到光,从电子到光子,从可插拔到共封装。不是渐进式改良,是底层物理介质的替换。

  数据中心的进化,从来不只是芯片的事。连接决定了芯片能发挥多大的能力。

  光速,是信息传输的物理极限。而AI正在逼近这个极限。

  本文基于美国银行2026年3月9日发布的研究报告"Scaling AI with Photons: Primer on Optical Interconnects",仅供信息参考,不构成投资建议。

感兴趣吗?

欢迎联系我们,我们愿意为您解答任何有关IDC的疑难问题!