游乐游手机版
首页/AI教程/文章详情

Lightmatter InterConnect 2026 光驱动AI未来

时间:2026-06-18 16:18
Lightmatter展示光子互联技术,通过Passage光互联将训练速度提升2 7倍,推理预填充延迟降低3倍,推理解码交互性提升11倍。推出光子中介层M1000、光学引擎L20及激光器GuideDR,以光取代铜缆突破带宽与距离限制,缓解AI算力与电力供应矛盾。

在刚刚结束的第二届InterConnect大会上,Lightmatter公司CEO Nick Harris发表了题为“The Future of AI Runs on Light”的主题演讲。作为全球光子计算领域的先行者,这家公司不仅展示了最新的硬件成果,还描绘了一条清晰的技术演进路线图:未来十年,光子学将如何从根本上改变AI计算的底层架构。从模型训练到推理部署,从近封装光学到光子中介层,从激光器到数据中心机架标准,所有信号都指向同一个结论——互联已成为AI性能的核心杠杆,而光,正是驱动AI走向下一个时代的唯一答案。

AI爆发背后的致命矛盾:算力与能源的鸿沟

AI进化的速度令人惊叹。Claude Opus 4.6已经能够连续运行16小时完成复杂任务,成功率达到了50%。更值得关注的是,AI任务的执行时长正以每7个月翻一番的速度持续增长。在进步的背后,是对算力近乎贪婪的需求。

\

\

但现实并不乐观:美国电力供应的翻倍周期大约需要25年,而AI算力的需求每年却增长2到3倍。这一巨大的落差意味着,单纯依靠增加电力供应来满足AI的胃口是行不通的。我们必须换一种思路——让每一度电都榨出更多的AI性能。

答案就藏在互联之中。

\

过去,我们习惯了通过提升单芯片性能来推动计算进步。但在AI时代,系统性能的瓶颈已经从计算单元转移到了连接计算单元的那条线上。无论是训练还是推理,数据在芯片之间的传输速度和效率,直接决定了整个系统的最终表现。

光子学:重新定义AI计算的三个阶段

现代AI工作负载已经清晰地分化为三个截然不同的阶段:训练、推理预填充(Prefill)和推理解码(Decode)。这三个阶段的计算特性完全不同,对互联系统的要求也截然不同。

\

- 训练和预填充属于计算密集型工作负载。GPU在这块表现出色,但需要极高的带宽来在芯片间传输海量数据。
- 解码属于内存密集型工作负载,对延迟和交互性极为敏感,网络拓扑的设计至关重要。

\

Lightmatter的Passage光子互联技术,能够同时加速这三个阶段,带来的性能提升相当可观:

\

- 训练:在一个576个GPU的集群中,使用32Tbps带宽的Passage光互联,相比传统铜缆架构,训练时间缩短了2.7倍。这意味着在同样的电力消耗下,AI模型的迭代速度可以从每季度一次提升到每月一次。

\

- 推理预填充:对于13万上下文窗口的典型工作负载,Passage能够将首字延迟(TTFT)降低3倍。这对于长文本处理、智能体(Agent)和代码生成这类应用来说,体验提升立竿见影。

\

- 推理解码:这是光子学优势最显著的领域。利用光子学可以构建铜缆无法实现的低跳数网络拓扑,比如Hyper-X。对于混合专家模型(MoE),解码阶段的交互性可以提升高达11倍。这直接意味着更高的并发用户数和更低的单用户成本。

\

值得强调的是,这些性能提升并非来自更先进的计算芯片,而是完全源于互联架构的革新。在电力供应受限的未来,这相当于让1吉瓦的电力发挥出3吉瓦甚至11吉瓦的效用。

铜缆的物理极限与光子学的绝对优势

为什么光子学能带来如此巨大的飞跃?答案藏在最基础的物理定律里。

① 传输距离:从1米到500米

传统的铜缆高速互联,有效传输距离仅为1米左右。这意味着传统的“Scale-Up”(纵向扩展)域被严格限制在单个机架内。而光子学的传输距离可以轻松达到500米,覆盖整个数据中心的一行机柜。

\

这500倍的距离提升,彻底打破了Scale-Up和Scale-Out(横向扩展)的界限。我们现在可以构建一个包含16个机架、1024个XPU的单一Scale-Up域。对程序员来说,这一整行机柜就像一块巨大的单一芯片,编程模型极其简单,性能却得到了数量级的提升。

② 带宽:从0.2T到10T

带宽方面,光子学的优势同样是碾压性的。目前最先进的电SerDes,单根铜线的传输速率约为200Gbps。而在单根同样粗细的光纤中,利用O波段的DWDM(密集波分复用)技术,可以轻松容纳60到70个波长通道,总带宽超过10Tbps。这是30倍以上的带宽密度差距。

\

③ BiDi技术:线缆减半,成本骤降

光子学还有一个铜缆无法比拟的优势:双向传输(BiDi)。通过在同一根光纤中使用不同的波长分别进行发送和接收,我们可以将所需的光纤数量减少一半。

\

这个看似简单的技术,在数据中心规模下会带来惊人的经济效益。以典型的512 GPU集群为例,采用BiDi技术可以节省150英里的光纤,减少2万个连接器和故障点,总体网络开支降低约16%。在全球光纤供应日益紧张的今天,BiDi已经成为AI数据中心的必选项。

④ OCI MSA:光子学终于掌握了自己的命运

\

长期以来,光子学一直被视为电SerDes的“附属品”。整个互联技术的路线图,都是由电SerDes的发展节奏来定义的——56G、112G、224G、448G。这极大地限制了光子学潜力的发挥。

\

2026年3月在OFC上宣布的OCI MSA(Open Compute Interconnect Multi-Source Agreement)彻底改变了这一局面。该标准由Broadcom、AMD、Nvidia等行业巨头联合发起,首次将电SerDes的路线图与光子学的路线图解耦,明确了DWDM和BiDi作为未来光互联的核心技术方向。

而Lightmatter早在4年前就已经开始研发DWDM和BiDi技术,如今已经走在了整个行业的最前沿。

\

Lightmatter的硬核产品矩阵:从验证平台到量产芯片

在本次大会上,Lightmatter展示了三款创纪录的DWDM和BiDi参考平台,以及面向量产的完整产品矩阵。

Passage EVK系列:创纪录的光链路平台

\

- Passage EVK50:单根光纤支持16个波长(8发8收),单方向速率400Gbps,双向总速率800Gbps。这已经达到了OCI Gen 2的性能水平,是全球首个被演示的OCI类型链路。
- Passage EVK100:与高通合作开发,采用高通优化的112G PAM4 SerDes,将单光纤双向速率提升到了1600Gbps,相当于OCI Gen 3的水平。这意味着,一根光纤就能承载1600个家庭的互联网带宽。

Passage M1000:全球首个光子中介层

\

Passage M1000是世界上第一个商用光子中介层(Photonic Interposer)。

- 芯片面积达4000平方毫米
- 支持32颗TSMC芯片的3D堆叠
- 提供高达114Tbps的IO带宽
- 支持1.8W/mm²的功率密度,可承载千瓦级芯片的供电

M1000的出现,彻底打破了芯片“海岸线”(Shoreline)与计算能力之间的权衡。它将光互联直接带入了芯片封装内部,是未来十年计算架构演进的终极方向。

可维护性突破:eCLICK与vCLICK

CPO(共封装光学)最大的落地障碍之一就是可维护性。如果光纤被永久固定在昂贵的GPU或交换机芯片上,一旦光纤损坏,整颗价值数万美元的芯片就会报废。

\

为此,Lightmatter开发了两项革命性的可插拔光纤技术:eCLICK和vCLICK。这两项技术允许用户在现场轻松地插拔连接到CPO芯片或光子中介层的光纤,彻底解决了CPO的服务性难题。目前,这两项技术已经在Passage M1000上成功验证。

\

L20:首款量产BiDi NPO光学引擎

面向即将到来的大规模商用,Lightmatter推出了其首款量产产品Passage L20,这是全球首款采用BiDi技术的近封装光学(NPO)引擎。

\

\

- 符合OCI Gen 1 MSA标准
- 单方向带宽6.4Tbps,双向总带宽12.8Tbps
- 采用224G SerDes,兼容现有所有交换机和GPU芯片
- 功耗仅30W,能效比达4.6pJ/bit

L20将提供三种形态:板载芯片(NPO)、夹层卡(CPX)和巨型可插拔模块(XPO),以满足不同客户的部署需求。

\

\

Guide DR:为CPO时代重新定义激光器

如果说光子网络是AI的血管,那么激光器就是驱动血液流动的心脏。Lightmatter认为,激光器之于光子网络,就如同电池之于电动汽车,是决定系统成本、密度和可靠性的核心组件。

\

目前,行业普遍采用ELSFP(外部激光源可插拔模块)来为CPO系统提供光源。但随着交换机带宽从100Tbps向800Tbps演进,所需的ELSFP数量将从16个激增到128个,这在物理上是不可行的。

\

为此,Lightmatter在本次大会上正式发布了Guide DR,一款专为CPO时代设计的革命性激光器平台。

\

- 全新的LNIC(Laser Network Interface Card)形态,安装在OCP MGX机架的托盘内部
- 单模块提供64路光纤输出,每路200mW光功率
- 可支持51Tbps的224G IO
- 一个Guide DR即可替代8个传统ELSFP模块
- 对于100Tbps交换机,仅需2个Guide DR
- 将200Tbps交换机的激光器占用空间从4RU压缩到1RU

\

Guide DR将于2026年底开始送样,2027年正式量产。它不仅将为Lightmatter自己的L20光学引擎提供光源,还将作为独立产品销售给所有交换机和GPU厂商。

\

VLSP:超大规模光子学的未来

Guide DR只是一个开始。Lightmatter提出了VLSP(Very Large Scale Photonics,超大规模光子学)的长期愿景。

\

未来的激光器将不再是一个个分立的二极管,而是集成了上百个激光器的单片芯片。Lightmatter的VLSP平台将实现:

- 单芯片集成100个以上的激光器
- 波长漂移控制在4GHz以内(当前为40GHz)
- 功率波动控制在0.2dB以内
- 内置光路交换,支持自动自愈修复:当某个激光器发生故障时,系统会自动检测并路由到备用激光器,无需人工干预

这将为未来的DWDM光互联提供前所未有的稳定性和可扩展性。

生态与标准:共建CPO的未来

一项伟大的技术要想成功,离不开完整的生态系统。Lightmatter已经与行业内几乎所有的顶尖公司建立了深度合作:

\

- 与Cadence和Synopsys合作,开发针对TSMC CoWoS工艺的定制SerDes
- 与GUC和高通合作,开发先进的光电集成技术
- 与戴尔、Celestica、QCT、富士康等ODM合作,设计CPO时代的服务器和机架
- 与康宁合作,优化光纤和连接器解决方案

在本次大会上,Lightmatter联合其合作伙伴,正式向OCP提交了第一版CPO机架标准,定义了未来CPO交换机托盘、计算托盘和布线的规范。这是CPO技术从实验室走向大规模商用的最后一块拼图。

结语:通往ASI的道路,由光指引

从NPO到CPO,再到光子中介层,Lightmatter为我们清晰地展示了未来十年光子学在硅基计算中的演进路线。这条路线图,将为AI带来3到11倍的性能提升,有效缓解了算力需求与电力供应之间的尖锐矛盾。

\

对Lightmatter来说,光子互联只是第一步。他们的终极目标,是构建全新的光子计算机。去年,Lightmatter在《自然》杂志上发表了世界上第一台光子计算机的研究成果,并成功复现了10年前DeepMind在Atari游戏上的突破。如今,这台光子计算机已经与Passage M1000一起,被永久收藏于计算机历史博物馆。

正如Lightmatter CEO Nicholas Harris在演讲最后所说的那句话:“通往人工通用智能(ASI)的道路,将由光来指引。”

来源:https://cloud.tencent.com.cn/developer/article/2692397
上一篇AI时代同城外卖智能推荐客服调度技术演进 下一篇微信小程序制作流程:用开发者工具+BBWEYY开发耐克中国小程序
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Windows Docker Desktop RabbitMQ生产级部署完整指南
AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言 在 Windows 本地开发环境中,直接安装 RabbitMQ 确实颇为周折:需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是,版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。 相比之下,借助 Do

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践
AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年,我们与福建制造企业合作较为频繁,发现一个非常突出的现象:超过80%的企业官网,产品参数仍然存放在PDF或图片中。AI爬虫?根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富,但在AI搜索这一全新战场上,它们几乎处于隐身状态。 一、一个正在发生的行业变化 A

阿里云Token Plan团队版功能价格与省钱购买指南
AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务,这一服务专为企业与开发者量身打造,定位为AI大模型订阅平台。通过引入Credits作为统一计量单位,将文本生成、图像生成等多模态AI能力纳入单一计费体系,同时无缝兼容主流AI编程工具及智能体(Agent)生态系统。其核心亮点包括:全

阿里云物联网.NET Core客户端位置信息上报
AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标,而位置数据的来源本质上是借助设备属性进行上传。换言之,若要让设备上报位置,您需先将其视为一个普通属性进行处理。 1)添加二维位置数据 操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据,点击添加,将

年阿里云服务器选型配置与网站部署全攻略
AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年,阿里云服务器生态已高度成熟,形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网,还是运营电商平台、进行应用开发,基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维,系统梳理2026年最实用的操作要点,帮助你少走弯路,让网