来源:华尔街见闻

  AI领域又一重大突破?媒体称,英特尔推出首款OCI芯片组,能提高AI基础设施的数据传输速率,并减少延迟和功耗,这对需要高速数据传输的AI基建和应用至关重要。

  美东时间6月26日,在2024年的光纤通信会议(OFC)上,英特尔的集成光子解决方案(IPS)小组展示了业界最先进的、也是首次完全集成的光计算互连(OCI)芯片组,该芯片组与英特尔CPU共同封装并运行实时数据。

  英特尔的OCI芯片组通过在数据中心和高性能计算 (HPC) 应用的新兴AI基础设施中实现共同封装的光输入/输出 (I/O),代表了高带宽互连的一次飞跃。英特尔称,我们在融合光电科技到高速数据传输方面实现一个革命性的里程碑。

  功能方面,这款首款OCI芯片支持64个独立通道,每个通道能够以32千兆位/秒 (Gbps)的速率传输数据,并在长达100米的光纤上高效传输数据,有望满足AI基础设施对更高带宽、更低功耗和更长传输距离日益增长的需求。它增强了集群中CPU与GPU之间的连接,并支持创新的计算架构,如一致性内存扩展和资源解耦。

  新一代光学I/O技术推动了计算平台的革新,以适应日益增长的AI工作负载

  随着AI技术的飞速发展,自动驾驶、高级数据分析和虚拟助手等应用在全球范围内日益普及,对计算资源的需求急剧增加。特别是大型语言模型如GPT,以及生成式AI技术的快速发展,极大地推动了AI技术的应用。然而,这些先进的AI模型需要处理和生成的数据量巨大,对计算资源和数据传输提出了极高的要求。

  随着机器学习模型的规模不断扩大,它们在AI加速工作中的作用也变得越来越复杂,需要极高的计算能力和数据处理能力才能有效运行。这种对高性能计算平台的需求正在推动输入/输出(I/O)带宽的指数级增长和数据传输距离的延伸。

  为了应对这一挑战,数据中心正在向更大的处理单元集群,如CPU、GPU和IPU的使用,以及更高效的资源利用架构,如xPU解耦和内存池化方向发展。这些技术的实施将提高处理效率,降低系统延迟,并优化资源配置,从而支持更广泛的AI计算和应用。

  尽管传统的电子I/O系统在传输大量数据时表现出高带宽密度和低功耗的优点,但其最大的弱点是传输距离短,通常仅限于一米内。这严重限制了数据中心内部的设备布局,使得组件之间的连接受到严格的空间限制。

  为了突破这一限制,数据中心和早期AI集群开始采用可插拔光学模块技术,这种技术能够提供比电子I/O更长的传输距离。然而,随着AI应用对资源的不断增加,光学模块在成本和能耗方面的压力也随之增大。

  为了应对这些挑战,新一代光学I/O技术应运而生。这种技术将光学I/O与处理器(如CPU、GPU或IPU等,统称为xPU)共封装,不仅大幅提高了带宽,还优化了芯片内部的光和电信号传输,显著降低了能量消耗,还大幅减少了数据传输过程中的延迟,对于需要快速响应的AI应用来说至关重要。

  更令人兴奋的是,这项技术支持的传输距离远超以往,为数据中心的设计提供了更大的灵活性,使得系统能够适应更广泛的扩展需求。光学I/O技术的推广不仅解决了数据传输的痛点,也为AI和机器学习的未来发展铺平了道路。

英特尔展示首次全面融合的Optical I/O Chiplet  第1张

  打个比方,传统的电子I/O连接,类似于旧式马车,在短距离传输中效率较高,但面对大量数据的长距离传输需求时,却显得力不从心。而英特尔的OCI芯片等光学I/O技术,如同现代的汽车和卡车,不仅能在更长的距离上传输更多的数据,而且保持数据的完整性,大大超越了传统电子I/O的性能。

  随着AI和ML模型需求的不断扩大,光学I/O凭借其卓越的传输能力和高效能源利用,成为推动未来AI技术发展的关键力量。就像汽车和卡车满足了现代社会对快速、大规模物流的需求一样,光学I/O使得数据能够更快、更高效地在更长的距离上传输,这对于扩展AI基础设施至关重要。

  英特尔在硅光子学领域处于领导地位

  凭借超过25年的深厚研究基础,英特尔实验室在集成光子学领域取得了开创性的成就。英特尔不仅是首家成功开发并大规模生产硅光子连接产品的企业,更是以其卓越的产品可靠性,赢得了全球主要云服务提供商的信赖。

英特尔展示首次全面融合的Optical I/O Chiplet  第2张

  英特尔的核心竞争力在于其独特的混合激光器晶圆上技术和直接集成工艺,这些技术不仅提高了产品的可靠性,还降低了成本。这种独特的方法使得英特尔能够在保持高效率的同时,提供卓越的性能。到目前为止,英特尔的强大生产平台已经出货超过800万片集成电路芯片,这些芯片集成了超过3200万个芯片级激光器。其激光器的故障率极低(故障率小于0.1),这一指标在业界广泛认可,表明故障率极低。

  这些芯片被封装在可插拔的收发器模块中,并在大型数据中心网络中得到部署,服务于多家大型云服务提供商,用于100Gbps、200Gbps和400Gbps的应用。目前,英特尔还在开发下一代200Gbps每通道的芯片,以支持即将到来的800Gbps和1.6Tbps的应用。

  在制造工艺上,英特尔引入了全新的硅光子制造工艺节点,这一工艺不仅提升了设备性能,还实现了更高的集成度和更佳的耦合效率,同时显著降低了成本。英特尔在芯片激光器和SOA性能、成本控制以及能效优化方面不断取得突破,芯片面积减少了超过40%,能耗降低了超过15%,进一步巩固了其在硅光子技术领域的领先地位。

  英特尔目前的OCI芯片模块尚处于原型阶段。展望未来,英特尔正在与特定客户合作,将OCI与他们的系统级芯片(SoCs)一起封装,开发一种创新的光学输入/输出解决方案。