IBM提出了一种方法,通过将铜线换成光束来连接数据中心组件,使训练和运行生成式人工智能模型的速度提高了5倍,而且节能得多。
数字时代的矛盾之处在于,随着计算机变得越来越小,问题也变得越来越大。随着芯片塞满越来越多的晶体管,直到它们的数量达到数十亿,它们使大型数据中心和处理能力成为可能,这些都是现代生成式人工智能模型所需的。然而,随着这些模型的发展,它们需要越来越多的处理能力,数据中心已经成为主要的能源消耗者,芯片本身不仅在推动其技术的极限,而且在推动物理定律。
这些数据中心的两个技术和物理瓶颈是简单的铜线和电子沿其流动的速度。这是电子产品如此小巧的主要原因之一。这不仅仅是为了方便。这是因为随着计算机变得越来越快,越来越强大,数据从一个组件传输到另一个组件所需的时间成为一个主要的性能因素。
事实上,电子形式的数据已经成为一个瓶颈,大多数CPU在等待下一个数据包到达时,大部分时间都处于闲置状态并消耗能量。
为了加快速度,IBM开发了它所称的下一代光学技术。使用光学来传输数据并不是什么新鲜事。几十年来,它一直被用来通过光纤电缆将信息从一个地方传输到另一个地方。然而,这主要是长途旅行。一旦数据到达并进入计算机本身,它就又回到铜线。
为了克服这一点,IBM正在转向一种新的工艺,以聚合物光波导(PWG)的形式创建共封装光学器件(CPO),该波导在光子集成电路(PIC)和单模光纤(SMF)等外部连接之间路由光信号。该公司表示,对PWG的测试表明,如果将其用于数据中心,它们所需的电力将比传统版本低五倍,电缆连接的长度可以从一米延伸到数百米,从而在每秒传输数TB数据的同时实现更灵活的架构。
IBM声称,训练一个人工智能模型所减少的功耗足以让5000个美国家庭使用一年,而使用光可以将训练一个人工智能大型语言模型的时间从3个月缩短到3周,这要归功于它的带宽是传统系统的80倍。
IBM高级副总裁兼研究总监Dario Gil表示:“由于生成式人工智能需要更多的能量和处理能力,数据中心必须不断发展,而协同封装的光学器件可以使这些数据中心经得起未来的检验。”“有了这一突破,未来的芯片将像光纤电缆在数据中心内外传输数据一样进行通信,迎来一个更快、更可持续的通信新时代,可以处理未来的人工智能工作负载。”
如果朋友们喜欢,敬请关注“知新了了”!