新一代芯片LPU带火SRAM概念公开测试显示相比GPU推理速度翻倍

萝卜投 2024-02-23 12:46:23
2月21日,SRAM概念成为风口,A股的睿能科技涨停,西测测试涨超10%,北京君正、光韵达、万润科技、东方中科、好上好、恒烁股份等跟涨。消息面上,初创公司Groq的新款加速卡LPU在多个公开测试中,以几乎最低的价格,相比GPU推理速度翻倍,而LPU的内存采用了SRAM。

AI芯片公司Groq是由谷歌TPU第一代设计者乔纳森·罗斯(Jonathan Ross)于2016年所创立。该公司2月19日宣布,其大模型Groq每秒输出近500个token,成为全球最快大模型。ChatGPT-3.5每秒生成速度仅为40个token。

Groq如此之快,背后全靠其自研的LPU芯片,值得关注的是,与GPU使用高带宽存储器(HBM)不同,LPU使用的是静态随机存储器(SRAM)。

虽然还没有正式发售,但LPU在多个公开测试中,以几乎最低的价格,相比GPU推理速度翻倍。后续有三方测试结果表明,该芯片对大语言模型推理进行优化效果显著,速度相较于英伟达GPU提高了10倍。

据Groq介绍,在 LLM 方面,LPU较GPU/CPU拥有更强大的算力,从而减少了每个单词的计算时间,可以更快地生成文本序列。此外,由于消除了外部内存瓶颈,LPU推理引擎在大模型上的性能比GPU高出几个数量级。

为了证明自家芯片的能力,Groq还在官网发布了免费的大模型服务,包括三个开源大模型,Mixtral 8×7B-32K、Llama2-70B-4K和Mistral 7B - 8K,目前前两个已开放使用。

本文首发自萝卜投研

0 阅读:0

萝卜投

简介:感谢大家的关注