目前已知的AI推理平台有Groq,Cerebras,FireworksAI,又发现一款SambaNova,速度比Groq还快,LLaMA 3 405B 可以达到100token每秒,目前免费使用。
我们打开SambaNova官网,可以用谷歌或微软账号授权登录。
可以看到接入了LLaMA3.1 8B,70B和405B.
我们先用官方提供的提示词看看回答的速度有多快?
LLaMA3.1 405B回答的速度达到了134.3 t/s,可以说是目前AI推理平台速度最快的咯~
再来让它写款WordPress的多语言插件吧!
速度不仅快,写的插件也是比较详细,插件的主体结构也有说明,同样的速度达到117.95 t/s.
最后再让它帮我制定一份去香港旅游的攻略吧!
旅游攻略制定的马马虎虎,但是速度同样很快,达到103.47 t/s.
SambaNova从体验来说,LLaMA 3 405B的速度基本在100token每秒,这个速度可以说是目前AI推理平台中最快的咯~