28纳米、14纳米、7纳米……中国公司在美国制裁下逐渐突破,终于可以告别芯片“卡脖子”。然而,去年9月,英伟达高端显卡GPU芯片A800对中国断供,一时给国内欣欣向荣的大模型产业投下一颗震撼“核弹”。 很多人这才知道,原来除了CPU,GPU也同样在“卡着”我们的脖子。而GPU芯片,更是AI科技发展的必须品,无论是百度的文心还是科大讯飞的星火,离了GPU都将“不再神奇”。而高端GPU芯片对中国断供,这意味在全世界大模型技术日新月异而对AI算力需求猛增的时候,我们却面临“无卡可用”,而我们却在短时间内无可奈何。 更气人的是,后来英伟达向中国推出了降级版GPU芯片,这被网友们戏称为“阉割版”。 可是,难道我们只配用“阉割版”吗?我认为这不是我们想要的结局。而要发展AI算力,要么想办法购买到高端GPU,要么,就是想办法提高GPU的利用率。第一点上,主动权在别人,但第二点上,我们有企业站出来了。 最近,蚂蚁集团公布的一项技术GMLake入选了计算机领域顶级学术会议ASPLOS24论文,让对这个行业熟悉的人不禁眼前一亮。因为这项技术专门解决的就是GPU使用率低的问题。举个简单的例子,GPU在日常使用中,可能有一半显存都处于闲置状态,但蚂蚁的这项动态显存组合技术VMS可以做到最高节省33%的GPU显存占用,从而提高显存的利用效率。 而且,蚂蚁已经将这项技术开源,这对所有AI企业来说都是福音,试想一下,AI企业花同样的钱、买同样多的芯片,要是应用这项技术的话,是不是能更大限度上实现降本增效呢?从长远来看,这也会加速推动我们国产AI产业的发展。
评论列表