清华大学在DeepSeek - 671B全量版运行上的最新突破: 过去需要8张H100显卡,成本几百万,现在只用一张4090显卡,成本六万出头,就能跑起来。效率提升28倍!这是什么概念?普通用户也能用4090显卡跑大模型了!算力门槛一下就被拔平了!想搞AI的中小团队、个人开发者有救了!
牛的是清华又双叒叕突破了!这次他们提出了创新性的CPU+GPU混合架构,把400G缓存放进了内存里!不需要那么多显卡集群,也能跑大模型!这种算法和模型结合的方法,极大地提升了算力使用效率,也极大地降低了AI的算力门槛。
评论列表