卷飞了,斯坦福李飞飞团队用50美元,训练出媲美DeepSeekR1的模型

正直云朵 2025-02-07 18:24:16

AI大模型由于“蒸馏”技术的出现,呈现突飞猛进的大飞跃;其模型训练成本越来越低,已经出现“零元训”趋势,未来“赚钱训”都可能!

Deepseek_R1爆出来的训练成本是577万美金,但是其生不逢时,才火了不到一个月,就遇到了强劲的挑战对手。

来自斯坦福大学和华盛顿大学的李飞飞团队做出的S1大型,推理模型云计算训练成本不到50美元,然而其性能可以媲美Deepseek_R1。

李飞飞团队的S1大模型是由谷歌的Gemini 2.0蒸馏所得,仅使用16块英伟达H100 GPU;训练了26分钟便获得了如此高的性能,惊呆了所有人!

50美元合计人民币350元左右,这个在科研中算成本吗?估计连电费都不一定够。不过Deepseek的577万美元,也是其训练费用,也没有算其它的成本在里面!

英伟达H100GPU芯片一个都要1万美元以上,而S1用了16块,显然所有模型都不算这块成本,只算了训练时候的消耗,就是“电费成本”等等;人工都没有算。大家要注意这是“训练消耗”,不是完全成本!这也是“蒸馏”技术的一部分!

从这方面说,Deepseek的577万美元训练,在当下成本明显偏高了。不过Deepseek_R1出来比S1早,可能在当时技术上难度训练难度更高,花钱更多也是可能的!

DeepSeekR1模型的出现,给AI界带来了一系列的连锁反应;让AI的进化速度越来越快了;全世界的大模型都在积极发展。

这些技术的出现,让OpenAI现在非常艰难,其在2月5日已经被迫宣布免费开放ChatGPT搜索,无需注册即可使用。

从Deepseek_R1与S1等AI大模型的进化速度看,人工智能的能力,在未来将会越来越离谱了;在各做在大模型这块会卷飞的,会一个比一个训练成本低,最后可能会赚钱训练的。

以现在人工智能技术进步的速度与创新成本的大幅下降,一些服务性工作将会慢慢消失,大模型的解决能力比人不知道要强多少倍;很多工作会被AI慢慢替代的。

AI模型其一秒钟的学习能力,很多人一辈子都学不到!这样下去,大家读书的价值在哪里呢?从这方面说,卷读书已经意义不大,等你的孩子长大了,发现会无工作可干了!能干都是的都是一些传统的技术活!

1 阅读:282
评论列表
  • 2025-02-08 08:41

    大数据蒸馏技术,和盗贼有什么区别!

  • 2025-02-08 09:41

    有AI教母之称身兼数职的李飞飞,五十美元够她一分钟的收入不?这是打脸的,看不懂就别说话。

  • 2025-02-08 07:56

    人类智能的进阶之路可能在修仙!

正直云朵

简介:感谢关注