伯克利团队仅30美元复制DeepSeekAI

煎蛋 2025-02-03 16:00:46

伯克利团队以30美元复制DeepSeek AI的核心功能,推出开源项目TinyZero,证明AI研究不再是高成本领域,降低了进入门槛,推动了更广泛的技术应用。

人工智能研究通常是巨头企业的专属游戏,这些公司拥有深厚的财力支持。然而,伯克利加州大学的一支研究团队却打破了这一局面。他们仅以30美元复制了DeepSeek R1-Zero的核心功能。他们的项目名为TinyZero,证明先进的人工智能推理模型并不需要耗费巨额资金。更重要的是,人工智能研究比以往任何时候都更容易接近。

在潘佳乂的带领下,该团队旨在通过强化学习(Reinforcement Learning,RL)重新构建DeepSeek的推理模型。与依赖昂贵的云服务或巨大的计算能力不同,他们使用了一个基本的语言模型、一个简单的提示和一个奖励系统来训练TinyZero。

Jiayi Pan在X平台上分享了他的兴奋之情,表示:“你可以亲身经历那一刻,只需不到30美元。”他还将TinyZero描述为第一个开源的推理模型复现项目,强调了它如何学会验证和完善自己的答案。

如何开发TinyZero

为了测试模型,研究人员选择了一个名为Countdown的游戏,玩家需要通过基本的数学运算来达到目标数字。尽管TinyZero最初是随机猜测,但随着时间的推移,它学会了验证自己的答案、寻找更好的解决方案并相应地进行调整。

他们尝试了不同规模的模型,从50亿参数到700亿参数。结果是什么?参数规模较小的模型(50亿参数)只是随机猜测答案然后停止。而参数规模较大的模型(150亿参数及以上)则学会了自我验证、完善解决方案并显著提高了准确率。

TinyZero真正引人注目的地方在于,与传统的人工智能模型相比,它的成本低得惊人。看看这些对比:

* OpenAI的API:每百万tokens收费15美元

* DeepSeek-R1:每百万tokens收费0.55美元

* TinyZero的总成本:一次性训练成本30美元

这意味着任何人(不仅仅是大型科技公司)都可以在无需烧钱到破产的情况下实验人工智能推理模型。

可用性

TinyZero是开源的,并且可以在GitHub上找到,因此任何人都可以尝试改进它。尽管它目前仅在Countdown游戏中进行了测试,但潘佳乂希望这个项目能够使强化学习研究更加普及。

当然,这仍然是一个早期阶段。“当然,其中一个缺点是,它仅在Countdown任务中得到了验证,但尚未在一般推理领域中得到验证。”Pan承认。但即便如此,其影响仍然是显而易见的:人工智能的发展并不一定要昂贵。有了像TinyZero这样的项目,低成本、开源的人工智能或许将成为未来的趋势。

本文译自 Gizmochina,由BALI编辑发布。

59 阅读:41928
评论列表
  • 老框 170
    2025-02-03 18:45

    我可以不花一分钱就到对面的湿地公园去遛弯:因为别人已经修好了一条直达的路……

    老框 回复:
    是挺好的!但我走在路上没啥好沾沾自喜,反而可以鄙视一下边上那个拦路收费的……[吃瓜]
    用户21xxx40 回复:
    和直达的路相比,ds是虫洞。
  • 月亮 108
    2025-02-03 20:37

    就是抄,deepseek可能真正使AI流行开来,这就是deepseek的可贵之外,硅谷巨头的护城河被人破了,没法割韭菜了。

    sonority 回复:
    不矛盾的,而且deepseek甚至可以推高算力卡的销量,因为可能真的让各种小公司做自己的AI,做大整个市场。金铲子谁都想用,逼迫美国解除限制,这才是deepseek开源最大的意义,因为现在按配额卖,英伟达的泡泡会破。。
    貌似混血儿 回复:
    开源的东西可不好说抄,就好比安卓系统
  • 2025-02-03 22:37

    开源的,你居然花了30美元,哈哈哈

    MarshmelloAA 回复:
    随便叫AI生成UI就是了,花什么钱
    Toy World Ltd 回复:
    你来问问DS他开源不开源
  • 煤球 51
    2025-02-03 20:14

    这就说…其实“我也行??”

    天鹰 回复:
    就是抄的,都开源了[笑着哭]
  • 够呛 47
    2025-02-03 20:45

    不止是国运级别,而是会推动全人类的进步,想想觉得不可思议

    一览众山小乎 回复: Audi 小曾
    有啊,老多了,转手送了你爹妈500刀
    Audi 小曾 回复:
    你们那个ngo不是已经关了吗 还有人给你钱?
  • 2025-02-03 20:57

    只要把AI打下来,美国在AI上投入的和未来的计划,就彻底泡汤了

    琉璃 回复:
    也不叫找答案吧,还会推理答案,类似于人大脑,人也是从自己大脑的知识储备里面推理答案的
    MarshmelloAA 回复:
    你把博弈树吃了?
  • 金戋 38
    2025-02-03 23:06

    护城河破了,大巴溃于蚁穴。ai战阶段性成功了,美国被逼到了墙角 。除非埃隆马斯克短期内能成功开发火星,否则就是死路一条。

  • 布丁 36
    2025-02-05 18:11

    对于普通人来说,现在的AI更像是从之前搜索引擎发展而来。核心技术的升级成就A I技术更加全面和能处理更加复杂的工作

  • Jason 32
    2025-02-03 23:11

    美国的科技企业所谓的AI霸权就这样完蛋了

  • 2025-02-03 22:18

    只要大坝漫顶,大坝就会在内部被肢解。deepseek就是漫顶的水,美国科技企业就是内部肢解的各种力

  • 2025-02-03 20:48

    这就是科技公司破产的奥秘,它们会投资者一夜破产。

  • 2025-02-03 23:09

    如果说蒸馏是一种AI常用技术方式,那么,美国企业不会蒸馏吗?美国企业的蒸馏模型水平差吗?开源的蒸馏闭源的?有点情理不通。

    天鹰 回复:
    股市证明一切
    劈山 回复:
    最好是美国还走它那条路高成本高收费,没钱的国家不愿多花钱的国家可以走中国这条路
  • 2025-02-03 22:06

    啥子东西中国人都能干到白菜价[呲牙笑]

  • 2025-02-03 22:51

    其实中国的也是复制的,基于别人的产品才发展起来的

    风轻云淡 回复:
    为什么总是有这种自以为是的脑残存在呢?费解!
    发芽的种子 回复:
    代码都公开了。真复制,就有人几年前说这个事了。等不到你来说这个。
  • 2025-02-03 21:08

    英伟达是不是又要暴跌

    旧时明月 回复:
    刚刚好,5090出来了,换显卡,舒服。[得瑟]
  • 2025-02-04 04:23

    知道什么叫开源吗?[笑着哭]

  • 2025-02-04 11:29

    所谓低成本不过是采用蒸馏和抄袭,以后会开发出反蒸馏技术,否则整个行业将崩溃,假如某公司花费大量金钱获得的数据会被人轻易拿走,还会有人去干这样的事吗?

    岩斌。 回复:
    怎么不说美国人把Ai技术给垄断了让别人没得活,这样行业还有什么前景?这东西就是为了打破垄断,人人都能搞的活。
  • 2025-02-04 05:46

    看着人工智能的发展,我有点瑟瑟发抖

  • 2025-02-03 22:50

    好事情,本来就很简单,说白了,了解原理就这么简单

  • 2025-02-03 23:20

    扯蛋

  • 2025-02-04 21:35

    好事。继续打击英伟达、OpenAI这种企业,对我们没有坏处。

  • 2025-02-04 10:33

    现在是用更小算力的芯片达到相同的结果,那还是堆砌算力呀,更高的算力还是可以达到更高更快的结果[汗]

    用户25xxx27 回复:
    那不是废话,用户多肯定还是需要大型服务器支撑的,你总不能一百个人用一个服务器 一百万人还用一个服务器吧
  • 2025-02-03 22:46

    美帝的间谍来了

  • 2025-02-04 07:56

    各路AI投入起码上万亿了吧,被几十块打发了,这下死的人多了[鼓掌]

  • 2025-02-05 13:16

    美国衰落之路上的一朵浪花

  • 2025-02-04 08:04

    那天看一个朋友发的deep seek的朋友圈 问它一些游戏开发的技术问题 它最后附带的一个答案 说5G与边缘计算机技术的发展或进一步优化竞速类游戏的实时同步体验[笑着哭][笑着哭]谁看出这答案的问题了

  • 2025-02-04 12:14

    抄作业要成本?傻子

  • 2025-02-04 10:36

    “当所有协议失效时,爱是最后的防火墙”这两天在贴吧关于seepseek各种花活,有些句子真的很惊艳

  • 2025-02-04 03:27

    美国缴械投降了。

  • 2025-02-04 18:28

    挺好,deepseek最大的贡献就是打破了openai的垄断,让全球都能参与到这个赛道,同时也纠正了只卷算力的研究方向

  • 2025-02-04 08:15

    听名字估计又是一个华裔润人

  • 2025-02-04 13:39

    刺杀伯克利团队应该比刺杀梁文峰简单些[点赞]

  • 2025-02-04 08:21

    说白了就是抄写!偷窃用了30美元!

  • 2025-02-03 22:46

    照虎画猫[得瑟]

  • 2025-02-05 03:44

    完了,AI个体化时代来临了,五年之内突破法律底线的黑暗AI必定诞生!

  • 2025-02-05 16:24

    能复现,说明deepseek的对的

  • 2025-02-04 06:17

    现在都强调费用,是不是要反击英伟达的芯片论

  • 2025-02-04 22:47

    30美元是指请复制粘贴的程序员吃顿kfc吗

  • 2025-02-04 10:49

    可怜,就算是抄还得花30美元

  • 2025-02-03 23:49

    只需不到30美元,那openai、英伟达等科技股价应降至3美分/股才对,为啥还不降?

  • 2025-02-04 02:47

    有几天不能登录 听说受网络攻击了 会不会把核心机密泄露了

  • zzyh 3
    2025-02-04 14:07

    好,赢。。。。科技终究掌握在不文明手里。

  • 2025-02-04 15:59

    开源了,说啥了,懂得人可以花很少的成本实现deepseek的功能。

  • 2025-02-04 08:03

    煞笔,就是下载了一份

  • 2025-02-04 11:18

    对对对

  • 2025-02-04 16:34

    屎一样的文章。

  • 2025-02-05 06:03

    川普的星际之门打水漂了[呲牙笑][呲牙笑][呲牙笑]

  • 2025-02-05 09:45

    下载复制粘贴安装,人工费30美元,搞定。

  • 2025-02-04 18:04

    互相抄袭,成就各自

  • 2025-02-05 09:45

    好冷的笑话

  • 2025-02-05 03:08

    你抄作业还花钱?

  • 7b 2
    2025-02-04 07:40

    谁不是换壳抄袭呢,都一样的

  • 2025-02-04 11:30

    我想做一个窗口,后台收录所有AI,进行搜索整理并展示,类似浏览器,是不是也一样更高科技

  • 2025-02-05 08:35

    厉害[点赞],几个人喝咖啡搞定的[呲牙笑][呲牙笑][呲牙笑]

  • 2025-02-05 08:03

    跪久了 词都不会用了 写的什么舔文

  • 2025-02-04 11:05

    还30元就搞出来了,不就是炒的吗?显卡,服务器不要钱?30块电费都不够吧,一秒跑完模拟训练,哗众取宠,你说3毛钱我都信[呲牙笑][呲牙笑],这老外真让我蚌埠住了

  • 2025-02-04 14:41

    来来来,说抄袭的黑子们呢?公知呢?大V呢?润人们呢?出来说两句啊?![吃瓜][吃瓜][吃瓜]

  • 2025-02-04 00:34

    站在巨人的头顶上自然是比巨人高。

  • 2025-02-03 23:11

    30美元做个logo?

  • 2025-02-03 22:46

    美国智能化领域主要是华人🙀

  • 2025-02-05 09:38

    蹭热度的不少

  • 2025-02-05 20:39

    本就开源,把老美ai干趴下就行了

  • 2025-02-05 17:18

    中国某些部门肯定早就找上了。Deepseek下一个版本可能就不是开源的。

  • 2025-02-06 14:25

    哈哈,复职粘贴了一下吧

  • 2025-02-04 09:56

    不可能!美国零时工时薪都要20美元,1个半小时,喝杯咖啡的时间都没有。[静静吃瓜]

  • 2025-02-04 07:22

    开源的美妙之处

  • 2025-02-04 07:12

    西大一开源,东大就超越

  • 2025-02-04 07:58

    要的就是这个效果!30块让人家几千亿怎么活?然后美国开始立法闭关锁国[呲牙笑][呲牙笑][呲牙笑][呲牙笑][呲牙笑]

  • 2025-02-04 10:10

    所以花几百亿的AI是骗钱咯

  • 美元超发的蓄水池很多去了美股的人工智能,这开源一出。。。

  • 2025-02-05 08:50

    看这名字就感觉是棒子国的

  • 2025-02-05 00:17

    模型本来就是抄来抄去的啦[笑着哭]

  • 2025-02-04 00:33

    美国佬这样不要脸的复制我也会,更便宜

  • 2025-02-04 10:06

    貌似前几天看见那啥啥的开发公司四个人买社保[笑着哭]我笑笑不说话,搬砖中。

  • 2025-02-04 09:13

    看来网络游戏中,NPC拥有智能的时代很快就要到来了,我需要做些什么准备呢,我觉得我也应该训练一个AI,专门用来绕晕智能NPC,这样我就能在游戏里如鱼得水了。

  • 2025-02-04 09:00

    学术圈说中国科研环境不行的人,基本上是一件事情,就是掩盖自己的无能。呵呵

  • 2025-02-05 13:20

    又是中国人带领的?

  • 2025-02-06 10:04

    当年微软放任盗版让全球形成使用惯性,这也是开源,你说为了啥

  • 2025-02-06 10:21

    本来美国还能靠吹AI支撑个几年股市的这下好了,现在谁都能玩得了AI了,能不让殖子出来带带节奏么

  • 2025-02-06 07:54

    感谢deepseek开源[呲牙笑]