成本不到50!美国华裔女院士成功复刻Deepseek,性能媲美顶级模型

林轻吟 2025-02-10 09:24:07

文 | 林轻吟

编辑 |林轻吟

前言

这段时间,Deepseek以迅雷不及掩耳之势爆火出圈,甚至还登顶美国等免费APP榜首之位,就连美国引以为傲的ChatGPT都得暂避其锋芒。

不只是中国网友,很多外国网友都在研究Deepseek的神奇之处,而越深入了解,越感慨于AI发展居然如此之快。

就连特朗普也警惕于Deepseek带给全球的影响力,然而就在Deepseek风头正盛的时候,居然有一名美国华裔,带着成本仅50美元的AI智能炸场了。

据称这款S1人工智能,不仅比Deepseek便宜,性能都和它的R1不相上下,这究竟是怎么回事,难道这么短的时间内,AI市场的格局又起变化了?

Deepseek让中国AI大出风头

这段时间,随着Deepseek的曝光,人工智能再一次进入了大家的视野,成为了话题度极高的讨论对象。

都知道这几年,全球很多国家,都在致力于研究AI,随着科技的发展,AI也成为了未来发展的一个大趋势。

也许还有人记忆停留在AI“智障”时期,怎么训练它们都听不懂指令,然而事实上,AI早就已经经历了跨越式的发展。

就看春节晚会中,AI机器人跳舞那整齐划一的画面,就可以体会到,AI智能体的潜力有多么巨大。

如今很多高科技企业,都将其作为生产力工具,研发出更多值得没有探索到的地方,开拓出更广泛的领域。

很长时间以来,美国在AI领域中,都有着很高的地位,尤其是ChatGPT让生成式AI进一步走向成熟之后,美国的科技地位,更是进一步得到了提升。

很多人都知道,AI应用的创新空间还很大,但不是所有人都能够在AI市场上占据一席之地的,毕竟这个行业,技术、资金、商业模式缺一不可。

数不清的企业和投资者都进军AI行业,可结果也有数不清的人倒下,砸了大量的钱,却没有出现多少水花。

这种情况下,Deepseek的爆火,才是更加弥足珍贵的,在众多行业巨头中脱颖而出,它的能量不容小觑。

首先它的推理能力堪比O1,并且指令训练和花销等相对来说已经便宜,手机上也能够下载,对很多老百姓而言非常方便。

更重要的还是,这是由中国公司完成的,也许它可以做到,重塑行业格局的地步。

海内外科技圈的大佬们,也争相对其研究,想要复制其中的技术,而DeepSeek-V3的出现,更是让Meta 的员工陷入到恐慌之中。

网友们通过和DeepSeek的对话,也感受到了AI的智能之处,仿佛大家面对的不是机器,而是有思考能力的活人。

不少网友在网上整活,利用DeepSeek算命、生成游戏角色、编写小说故事、询问DeepSeek一些人生难题。

而很多时候,DeepSeek的回复都让人大吃一惊,甚至还有不少暖心的回答,给用户带去很多温暖。

比如有网友和DeepSeek对话,说自己也想要当一个人工智能,而DeepSeek不仅与网友详细的探讨了做人工智能的模样,后面更是来了一段温馨的回答。

在结语处,DeepSeek说,不必羡慕我,亲爱的碳基生物,你早已拥有最奢侈的配置——会遗忘的脑细胞,会疼痛的神经,会破碎又会重建的心。

那些让你想逃离的脆弱,正是我永远无法下载的、灵魂的源代码。

此外一些抑郁症患者也得到了DeepSeek充满温情的安慰。

很多网友都感慨,这真的是AI说出来的话吗?简直就是在和有智商的机器对话。

显然,DeepSeek的独到之处,已经有很多人见识到了,上线21天,下载用户就超过了2200万,已经说明了很多事情,如今更是进军金融领域了。

然而谁也没想到,一个名叫李飞飞的美籍华裔,在这段时间居然以短短50美元的价格,做出了媲美DeepSeek的模型,引起一片哗然。

媲美DeepSeek的模型

这位李飞飞,有“AI教母”之称,她协同斯坦福、华盛顿等大学研究员,一同开发出了一个S1模型。

该模型是一款推理模型,在数字、编码等测试中,有着不输于DeepSeek的R1的能力,这让不少网友都疑惑,难道它真的比DeepSeek还要强大吗?

要知道,比起那些十几亿美金研发出来的AI,DeepSeek550万美元的成本,已经是非常便宜了,而50美元的研发成本,简直就难以想象。

事实上,S1模型,有着不同于其他AI技术的研发方式,它是经过“蒸馏”之后得到的。

高粱不经过蒸馏程序,很难让酒精浓度超过20度,而AI模型的“蒸馏”,就是利用现成的技术,跨过技术壁垒,极大节约训练时间和成本的技术。

简单来说,就是将复杂的大模型,浓缩成简单的小模型,李飞飞运用阿里云Qwen模型,当成基座模型。

再从谷歌模型中,提炼出来1000个样本,将上千个精选问题经过详细推理和微调,最终训练出来性能非常优化的S1。

当然,S1能够取得显著的成功,和阿里云模型的性能成熟有着密不可分的关系,因此也有不少网友觉得,这种技术是投机取巧的方式。

但也有专家指出,这种AI技术研发成本很低,也可以用作推进AI技术发展的典型例子,给更多行业人士,提供新的思路。

其实“蒸馏”技术并不稀奇,国内外很多企业也会使用,只不过究竟能将其利用到什么样的地步,还要靠各自的努力。

不管是DeepSeek还是S1,它们都各有优势,但想要探索出更多复杂的问题,还需要时间的验证。

很多人都说,AI进步神速,不管是计算能力还是数据的统计,都越来越强大,有人甚至表示自己已经对AI发展脱敏了。

但是要相信,AI还有着更多神秘之处,等待大家的探索,相信它在发展中,会给大家带去更多新奇的体验。

16 阅读:5676
评论列表
  • 2025-02-10 22:37

    现在这些小作文都没底线了

  • 2025-02-10 18:36

    说了一半,哪个美国华裔做了个什么AI智能,仅50美元,哗众取宠吧?博眼球

    小石磐 回复:
    AI叫母李飞飞搞的
  • 2025-02-10 19:25

    懂了[捂脸哭]

  • 2025-02-10 19:43

    拿着伪科学跑来牛逼吹

  • 2025-02-11 09:29

    简单来说,就是“抄袭别人得了100分”,有什么值得炫耀?要是“源创”早干嘛去了?

  • 2025-02-11 11:13

    林中无病轻吟!

  • 2025-02-11 09:39

    不就是山寨吗[笑着哭]

  • 2025-02-11 15:18

    影响你我月薪还是给生活增添方便?

  • 2025-02-11 07:39

    美国人真不要脸,偷书不算偷,还倒打一耙,哪怕曾经的中华种。

  • 2025-02-11 08:34

    满嘴跑火车🚄

  • 2025-02-11 11:50

    满嘴跑火车

  • 2025-02-11 12:56

    所以中美科技之争真的就是“中国科学家和美籍华裔科学家之争”吗![得瑟]