成本不到50!美国华裔女院士成功复刻Deepseek,性能媲美顶级模型

鳄娱梨花 2025-02-07 18:16:34

文 |鳄娱海棠

编辑 |鳄娱海棠

1月27日,在大家正沉浸在迎接新年的喜悦中时,国产AI软件DeepSeek横空出世。

该软件一经上线,直接登顶众多国家APP单日下载量榜单,甚至直接超过了美国的ChatGPT。

一时间,DeepSeek成为许多外国人口中的高频词汇,讨论DeepSeek对其他AI软件的威胁。

美国华裔女科学家不到50美元研究高性能AI

这个横空出世的软件有非常多的优势足以让其他软件忌惮。

他不仅完全免费,还对外宣称开源,也就是说所有人都能看到此AI的来源。

DeepSeek的成本只有550万美元,但在多项数据中轻松打败国外的多个AI模型。

要知道,这些国外AI软件的制作成本动辄就上亿美元,单是这一项足以让不少人震惊。

随着DeepSeek的爆火,越来越多的科学家开始深耕于AI这个行业。

这不,一华裔女科学家仅用50美金就研究了一款AI模型,经过检测性能堪比顶级模型。

这一AI推理模型由这位女科学家在美国研究,在AI界再次引起了不小的轰动。

据外媒报道,美国名校斯坦福大学和华盛顿大学等机构发布了一项学术研究成果。

他们实验室的研究人员仅仅用了不到50美元的费用,就制作出一个略显完美的AI模型。

这个模型叫做S1,在一系列测试当中,都有着非常出色的表现。

和如今比较有名的几个AI模型作对比也毫不逊色,似乎有些将AI模型制作“拉下神坛”。

值得注意的是,s1模型研究团队中的主创是一位华裔,名字叫做李飞飞。

关注AI行业发展的人对这个名字应该都不陌生,在AI行业的知名度非常的高。

她是斯坦福大学计算科学系的教授,这次带领研究团队制作的是s1和DeepSeek的R1模型相差无几。

由此可见,这项研究成果必定又要引起大范围的轰动:原来AI模型还可以在效率高的同时降低成本。

有了美国ChatGPT等软件的前车之鉴,大家对于AI模型的印象就是烧钱。

但是李飞飞团队研究的s1居然只用了不到50美元,同时也不需要耗费大量人力。

在普罗大众的传统印象中,想要制作一个AI模型,动不动就要成立一个有成百上千员工的公司。

DeepSeek这个例外已经很让人震惊了,没想到这位华裔女科学家能做到这种地步。

不过,s1的成本之所以如此之低,最重要的原因是它从一个现成的AI模型中蒸馏的。

这个被蒸馏的模型已经非常成熟了,s1有了这个前车之鉴之后,就可以“取其精华,去其糟粕”,轻松复刻一个新模型。

李飞飞团队先提取了1000个难度高且质量好的问题,然后对这些问题进行训练。

这1000被精挑细选的问题被作答之后,还回复附赠上推理过程,看起来更加的简洁明朗。

既然已经开始制作,都想让自己的模型看起来更加专业,于是实验室成员开始着重强调模型的其他能力。

在此AI模型进行工作的时候,为其增加了预算强制,让他必须在规定时间内完成指定任务。

总之,经过李飞飞团队的一番研究,s1的表现十分的亮眼吗,完全看不出来是一个小成本产物。

就连享誉多个国家的Gemini 2.0 Thinking API,和s1对比的时候也不占上风。

s1就像是来砸场子一样,它的出现让大家对AI模型制造有了新的认知。

原来AI并不是普通人遥不可及的产物,也并不是非得需要大量的资金和人力。

数据量、算力等条件在很长一段时间以都是AI的代表,各大软件的核心竞争力正是如此。

但李飞飞团队向世人展现的却是AI的另一种情况:只要方法用的对,顶级模型并不需要太强大的数据支撑。

不过,这种“蒸馏技术”同样引来了业内的担忧,倘若大家都这样投机取巧,那么一些大公司这么多年在AI上投入的研发成果就会受到很大的威胁。

虽说蒸馏技术能够在短时间内复刻出一个像样的AI模型,但如果继续进行创新的话就会有技术壁垒,难以实现更高的追求。

DeepSeek横空出世

如今,全世界几乎都在进行AI研究,其中有显著成果还要数美国和中国。

想当年ChatGPT横空出世时的盛况仍旧历历在目,ChatGPT也确实一直处在AI霸主的地位。

中国的科学家们紧随其后,想要在AI行业分一杯羹,DeepSeek出现了。

它成立于2023年7月,短短一年半的时间足以震惊各个国家的科学家。

美国的AI行业一直都在蓬勃发展当中,占据全球AI市场的比例非常之大。

DeepSeek出现之后,宛若一只脱缰的黑马,以一己之力DeepSeek频繁出现在他们的口中。

据相关数据显示,DeepSeek上线即火爆,在很短的时间内就已经登上了下载榜的第一名。

这一数据无疑是非常喜人的,这表明中国科学家在国际AI市场上开始站稳脚跟。

一时间,DeepSeek出现在美国各大媒体的新闻当中META在第一时间将DeepSeek作为竞争对手。

虽然成绩亮眼,但是关于DeepSeek的质疑声音同样是不绝于耳,OPEN AI 就公开质疑DeepSeek蒸馏他们的成果。

很显然,这些公司已经将DeepSeek当做了假想敌,不过DeepSeek并没有过多理会。

DeepSeek-V3运用了很多小巧思,比如他们用只激活必要数据来节省内存和成本,性能方面更是无可挑剔。

结语

全世界范围内有关于DeepSeek的赞美声音不绝于耳,相信他们之后的发展一定会越来越好。

李飞飞曾说过希望用中国人身份领取诺贝尔奖,希望她能够为中国的AI产业带来更多贡献。

参考信源:

华尔街见闻2025.2.6——成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了

0 阅读:0

鳄娱梨花

简介:感谢大家的关注