文 |鳄娱海棠
编辑 |鳄娱海棠
序1月27日,在大家正沉浸在迎接新年的喜悦中时,国产AI软件DeepSeek横空出世。
该软件一经上线,直接登顶众多国家APP单日下载量榜单,甚至直接超过了美国的ChatGPT。
一时间,DeepSeek成为许多外国人口中的高频词汇,讨论DeepSeek对其他AI软件的威胁。
美国华裔女科学家不到50美元研究高性能AI这个横空出世的软件有非常多的优势足以让其他软件忌惮。
他不仅完全免费,还对外宣称开源,也就是说所有人都能看到此AI的来源。
DeepSeek的成本只有550万美元,但在多项数据中轻松打败国外的多个AI模型。
要知道,这些国外AI软件的制作成本动辄就上亿美元,单是这一项足以让不少人震惊。
随着DeepSeek的爆火,越来越多的科学家开始深耕于AI这个行业。
这不,一华裔女科学家仅用50美金就研究了一款AI模型,经过检测性能堪比顶级模型。
这一AI推理模型由这位女科学家在美国研究,在AI界再次引起了不小的轰动。
据外媒报道,美国名校斯坦福大学和华盛顿大学等机构发布了一项学术研究成果。
他们实验室的研究人员仅仅用了不到50美元的费用,就制作出一个略显完美的AI模型。
这个模型叫做S1,在一系列测试当中,都有着非常出色的表现。
和如今比较有名的几个AI模型作对比也毫不逊色,似乎有些将AI模型制作“拉下神坛”。
值得注意的是,s1模型研究团队中的主创是一位华裔,名字叫做李飞飞。
关注AI行业发展的人对这个名字应该都不陌生,在AI行业的知名度非常的高。
她是斯坦福大学计算科学系的教授,这次带领研究团队制作的是s1和DeepSeek的R1模型相差无几。
由此可见,这项研究成果必定又要引起大范围的轰动:原来AI模型还可以在效率高的同时降低成本。
有了美国ChatGPT等软件的前车之鉴,大家对于AI模型的印象就是烧钱。
但是李飞飞团队研究的s1居然只用了不到50美元,同时也不需要耗费大量人力。
在普罗大众的传统印象中,想要制作一个AI模型,动不动就要成立一个有成百上千员工的公司。
DeepSeek这个例外已经很让人震惊了,没想到这位华裔女科学家能做到这种地步。
不过,s1的成本之所以如此之低,最重要的原因是它从一个现成的AI模型中蒸馏的。
这个被蒸馏的模型已经非常成熟了,s1有了这个前车之鉴之后,就可以“取其精华,去其糟粕”,轻松复刻一个新模型。
李飞飞团队先提取了1000个难度高且质量好的问题,然后对这些问题进行训练。
这1000被精挑细选的问题被作答之后,还回复附赠上推理过程,看起来更加的简洁明朗。
既然已经开始制作,都想让自己的模型看起来更加专业,于是实验室成员开始着重强调模型的其他能力。
在此AI模型进行工作的时候,为其增加了预算强制,让他必须在规定时间内完成指定任务。
总之,经过李飞飞团队的一番研究,s1的表现十分的亮眼吗,完全看不出来是一个小成本产物。
就连享誉多个国家的Gemini 2.0 Thinking API,和s1对比的时候也不占上风。
s1就像是来砸场子一样,它的出现让大家对AI模型制造有了新的认知。
原来AI并不是普通人遥不可及的产物,也并不是非得需要大量的资金和人力。
数据量、算力等条件在很长一段时间以都是AI的代表,各大软件的核心竞争力正是如此。
但李飞飞团队向世人展现的却是AI的另一种情况:只要方法用的对,顶级模型并不需要太强大的数据支撑。
不过,这种“蒸馏技术”同样引来了业内的担忧,倘若大家都这样投机取巧,那么一些大公司这么多年在AI上投入的研发成果就会受到很大的威胁。
虽说蒸馏技术能够在短时间内复刻出一个像样的AI模型,但如果继续进行创新的话就会有技术壁垒,难以实现更高的追求。
DeepSeek横空出世如今,全世界几乎都在进行AI研究,其中有显著成果还要数美国和中国。
想当年ChatGPT横空出世时的盛况仍旧历历在目,ChatGPT也确实一直处在AI霸主的地位。
中国的科学家们紧随其后,想要在AI行业分一杯羹,DeepSeek出现了。
它成立于2023年7月,短短一年半的时间足以震惊各个国家的科学家。
美国的AI行业一直都在蓬勃发展当中,占据全球AI市场的比例非常之大。
DeepSeek出现之后,宛若一只脱缰的黑马,以一己之力DeepSeek频繁出现在他们的口中。
据相关数据显示,DeepSeek上线即火爆,在很短的时间内就已经登上了下载榜的第一名。
这一数据无疑是非常喜人的,这表明中国科学家在国际AI市场上开始站稳脚跟。
一时间,DeepSeek出现在美国各大媒体的新闻当中META在第一时间将DeepSeek作为竞争对手。
虽然成绩亮眼,但是关于DeepSeek的质疑声音同样是不绝于耳,OPEN AI 就公开质疑DeepSeek蒸馏他们的成果。
很显然,这些公司已经将DeepSeek当做了假想敌,不过DeepSeek并没有过多理会。
DeepSeek-V3运用了很多小巧思,比如他们用只激活必要数据来节省内存和成本,性能方面更是无可挑剔。
结语全世界范围内有关于DeepSeek的赞美声音不绝于耳,相信他们之后的发展一定会越来越好。
李飞飞曾说过希望用中国人身份领取诺贝尔奖,希望她能够为中国的AI产业带来更多贡献。
参考信源:
华尔街见闻2025.2.6——成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了