在阅读文章前,辛苦您点下“关注”,方便讨论和分享。作者定会不负众望,按时按量创作出更优质的内容。
文|不可史意
编辑|不可史意
在2025年年初,AI界杀出来了一员猛将——DeepSeek,一经问世震惊了整个人工智能行业,下载量一跃攀升至美国地区AI软件下载量榜首位置,与此同时也预示着为低成本AI的推理模型拉开了帷幕.....
就当大家还在消化中国带来的科技震撼之际,这时候美国华裔科学家李飞飞携团队出击,以DeepSeek为基础,推出了一款功能类似,但成本更低的AI推理模型,取名“s1”。
中国近些年来在科技上取得的成功,想必让美国也感到了威胁,如今“s1”的问世,也难免让大家好奇,李飞飞是如何在短时间内做出类似DeepSeek的AI软件的呢?
放下AI传统形式走向新征程
在过去很长一段时间内,我国科技曾经面临过一段灰暗的日子,受人制约,还要忍受排挤,而随着近些年我国国力增强,也实现了科技报国的愿景。
尤其是在2025年,简直可以称作是中国科技崛起之年,再次让世界认识到了中国力量,DeepSeek的成功也成为了众多优秀的中国AI企业走向国际的桥梁。
而今年在央视的春节联欢晚会上出现的16个扭秧歌机器人,直接给世界一个震撼,虽说穿上了花棉袄,转起了手绢,看起来有些诙谐,但只有内行人懂得,中国的机器人和AI技术已经到了怎样一个可怕的地步。
据和讯网在2025年2月6日发布的报道中,可以了解到的是在中国DeepSeek没有问世之时,可以说美国的OpenAI的在人工智能方面是“霸主”级别的,使用成本也非常的高。
为了能用上技术,很多企业都不得不增加项目成本,但DeepSeek的出现直接打破了这个困局,从实在的价格入手,先拿下市场份额,比OpenAI的成本价直接缩水20倍-40倍,解除了很多人对于这方面的顾虑,率先拿下客户群体,让对手感受到压力。
便宜并不代表商品功效不好,两者相比较下来,Open AI的实力也不容小觑,在技术和多模态能力还以后生态扩展等方面综合实力上是占据有优势。
DeepSeek更具有颠覆性的潜力,其低成本的营销策略可能会推动AI技术更快的普及,最实在的受益者就是各行业的用户们,门槛低了,大家就会更加愿意接受,从而推动行业的全方面发展,说不定还能激发更多的AI创造者。
据华尔街见闻在2025年2月6日发布的报道中了解,前有DeepSeek打头阵,相信已经有不少AI企业跃跃欲试。
在这个节点上,“s1”的出现再次受到了大家的关注,对比前两个有成本更低的绝对优势,并且研究成果表明,s1在数学和编码能力测试中和前两个受人瞩目的AI模型表现上不相上下,填补了DeepSeek在测试时间扩展图上需要大量数据的不足。
作为“s1”团队的主创,李飞飞是何许人也呢?
李飞飞1976年出生于北京,在16岁的时候就和家人移居到了美国,多年来在电子工程领域取得了显著的成绩,素有“AI教母”的美名,DeepSeek的成功自然也是逃不过她的眼睛,于是就带领团队做出了可以相媲美的“s1”。
据第一财经在2025年2月7日发布的报道中看,从技术层面来看,李飞飞带领的团队证明了只要是数据样本高质量,是可以通过简单的测试时间扩展就可能带来模型训练效率的大幅度提升。
而但是大家都知道做科研,一般情况下科研都是比较费钱的,需要投入大量的算力和人力,对数据的要求也非常高,这样一来,成本自然就高了。
而李飞飞却只用了一点点零头,不到50美金就完成了可能别人几千万都拿不下的项目,她是怎么做到的呢?这就不禁让人有些疑问。
根据相关资料显示,他们先挑选了上千个问题和答案,并且给出其中的“推理过程”,让其一点一点的了解其中的逻辑和规律,不到半小时就完成了训练。
到这个时候还有一个关键的问题,就好似不管是人工也好还是AI也好,难免会出错,那么怎样提高它的准确率则是必须思考的问题。
于是,李飞飞的研究团队就想到了运用一种“预算强制”技术,能控制测试的时间计算,提前强制种植模型的思考过程,另外在推理的同时也可以追加“等待”的指令方便更好的思考问题,优化各方面性能。
这时候肯定也有不少人有疑问,为什么这么复杂的AI算法李飞飞团队就可以轻易的突破,而其国际顶尖的AI公司却要花费大量的人力财力进行研究呢?
原来是因为采取了“蒸馏技术”,这种方法可以在极短的时间内,通过技术手段将数据压缩,使得小模型具备大模型的推理能力,更方便节省训练成本。
李飞飞取得的成功,也代表这种方法是有效的,在节省一定的资源的同时,也引起了行业内部的担忧,若是大家都采取这样的方式,可以轻易的复制甚至是超越现有的顶级模型,那么未来可能就会出现大家都不愿意在花费财力与精力,继续研发顶级模型了!
这样的担忧不无道理,若是未来大家都采取这样的形式,人工智能的发展可能会进入到一个瓶颈期,所以要适可而止或者制定出一个使用规则,大家都必须遵守,这样维持好平衡才能更有利于今后的发展。
参考资料:
和讯网——《如何看待和OpenAI的竞争?DeepSeek回答:更看好Open AI 但DeepSeek不可忽视》2025-2-6
华尔街见闻——《成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了》2025-2-6
第一财经——《李飞飞团队低成本复刻DeepSeek-R1模型?算力成本桎梏正在被打破》2025-2-7