前言
“媲美中国人的还得是中国人”
DeepSeek问世之后对美国AI界的震撼感那叫一个大。
它仅仅用了558万美元的研发费用,就超越了美国数亿美元成本的AI模型。
美国科技巨头英伟达“应声倒地”,单日市值蒸发接近6000亿美元,创下史上最大单日跌幅记录。
还有像AMD、台积电等传统巨头也受到了不同程度的冲击。
就在这时,一位美籍华裔女科学家站了出来,用了50美元成功复刻了DeepSeek!
她是咋做到的?
美籍华裔女院士李飞飞
人们常说,美国有一位来自中国的“AI教母”,指的就是李飞飞。
李飞飞出生于1976年的北京,成长在一个知识分子家庭,那种浓厚的学术氛围滋养着她的求知欲。
小时候的李飞飞,对知识的渴望简直超乎寻常小朋友,但凡有学习的机会,她都紧紧抓住。
那时候国内的经济虽然潜力巨大,但仍在发展阶段,教育资源不像现在这么丰富。
因此李飞飞16岁时选择远赴美国求学,在美国新泽西州定居,并加入美国国籍。
她凭借优异的成绩考入了普林斯顿大学,主修物理和计算机科学专业。
上世纪90年代,美国科研环境优势明显,顶尖高校云集,科研设备先进,如同科技领域的 “超级航母”,吸引了大批中国人才。
毕业后李飞飞决定进入加州理工学院,攻读电子工程硕士和博士学位。
此后李飞飞的学术之路就像开了加速器,在人工智能领域崭露头角,做出了颇多的研究成果,2020年被选为美国国家工程院院士。
同时她也在美国找到了自己的意中人,她的丈夫是一位机器人专家,叫西尔维奥?萨瓦雷塞,两人的工作领域可谓相辅相成。
如今李飞飞和丈夫已经生了一儿一女,家庭美满幸福。
不过她并没有在组建家庭后成为“家庭主妇”,相反更加投身于科研工作里。
50美元复刻DeepSeek
2025年2月6日,AI界传来重磅新闻:李飞飞和斯坦福大学的研究团队,用不到50美元的成本,成功训练出名为s1的人工智能推理模型。
翻译:DeepSeek r1令人兴奋,但缺少OpenAI的测试时缩放图,且需要大量数据。
我们推出s1,仅用1000个样本以及一种简单的测试时干预方法,就重现了o1-preview的缩放特性与性能表现。
该模型出炉后迅速被拿来和DeepSeek 作比较,结果显示它在数学和编码能力方面与后者平分秋色。
这消息听起来过于魔幻,很多从业者一开始还表示不相信。
就好比你用买冰棍的钱,买到了一辆豪华跑车,谁听了不觉得惊讶?
但发现这是事实后,大家都在想她到底是怎么做到的?
随着《科创板日报》记者深入调查以及业内人士的解读,事情的真相逐渐浮出水面。
原来,s1模型并非平地起高楼,而是基于阿里云通义千问(Qwen)模型进行监督微调得到的。
此方法相当于是在精装修好的房子里做一些局部调整。
这让许多网友放心了,原来所谓的低成本,是站在巨人的肩膀上才实现。
从李飞飞团队的研究论文来看,s1模型训练只用了1000个样本数据。
按照业内普遍认知,这点数据量在AI训练中实在是少得可怜,根本不足以研发出一个具备推理能力的模型。
中国人工智能界大咖谢伟迪副教授,在仔细看s1的论文后也发现了这个问题。
这1000个样本数据的作用更像是给蛋糕点缀的樱桃,而不是制作蛋糕的主要原料。
这种低成本训练很依赖已有的强大基座模型,要是没有别人给它打地基的话就不行了。
不过,哪怕s1模型的低成本训练备受质疑,但它的研究思路还是有很多可取之处的。
因为AI领域这些年一直在研究的重要项目之一,便是如何高质量、低成本地训练。
李飞飞这次的成功意义不浅,相当于只要有一个国家在AI领域实现技术突破,就很可能会被其他国家低成本复刻。
然而这样的人才却加入了美国国籍,还代表美国与中国竞争,让许多网友心中不忿。
如何看待李飞飞
在美国AI界,像李飞飞这样优秀的华裔科学家还有不少。
比如吴恩达、亚历山大·王、贾扬清等人,都是是AI领域响当当的大神级人物。
对于这些美籍华裔科学家,认可其实力的同时,社会上也存在一些争议观点。
有人觉得他们享受了美国优越的科研资源和环境,取得的成果很大程度上得益于美国提供的平台。
部分人认为,既然他们选择加入美国国籍,就意味着在一定程度上与祖国拉开了距离。
即便他们取得科研成果,那种情感上的隔阂也很难完全消除。
而且越是为美国一些关键技术领域做出贡献,越是给中国科研领域造成压力。
这和我们中国人心中的家国情怀格格不入,更多的人所崇敬的还是钱学森这样的人。
不过换个角度看,他们在国际上取得的成就,提升了华裔群体在科技领域的声誉。
有个很有趣的现象,在中美AI竞赛的某场赛事中,双方竟都是中国面孔。
这种竞争带来的压力,也使得国内AI领域的从业者不敢懈怠,从而屡屡产生新突破。
毕竟中国人骨子里有不服输的精神,这种精神推动着中国AI领域持续发展。
参考信源:2025-02-06 华尔街见闻——成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了
2025-01-28 中国新闻网——Deepseek爆火,英伟达股价暴跌,白宫回应
抖音百科——李飞飞
如果没开源怎么复制
何必蒸溜我家里的De,本来那开源代码是中文,外国人的看懂,这些美奸拿来光宗耀祖?!
吹