成本不到50美元!美华裔院士成功复刻Deepseek,性能比肩顶级模型

健汉这个好的 2025-02-08 14:56:37

文| 实用电脑手机技巧

编辑」实用电脑手机技巧

前言

近日,Deepseek的关注度一直高居不下,而美国那边也是有所行动。

有位美国华裔女院士的团队就对Deepseek展开了一系列的研究,结果还真做出了不小的成绩。

他们居然用不到50美元的成本,就成功复刻了Deepseek,性能更是比肩顶级模型!

这究竟是怎么一回事呢?这位美国华裔女院士到底有何来头?能在这么短时间能就有如此研究成果呢?

Deepseek全球爆火 引发美国关注

Deepseek最近在全球范围内引起了不小的轰动。这个由中国人开发的AI模型,也是吸引住了美国的目光。

说起来,Deepseek的表现确实让人眼前一亮。它在多项测试中都取得了不错的成绩。

Deepseek的开发团队也很有意思。他们大多是来自清华大学、北京大学的年轻人,平均年龄只有27岁。这群年轻人可真不简单,居然能开发出这么厉害的AI模型。

美国人看到Deepseek的表现,也是惊讶不已。他们开始认真研究这个模型,想搞清楚它是怎么做到的。

英国知名媒体还对此进行了针对性的报道,表示Deepseek的出现,打破了美国在AI领域的话语权垄断。

原文刊载于台海网2025-02-07关于“英媒:DeepSeek打破美对AI话语权垄断”

Deepseek的出现确实给AI领域带来了新的活力。它让人们看到,在AI这个领域,中国的创新能力正在不断提升。

Deepseek的成功,也给其他AI研究者带来了启发。有不少人都在想,能不能学习Deepseek的经验,开发出更好的AI模型呢?

就在大家还在讨论Deepseek的成功时,一个更让人惊讶的消息传来。有人居然用50美元就成功复刻了Deepseek?这是怎么回事?他们是如何做到的呢?

50美元成本 Deepseek被成功复刻

近日AI圈子里有个大新闻,美国华裔科学家,花了不到50美元就复刻出了一个跟DeepSeek-R1差不多厉害的AI模型,叫s1。

这群科学家是斯坦福大学和华盛顿大学的研究人员,他们可没从零开始搞。他们用的是阿里云的通义千问模型。

他们用了一个叫s1K的小数据集。这个数据集只有1000个问题和答案,但每一个都是精挑细选的,难度高、种类多、质量好。

更厉害的是,他们还给每个问题的答案后面加了个"推理"过程,就是模型是怎么一步一步想到答案的。有了这个,训练起来就简单多了。

数据推理

并且他们训练的时间也只有半个小时,用了16台英伟达H100 GPU。

训练完了还不算完,他们还给s1模型加了个"预算强制"的功能。就是说,模型回答问题的时候不能想多长时间就多长时间,得在规定时间内完成任务。

这么一搞,s1模型在数学和编程方面的表现,居然跟谷歌的AI不相上下,也就表明,这研究出来的成果是可以媲美顶级模型的。

不过,说到底,这个s1模型能这么厉害,跟领头的那位华裔科学家李飞飞有很大关系。那么,这位李飞飞究竟是何方神圣?她在AI界又有什么样的地位呢?

原文刊载于钱江晚报2025-02-07关于“50美元蒸馏成本,李飞飞团队用阿里云Qwen模型复刻DeepSeek的R1”

华裔科学家李飞飞究竟有何来头?

李飞飞,她可是AI界的大名人。这位华裔科学家的经历可真是精彩。

李飞飞1976年出生在北京,在一个知识分子家庭长大。16岁那年,她跟着父母移民到了美国。

别看她年纪轻轻,可在学习方面是很厉害的。在普林斯顿大学读物理专业,后来又去了加州理工学院,在那儿拿到了电子工程博士学位。

李飞飞在AI领域可是个狠角色。她33岁就成了斯坦福计算机系的终身教授,44岁就当上了美国国家工程院院士。这样的努力与成就,着实令人佩服。

她在计算机视觉这个领域可是个先驱。那会儿这个方向还不怎么热门,她就看准了,一头扎了进去。

她创立了ImageNet,这是个有1500万张图片的数据库,成了AI计算机视觉研究的基础。

李飞飞不光是个学者,还是个创业者。前不久,她创办了一个名为空间智能的公司。

这公司刚成立几个月,就拿到了1亿美元的融资,估值都超过10亿美元了,成了AI界的独角兽。

她还是个投资人。加拿大的一家知名风投公司,李飞飞就是他们的科学合伙人,还给他们投了钱。

有意思的是,这家公司后来又投资了李飞飞的空间智能。这关系,可真是错综复杂。

李飞飞在AI界的影响力可不小。她不仅自己搞研究,还带着一群年轻人一起干。她的团队这次用50美元复刻出s1模型,可真是让人大开眼界。

看到李飞飞的成就,是不是也想知道,还有哪些华裔科学家在AI领域做出了重大贡献?他们的研究又给AI技术带来了哪些突破性进展?

原文刊载于证券时报2024-08-24关于““AI教母”李飞飞,一边创业一边投资”

华裔科学家在AI领域有何贡献?

华裔科学家在AI领域的贡献,那可真是不得了。

吴恩达,这位斯坦福大学的教授可是AI界的大佬。他创立了Coursera,让全世界的人都能学到顶尖的AI课程。他还在百度当过首席科学家,推动了不少AI技术的发展。

还有个叫杨强的,他在迁移学习和联邦学习上可是专家。这些技术听着复杂,其实就是让AI更聪明,能在不同任务间灵活应用知识。

杨强

张亚勤也是个厉害角色。他在微软亚洲研究院干过,后来又去了百度。他在语音识别和自然语言处理方面做出了不少成果。

另外陆奇在雅虎、微软都当过高管,现在创办了自己的AI公司。他对AI在商业应用方面有独到见解。

陆奇

华裔科学家在AI领域可不只是搞研究,他们还积极推动AI技术的商业化。李开复创办的创新工场,就孵化了不少AI创业公司。

这些华裔科学家不仅自己做出了重大贡献,还培养了一大批AI人才。他们在顶尖大学和研究机构任教,指导了无数学生和年轻研究者。

华裔科学家在AI领域的贡献,不仅仅体现在技术创新上,还包括推动AI教育、促进国际合作等方面。他们搭建了中美之间的科技桥梁,推动了全球AI技术的交流与发展。

看看这些华裔科学家的成就,真让人觉得自豪。他们用自己的智慧和努力,在AI这个前沿领域占据了重要位置,为推动人类科技进步做出了巨大贡献。

原文刊载于财联社2025-02-06关于“独家|李飞飞团队“50美元”复刻DeepSeek的R1真相:基于阿里云Qwen模型监督微调而成”

结语

这次美国华裔科学家用不到50美元就复刻出了一个顶级AI模型,真是让人大开眼界。

他们用巧劲儿不用蛮力,证明了只要方法对,不需要大量资源也能搞出厉害的AI。

这个成果不仅展示了华裔科学家的聪明才智,还给AI研究开辟了一条新路子。看来,未来AI的发展,可能会更加注重效率和创新,而不是单纯地堆砌资源了……

免责声明:文章描述过程、图片都来源于网络,此文章旨在倡导社会正能量,无低俗等不良引导。如涉及版权或者人物侵权问题,请及时联系我们,我们将第一时间删除内容!如有事件存疑部分,联系后即刻删除或作出更改。

0 阅读:0

健汉这个好的

简介:感谢大家的关注