Sora背后团队:应届生扛大旗,00后在列,13人爆肝一年轰动全世界

趣唠科技不打烊 2024-02-22 08:45:50

文丨Congerry

11个人能做出什么,13个人又能做出什么?

答案分别是Midjourney和Sora。

当 Midjourney 给这个世界带来一点点震撼时,事实是这款火爆全球的文生图工具就是由11个人创造的。(11个人撬动了14500000人的生活!Midjourney证明,成功不拘于人数和融资)

成立之初,Midjourney 的创始人David Holz 为 Midjourney设立了一个宗旨:AI不是现实世界的复刻,而是人类想象力的延伸。

现在,Sora 继承了这种延伸,而且是在文生视频领域,一点点震撼也变成了“亿点点”。

,时长00:19

这样一项令人震惊的工作,主要是由13个人完成的,包括应届博士毕业生和 00 后成员。其中,Tim Brooks和Bill Peebles都是伯克利AI研究中心的博士毕业生,也是Sora项目的共同领导人。

2023年,Tim Brooks 在加州大学伯克利分校(UC Berkeley)获得了博士学位,他的博士导师是 Alyosha Efros。

在伯克利期间,他发明了 InstructPix2Pix ,这种技术可以根据图像编辑指令生成图像。

在加入 OpenAI 之前,Tim Brooks 在谷歌工作,参与了 Pixel 手机相机的AI技术的开发。此外,他还曾在英伟达(NVIDIA)研究视频生成模型。

在 OpenAI,他是文生图模型 DALL·E 的主要研究员之一。

2023年1月,OpenAI 启动 Sora 项目,Tim Brooks 成为OpenAI 第一位从事 Sora 研究的员工,领导模型的研究方向和培训工作。

Bill Peebles 与 Tim Brooks师出同门 ,也是在2023年刚刚获得加州大学伯克利分校(UC Berkeley)博士学位。

在伯克利期间,Bill Peebles 的研究成果多次入选SIGGRAPH、ICCV、CVPR等学术会议。

Bill Peebles 本科毕业于麻省理工学院(MIT),师从Antonio Torralba,主修计算机科学。

在麻省理工学院期间,他参与了GAN(生成对抗网络)和text2video的研究,并在Adobe和英伟达有过实习经历。

在加入OpenAI之前,Bill Peebles 在Meta(前Facebook)进行了为期半年的实习,期间与谢赛宁合作发表了DiT模型,该模型首次将Transformer与扩散模型结合在一起,对Sora项目产生了重要影响。

谢赛宁也曾猜测,Sora的实现技术基于他们的扩散Transformer模型(DiT)。

谢赛宁此前在朋友圈辟谣了自己是Sora作者之一的消息时透露,Sora是Bill他们在OpenAI的呕心沥血之作,“虽然不知道细节,但他们每天基本不睡觉高强度工作了一年”。

Aditya Ramesh 是 DALL-E 的创造者之一,他主导了 DALL-E 的三代研究,并在这三个版本的论文中担任共同第一作者。

Aditya Ramesh 在纽约大学完成了本科学习,并在 Yann LeCun 的实验室参与了一些项目。尽管他原本计划继续深造,但在 OpenAI 的暑期实习期间表现出色,最终被留了下来,成为了正式的研究人员。

Connor Holmes 是 Sora的系统负责人,毕业于科罗拉多矿业大学,电气电子工程学士、高性能计算博士。

2023年12月,Connor 加入了 OpenAI,并迅速参与到了 Sora 和 DALL·E 3 等重要项目中。

Will DePue 拥有密歇根大学计算机科学学士学位,并在 UCLA 的 Geffen Academy 以荣誉毕业生身份毕业。目前在 OpenAI 担任全职技术团队成员,专注于开发 Sora。

在此之前,他在 OpenAI 的居民项目中工作了7个月,参与了应用研究项目,包括模型能力评估和API微调等。

他还曾在非营利组织 InternetActivism.org 担任工程领导,在 Commsor 公司,担任软件工程师,期间创立了 DeepResearch 并成功将其出售。

值得一提的是,Will DePue 是一位“00”后。(年少有为)

不仅仅是00后,Sora团队中,也不乏华人身影。

关于Yufei Guo的具体信息在公开资料中相对较少。根据现有的信息,我们知道他是OpenAI Sora团队的一员,但关于他的教育背景、研究领域或在团队中的具体角色等详细信息并未公开。

不过在OpenAI GPT-4和DELL·3论文中,都有他的名字。

Li Jing,拥有北京大学物理系本科和MIT物理学博士学位。

此前,Li Jing 在Meta工作了两年,于2022年10月加入OpenAI从事研究工作,包括多模态学习和生成模型。也曾经参与DALL·E 3开发。

Ricky Wang,毕业于加州大学伯克利分校,今年一月从Meta/Instagram跳槽到OpenAI。此前在Meta和ins任职软件工程师及工程经理。

David Schnurr 在加州大学圣塔芭拉分校获得了计算机科学学士学位,自 2020 年 7 月起在 OpenAI 工作,至今已经 3 年 8 个月。在 OpenAI,他参与了 API、DALL·E 和 ChatGPT 等项目。

在此之前,他在 Uber 担任高级软件工程师,主要负责 Uber Movement、Base Web 和 Visualization。更早之前,他在 Graphiq Inc.(后被亚马逊收购)担任工程总监,期间他的团队创建了 Graphiq 的可视化平台,该平台现在为亚马逊 Alexa 设备提供支持。

Joe Taylor 目前担任 Sora 团队的早期研究产品负责人,工作重点是进行早期研究,帮助加速研究进程,构建产品直觉和方向,并从零开始构建工程系统。

在加入 OpenAI 之前,Joe Taylor 在 Stripe 担任软件工程师,负责 Sora 团队的工作,以及在 Twitter 的 Periscope.tv 担任高级工程师。

他还曾在 Square 担任前端工程师,并在 Square Cash(Cash App)的启动团队中进行了基础工作。

剩下的三位成员 Eric Luhman 、Troy Luhman以及Clarence Wing Yin Ng的信息在公开资料中较少。

Eric Luhman

一位名为Troy Luhman X网友曾转发Sam Altman的推文。

Clarence Wing Yin Ng(不确定是否为同一人)曾和其他发明人共同申请涵盖分布式数据库管理系统、数据库表分区的备份和恢复、以及数据库分区的分割和移动调度等领域的专利,并由亚马逊技术公司持有。

0 阅读:0

趣唠科技不打烊

简介:感谢大家的关注