2月19日消息,AI初创公司“月之暗面”于近期完成了新一轮融资,金额超10亿美元(当前约合72亿人民币),投资方都是中国头部企业,包括红杉中国、小红书、美团、阿里等。这也是自ChatGPT爆火以来,国内AI大模型公司迄今获得的单轮最大金额融资。
月之暗面(Moonshot AI)成立于2023年3月,刚成立的2023年就已获得了超2亿美元(约合14亿人民币)融资,投资方包括红杉中国、真格基金等。在本轮融资后,月之暗面估值已达约25亿美元(约合180亿元人民币),为国内大模型领域的头部企业之一。
这样高的估值、融资,除了得益于AI大模型热之外,离不开创始团队。
据公开资料显示,公司核心成员多出身清华系,创始团队核心成员参与了 Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。
据公开信息来看,联合创始核心团队主要有5人。
首先是主要创始人兼CEO,杨植麟(持股78.96%),清华大学交叉信息研究院助理教授,今年32岁。在高中时,毫无编程经验的杨植麟通过选拔参加奥赛,并成功拿到清华入场券。受到保送限制,最开始杨植麟并非学计算机,直到大二才转入计算机系师从IEEE Fellow唐杰。2015年,以年级第一的优异成绩从清华大学计算机系毕业。
随后杨植麟又进入卡内基梅隆大学计算机学院(美国第一计算机学院)学习。2019年,在苹果AI研究总监Ruslan Salakhutdinov 和谷歌首席科学家William W. Cohen的指导下,获得博士学位。一般来说,卡内基梅隆大学计算机专业的博士生往往要经过6年才能毕业,而他仅用了4年。
在读博期间,2018年,杨植麟还作为第一作者,与图灵奖得主杨乐昆合作发表了论文“GLoMo: Unsupervised Learning of Transferable Relational Graphs” ;
论文下载:
https://proceedings.neurips.cc/paper_files/paper/2018/file/5dbc8390f17e019d300d5a162c3ce3bc-Paper.pdf
与图灵奖得主约书亚·本吉奥(Yoshua Bengio)合作发表论文“HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering”。
论文下载:https://arxiv.org/pdf/1809.09600.pdf
2019年又作为第一作者,与谷歌、卡内基梅隆大学联合发表:XLNet: Generalized Autoregressive Pretraining for Language Understanding。以及:Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context两篇论文。
论文链接:
https://proceedings.neurips.cc/paper/2019/file/dc6a7e655d7e5840e66733e9ee67cc69-Paper.pdf
论文下载:https://arxiv.org/pdf/1901.02860v1.pdf
其中Transformer-XL成为首个全面超越RNN 的注意力语言模型,论文成为NeurIPS 2019与ACL 2019的最高引论文之一。XLNet则在20项任务上超越谷歌BERT模型。
同时入选了2019年度北京智源青年科学家。2020年11月,荣登“2020福布斯中国30岁以下精英榜”。2022年4月,入选AI华人青年学者榜单。
在美国期间,杨植麟还曾在Meta AI和Google Brain工作,分别与Meta AI研究科学家Jason Weston和 Google Brain的创始成员Quoc V. Le一起工作。
天才总是善于突破。杨植麟曾这样说:“我想有一条更激进、更彻底的路径去打破学术界与工业界的壁垒。”
早在博二时(2016 年),杨植麟就开始了第一次创业,创立了循环智能(Recurrent AI)。2019年杨植麟毕业回国,回到母校清华大学任交叉信息研究院助理教授的同时,还继续统领着循环智能,负责纯算法研发。2021年,循环智能还与华为云合作开发了千亿级NLP大模型盘古大模型,涉及NLP、CV 等多个方向。
虽然杨植麟长期都顶着天才的光环,但在也并非一帆风顺。杨植麟的论文Transformer-XL也曾一度被ICLR 2019拒绝,理由是评审不认为大语言模型的提升在实际场景会有更多的价值。但杨植麟始终坚信自己已经看到AI的第一性原理。
回国后,杨植麟也一直试图整合重新组建一家相关AI公司,自己团队提供技术,对方提供算力等资源,但一直受限。随着ChatGPT的爆火,也让杨植麟看到了机会,他独自去海外考察了两个月,让他坚信,在亚洲做一个大模型公司,有机会了。
2023年3月1日正式成立,至于公司为何叫“月之暗面”。杨植麟本人曾透露,在学生时代组过乐队,在他看来摇滚精神与技术创业相通。公司成立之时也正好是英国摇滚乐队Pink Floyd专辑The Dark Side of the Moon发行50周年。同时“月之暗面”还意味着神秘,令人好奇和向往,但登月又是一件难度很大很有挑战的事情。
公司创始团队除杨植麟外,还有两位联合创始人,周昕宇、吴育昕,也都是清华毕业的同学。
其中,周昕宇持有公司10%股份为第二股东。周昕宇是一位风险喜好者,对于他来说挑战越大就越兴奋。大三快结束时,是就业还是读书,最终选择了工作。大四时,周昕宇加入了人工智能产品和解决方案公司旷视科技实习,并在毕业之后正式加入,工作内容是算法量产。在刚加入旷视之后,他做了很多工作,别人觉得他做得很杂,但在他的逻辑体系里是统一的,那就是为了提高生产力这个目的。
周昕宇曾说:“搞深度学习做的90%的事情可能都是在试错,因为本质上我们做技术是在和天斗。”
工作期间,他还与旷视研究院基础科研负责人张祥雨,携手研究了移动端模型,并共同撰写了ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices,中标CVPR。后来还影响了包括苹果3D人脸解锁在内的各种手机毫秒级人脸解锁技术。
吴育昕作为持股5.96%的第三大股东,和杨植麟基本上是相同的人生轨迹,他们都毕业于清华与卡内基梅隆,也都曾在Google Brain(从事基础模型)和Meta AI(计算机视觉)工作,是Meta人工智能实验室FAIR团队的一员。
在FAIR的作品曾获得ECCV 2018 的最佳论文荣誉奖、CVPR 2020的最佳论文提名以及 ICCV 2021的Mark Everingham奖。还创建了Meta AI最受欢迎的项目之一detectorron2,被广泛使用的视觉开源项目并被集成到Meta全线VR/AR产品中。
2018年10月的GeekPwn国际安全极客大赛上,IYSWIM是6个参赛团队中,唯一一个破解人脸识别算法的团队。吴育昕当时以IYSWIM团队的身份参赛,据他介绍,“自己(以个人名义报名参赛,有名队友没有来到现场)用了谷歌的FaceNet开源代码模型攻破了该算法”。
和杨植麟同样师从唐杰教授的张宇韬,持股5%。此前还与杨植麟一起创建了循环智能。据悉,张宇韬本硕均在清华大学计算机系就读。是清华大学数据科学研究院科技大数据研究中心首席研究员。研究方向为异构数据融合及知识图谱构建。在KDD、CIKM、VAST等数据挖掘领域国际重要会议上发表多篇论文。
曾作为核心开发者研发了全球知名的科技大数据分析平台AMiner,产品服务于BATH等科技巨头及国家科技部等政府科研管理机构。曾获得北京市科学技术一等奖、吴文俊人工智能技术进步一等奖,阿里巴巴天池大数据竞赛全球第二名。
除了清华四人组之外,在月之暗面股东名单中还有一位毕业于复旦大学计算机科学系的汪箴。从复旦毕业后,又就前往新加坡南洋理工大学计算机工程系就读。他有着二十年软件开发工作经验,目前主要研究工作面向 AI 在鉴证科学上的应用。
据悉,汪箴曾在谷歌担任高级软件工程师/技术主管,iHealth Labs 系统架构师,iSeed Ventures 副总裁以及新加坡政府科技局 Smart Nation Fellow/杰出工程师。同时也是新加坡AI技术驱动独角兽领创集团(ADVANCE.AI)首席技术官。此前还有过投资机构的从业经历。
除了这四位主要核心人员外,月之暗面还吸纳了大量参与过Google Gemini、Google Bard盘古NLP、悟道等多个大模型的研发人才。在2023年10月有50人左右,目前团队人数已超80人。
虽然团队人数不多,但在公司成立几个月后,2023年10月就推出全球首个支持输入20万汉字的智能助手产品Kimi。核心特色是,相较市面上以英文为基础训练的大模型服务,Kimi Chat具备较强的多语言能力,20万汉字的输入在中文上也更具备优势。
当前,月之暗面正研发通用多模态模型,预计年内推出。对现在的大模型创业公司而言,多模态模型确实是核心竞争点。尤其是OpenAI 首个AI 视频模型Sora的发布,再次给一一赛道添了一把火。但相较于文本,图像、视频等多模态模型训练成本均更高,需要的资金和人才也更多,月之暗面再次融资,或许也是为此在做准备。