AI博士NeurIPS现场崩溃后悔读博,五年前高薪又自由,成如今沮丧

烟雨江南情长 2025-01-18 17:46:47

【导读】在NeurIPS上,NYU计算机教授看到了一群沮丧和焦虑的博士。AI读博的红利已经消失,五年前那种毕业即被疯抢、高薪又自由的好日子,已经彻底没了。没赶上好时代的博士们,只能一声长叹。

前不久,UC伯克利CS本科生毕业即失业的故事,曾引起坊间热议。

没想到,CS博士生的日子也并不好过?

最近,NYU计算机和数据科学教授Kyunghyun Cho的一篇博客,成为圈内热议的话题。

这篇博客的题目十分触目惊心:《我在NeurIPS’24上感受到了焦虑和挫败》。

他表示,在NeurIPS 2024上非常突出的一件事,就是高年级博士生和博士后表现出的焦虑和沮丧。

如今的就业市场,跟五年前他们开始攻读博士学位时,已经有了很大不同,很多人都找不到合适的工作。

曾经第一代幸运的博士(包括教授本人)之所以成功,更多是因为运气好。

但如今,博士学位的种种红利和必要性很快就要消失了,本科生和硕士生就完全足够进行AI研究,完成企业所需的标准化机器学习开发技能。

而随着AI技术的产品化,企业更需要的是支持产品迭代的工程师,而非AI博士。

总之,AI人才培养体系已被破坏,公司并不需要那么多博士——他们已经被排除在AI人才培养体系这次大规模重组之外。

谷歌DeepMind的研究科学家Sander Dieleman表示,情况完全属实,因为如今学生毕业后进入的就业市场,与曾经完全不同。

毕竟在自己的博士生涯年代,可是发生了ImageNet时刻。

有人现身说法表示,没错,自己就是这样的倒霉蛋之一。

今年刚加入英伟达的高级软件工程师Duong Hoang称,自己为了攻读博士学位,并没有在2010年代加入这些科技大厂,相当于是直接放弃了数百万美元的收入。

博士的就业市场竞争如此激烈,也是因为薪水太高,但HC太少。

这种现象可以用一个名词来概括——「精英生产过剩」。

的确,机器学习的工作没有消失,只是从机器学习研究转向了机器学习工程而已。

因为大多数企业的机器学习问题,都可以通过现成的工具来解决,公司并不需要学者,优秀的程序员足矣。解决方案的价值跟学历无关。

而如今市场对LLM的痴迷,只是硅谷的又一个炒作周期而已。几年后流行的可能就是不同的东西。

总结来说就是:十年前,行业挑选了少量的AI博士生,来应对即将爆发的AI革命。高薪让博士生申请者如飞蛾扑火般涌入,LLM的价值火速被证明。

随后,本科生和硕士生也被训练出来,对企业来说已经够用了。博士生们只能含泪退出。

教授博客全文

Kyunghyun Cho的博客全文如下——

上周在NeurIPS 2024会议上有一个非常突出的现象,那就是即将毕业的博士生和博士后们表现出了强烈的焦虑和沮丧。

如今的就业市场令他们感到困惑,因为市场的样貌和感受与五年前他们申请博士项目时的预期大相径庭。而且,这些博士生和博士后中,有一些还是我亲自指导的。

这让我开始反思AI研究和发展的现状,以及过去的演变。

最初的时候

过去十年左右,对机器学习或更广泛的AI领域来说,是一个非常有趣的时期。

从大约2010年的语音识别开始,深度学习在许多具有挑战性且实用的问题上(如目标识别和机器翻译),相较于当时的技术水平有了显著提升。

到了2014年,很明显,一场重大变革正在发生。每一家大公司,无论是科技公司还是非科技公司,都希望自己能参与这场持续的革命,并且从中受益。

由于深度学习在很长一段时间里都不是主流,因此几乎没有本科课程会认真教授相关的基本概念和技术。

事实上,在当时的许多机器学习和AI课程中,人工神经网络仅仅是被简单提及而已。

这就导致了深度学习人才供需之间极大的不平衡,迫使那些比其他公司更早看到这场革命的公司,从全球为数不多的实验室中积极招募博士生。

由于当时全球只有少数实验室在认真研究深度学习,所以这些它们的毕业生甚至教授会被疯抢。

因此,拥有人工神经网络经验和专业知识的博士生薪酬自然水涨船高,进一步拉大了AI领域内此方向上学术界与产业界的薪酬差距,大学想要招聘此类人才教育学生,也就更加困难。

在2010年到2015年获得博士学位、研究人工神经网络、成为大学终身教职的人极少,我就是为数不多的其中之一。

这就导致了人才供应的增长大大延迟,同时需求却仍在飙升。

由此还带来了一个有趣的副作用:即使招聘的人才无法直接带来显著的经济效益和利润增长,公司也依然愿意雇佣他们。

之所以如此,是因为公司已经提前看到了即将到来的AI革命,它即将改变所有业务。

因此,当时被雇用的许多博士生非常自由,可以随意选择自己想研究的主题、发想发的paper。

本质上来说,这就像一份学术研究职位,但却有高达2到5倍的薪酬,以及更高的知名度!而且,还没有教学任务、行政负担,也没有申请项目的压力。

总之就是两个字——完美!

当时的大学生、高中生,甚至是初中生,也都看到了这一点:只要研究与AI相关,就能获得高薪、优渥福利,还能随意选择研究课题。

既然这些几乎仅限在人工神经网络发过学术论文的博士生,那自然就有大量博士申请者涌入,争相成为如今的AI博士。

不过尽管申请者激增,并不意味着最终会有大量博士生,因为限制因素是导师的数量。

在15年之前,只有少数实验室在研究人工神经网络,但到了2016年,许多教授都把自己实验室转型成了深度学习实验室,并且招收大量博士生扩展实验室规模。

看起来,似乎我们已经建起了一个优秀的AI人才培养体系。

大量优秀学生申请博士项目,大量从事AI研究的教授接收、培养这些学生,使他们成为下一代博士。少数大型科技公司和机构,以难以想象的优厚薪酬和研究自由来吸引他们。

然而,这种模式并不可持续。事后看来,这一点是显而易见的。

变革的开始

要让这种模式持续下去,唯一的办法是让深度学习继续成为能够在五年内彻底变革工业(甚至整个社会)的技术,并且每年都必须是「未来五年」。

如前所述,公司之所以招聘这些人才,并投资于他们的研究环境,是基于对未来不可避免变革的预期。换句话说,这种培养体系的延续,取决于他们所准备的那个未来。

第一代幸运的博士(当然也包括我)进入这一领域,选择的原因并不是出于职业前景,而更多是因为运气。

随后,我们开始有一批更加聪明、目标明确的博士生从事深度学习研究。这些人极其有动力不是靠运气而是凭借才能和热情被选中,因此他们取得了更快、更显著的进展。

不久之后,这些进展就开始转化为实际产品。特别是以可对话的LLM为代表的大模型,开始证明这些产品确实是革命性的,既能改变未来,也能在当下创造经济价值。

换句话说,这些新一代的优秀博士生通过将深度学习产品化(例如LLM及其变体),成功地将未来带到了现在。

产品化意味着很多事情,但有两个方面尤为重要:

- 首先,产品化需要在开发和部署过程中,实现某种程度的标准化。

然而,这种过程标准化与科学研究是背道而驰的。

我们不需要持续不断的创造性和颠覆性创新,而是基于标准化流程的渐进式、稳定的改进。而博士生在这一点上表现得很差,因为这与博士项目的培养目标完全相悖。

博士生的任务是提出创新性的想法,通过理论或实证验证这些想法,将研究结果写成论文,向学术界报告,然后继续进行下一步研究。

一旦研究成果被转化成实际的产品,我们就不能简单地「继续前进」,而是需要持续支持和维护它

于是,随着一套完善的流程的建立,对博士学位的需求会迅速下降。

- 其次,产品化为收入创造了一条清晰且具体的路径。

这对那些投资招聘了这些优秀人才,并为其提供资源以便在公司内部而非其他地方进行创新的企业来说,是件好事。

然而,一旦出现了明确的盈利方向(最终目标是实现利润),研究人员想要继续要求完全的研究自由,就变得越来越困难。

许多人会被要求直接为产品做出贡献,并证明他们薪酬和岗位的合理性,只有少数人能够继续享有研究自由。

这很正常,同时也解释了为什么在大多数组织(包括盈利性、非盈利性和政府机构)中,研究团队通常比产品团队规模更小,资源更少。

此外,在过去几年中,大学在一定程度上赶上了需求,开始教育和培养本科生和硕士生,使他们掌握这些新技术的基础知识和实践理念。

他们不仅知道如何训练、测试和部署这些模型,还了解其背后的理论理念。更重要的是,他们通常比博士生更谦逊,也更愿意接受新事物。

这些因素,共同彻底打破了前文所述的AI人才培养梯队。

不需要那么多博士了

公司不再需要像以前那么多博士生,因为他们可以直接招聘本科生或硕士生,他们能按标准化流程,理解为AI产品走出贡献。

学生也并不需要进入博士项目来学习必要技能,在大学的本科课程中就能学到。

当前这一批博士生,当初就是冲着良好的职业前景选择读博,如今却在这场AI人才培养体系的大重组中,被彻底边缘化。

于是,不出所料的,这些接近博士项目尾声的学生会感到极度焦虑和沮丧。

他们曾仰慕我们这一代人(虽然我们还算年轻且资历尚浅,但在这个领域可能已经算是资历较深的一批),并认为只要他们的博士学位与机器学习及相关领域有关联,他们就能像我们一样,成为在大科技公司中享有高度研究自由、薪资丰厚的研究科学家。

然而,在他们看来,求职市场突然要求他们专注于一个更狭窄的领域——LLM及其变体——并展示自己的创新能力,同时直接为基于大规模模型开发的产品贡献力量。

如果不愿意参与大规模语言模型的产品化工作,那么可供选择的机会将少之又少,而这些岗位正在迅速减少。

尽管如此,这也并不意味着大模型之外的AI研究课题就不重要或不被需要。

例如,Prescient Design就一直在持续招聘专注于不确定性量化、因果机器学习、几何深度学习、计算机视觉等领域的博士级研究科学家,因为这些领域的研究与开发与他们所做的工作(lab-in-the-loop)直接相关。

大模型只是近年来备受关注的一个特定的AI子领域。这些大模型取得的进展和突破确实让人感到无比兴奋,但它们并不是唯一值得关注和投资的领域。

然而,这种对大规模语言模型及其变体的极度关注很容易让我们,尤其是那些仍在学业中的学生,甚至是所谓精英大学的教职人员,变得盲目。

无论合理与否,被关注都会带来更多的机会,如果学生没有发表或正在写有关大模型的论文,他们感到焦虑是很自然的,因为这些机会与他们无缘。

这样看来,我在NeurIPS 2024上从博士和博士后们那里感受到的强烈沮丧和焦虑,就完全可以理解了。

他们中的一些人可能感觉自己被「背刺」了,因为他们曾被承诺的前景与现实之间的差距正在迅速扩大。

有些人可能会感到无助,因为他们选择的研究课题和工作似乎不再受到这些公司的欢迎。

有些人可能会感到挫败,因为本科生或硕士生似乎在训练和部署这些大规模模型方面更为熟练,并且看起来比他们更有价值。

不幸的是,我只能部分理解这些极其聪明的学生所感受到的焦虑和沮丧的根源,却想不出办法来缓解这种沮丧。

毕竟,看起来我可能在无意中极大地促成了这种让他们对职业和未来感到沮丧和焦虑的局面。

抱歉!

0 阅读:0