9.2高赞,从成都到斯坦福,这华人洗衣妹是如何逆袭成AI教母的?

衷心书院 2024-04-27 07:23:14

这是阿信家一本几乎被所有看过的人一致评价为“出乎预料的好看”的新书。上市不到一周,就在豆瓣上被打出了9.2的高分。作者,李飞飞,在几乎由男性统治的全球科技界,她无疑是其中最富传奇色彩的一位。

李飞飞

而能将自己的个人史,写成一部波澜壮阔、跌宕起伏的人工智能发展史的,除她之外,也几乎很少再有科学家能达到如此级别。

上世纪70年代,李飞飞出生于北京,直到15岁移居美国之前都生活在成都,她的人生旅程对于那一代奔赴美国的华人来说极具代表性。

无论是对AI这个由科技主宰的时代最核心命题感兴趣,还是对她极度贴近我们文化传统的成长史感兴趣,这本由李飞飞亲自撰写的首本自传你都不可错过。

在《我看见的世界》中,李飞飞回忆了自己从底层移民成长到顶尖科学家的经历。

她度过了困顿艰辛的青少年时代,为了生计,她去饭店刷过盘子,在干洗店打过工,而在学校,由于英语不好,长时间甚至连课都听不太懂……

即便如此,李飞飞对科学的热爱却从未减退,她将之奉为人生的“北极星”,并最终走进科学殿堂。

如今,李飞飞不仅是斯坦福大学首位红杉讲席教授、以人为本人工智能研究院(HAI)院长,更是美国国家工程院、美国国家医学院、美国艺术与科学院“三院院士”,被媒体称为“AI教母”。

《我看见的世界》英文版于去年出版,中文版则由中信出版集团年度译者、媒体人、百万级畅销译者赵灿女士翻译。

赵灿在过去十多年中还担任过《史蒂夫· 乔布斯传》《苏世民:我的经验与教训》《纳瓦尔宝典》等经典作品的中文翻译。

一流的作者,一流的翻译,联合为你呈现出这本可读性极佳的《我看见的世界:李飞飞自传》。

这本书既是对重大科学突破幕后的精彩窥探,也是一位女性用好奇心和勇气突破人生困境的故事。

它不仅证明了即使是技术性的学术研究也需要激情,更加表明永不停歇的好奇心可以激发无尽的科技创新。

“我把你教得太好了,飞飞”

李飞飞生于北京,父母都是高级知识分子,爸爸是工程师,妈妈则是一名老师。李飞飞与生俱来的好奇心,某种程度上继承自父亲。

父亲天性散漫,据说在她出生的那天,因为一时兴起跑去公园观鸟忘了时间,而错过了见证女儿出生的重要时刻,招得老婆一顿好骂,名字中的“飞飞”,就来源于这段经历。

李飞飞全家福

飞飞和父亲没有传统父女间的等级关系,他们之间更像同龄人,父亲对大自然的热爱向飞飞展示了最纯粹的好奇心,这些经历在她心中播下了哲学的种子,让她对探索自己视野以外的事物产生了永不满足的渴望。

母亲完全相反,对科学不感兴趣,但热爱文学。她会带着女儿读鲁迅的作品以及波伏娃《第二性》、海明威《老人与海》等西方经典。

父母的共同特点是,他们对功名利禄完全不感兴趣,也从未像很多同事那样通过送礼或请客吃饭的方式讨好上级。李飞飞记得,小学有一次校运动会,老师要求所有人穿白色衬衫,李飞飞爸爸在仔细阅读规则后,把女儿白衬衫上每个纽扣都换成彩虹色。运动会当天,在一片“白色海洋”中,李飞飞尤为显眼。

可想而知,父母的教育理念和学校会产生强烈冲突。因为在期末考试前还痴迷于阅读米兰·昆德拉的《不能承受的生命之轻》,李飞飞被叫了家长。可母亲却将老师的抱怨一句句怼了回去,没有丝毫责怪女儿的意思。回家路上,她对李飞飞无奈地说:“我把你教得太好了,飞飞……你和我一样,都不属于这里。”

和母亲期望的不同,李飞飞最爱的不是文学,而是数学。中学接触到物理后,这又成了她最痴迷的科目,连骑自行车转弯时都思考加速度和角动量的变化。她还对物理学历史上一个又一个伟大人物感兴趣,对阿基米德洗澡时发现浮力定律、牛顿在瘟疫肆虐时躲在家乡写《自然哲学的数学原理》等事件浮想联翩。

李飞飞把头发剪得极短,拒绝穿裙子,全身心投入出乎他人意料的兴趣中,尤其是航空航天科学、高超声速飞机的设计,甚至还有不明飞行物等超自然话题……

“真是张好彩票,可惜浪费了”

为了孩子更好的发展,权衡之下,父母决定带着李飞飞远赴美国。父亲被派去美国打前站,三年之后的1992年,李飞飞和母亲才奔赴美国。在上海转机的间隙,李飞飞坚持要去外滩,因为她听说,1922年,爱因斯坦获得诺贝尔奖的时候,正在这里的“礼查饭店”下榻。

“这恰恰是我需要的心灵遁世。爱因斯坦和上海的渊源对我是个好兆头。我想,一切也许不会太糟糕。毕竟,爱因斯坦也是个移民。”李飞飞写道。

礼查饭店

但幻想,在她们一家踏上美国土地的那一刻就立刻破灭了。

她们的首要难题就是语言,父母几乎不懂英语,父亲在一家华人开的店找到维修相机的工作,每天很晚才下班。母亲在商店找到一份收银员的工作,做重复和机械性的操作,远离了她热爱的文学作品。

日子很难捱。李飞飞的新家位于美国东北部富裕的新泽西州,一家三口挤在只有一间卧室的公寓里,家具是从路边遗弃的垃圾里捡的。为

了补贴家用,每一个不上学的日子,李飞飞都会去打零工。最常见的工作是去中餐馆打杂,每天从上午11点工作到晚上11点,总共12个小时,时薪2美元。在餐馆打杂时,趁着下午换班,李飞飞会利用难得的空隙去读母亲分享给她的文学名著,餐馆经理对此不屑一顾。“他觉得对我们这样的人来说,想象力在生活中是多余的”,李飞飞回忆称。

对这些连英语都不会说的华裔移民来说,阶层跃迁是个遥不可及的梦。

李飞飞在高中门口

曾经引以为傲的学业也变成负担。李飞飞几乎不会说英语,每一节课,无论什么科目,对她而言都是英语课。每天回家做作业,她都要准备两本词典,一本英译中,一本中译英,否则就写不了作业。

自我表达成了一种奢望。“不会说话”的李飞飞交不到朋友,成绩也一落千丈——考试的时候,很多时候她连题目都看不懂。幸运的是,数学和物理两门课受到的影响很小。学习它们,更多依赖数字、符号和公式。李飞飞对数学和物理的狂热也没有随着移民到美国而改变。

尽管学习的时间少得可怜,但李飞飞还是考出了SAT1250,数学满分的成绩。和如今成绩优秀的华裔小孩一口气申请十多所名校的做法不同,李飞飞只申请了三所大学,麻省理工、 普林斯顿、和新泽西州立罗格斯大学。这显示出了李飞飞的自信和决心:要么去最好的、自己最想上的,要么上个“普通”州大。

高中毕业时本地报纸对李飞飞的报道最终,三所学校都发出了录取通知,普林斯顿大学更是开出了全额奖学金。

在《我看见的世界》中,李飞飞还抹去了一个细节,她读本科时曾在1200多名竞争对手中脱颖而出,成为那一届学生中唯一拿到普林斯顿一年一度的Martin Dale奖学金的人。

李飞飞要去普林斯顿读书的消息,让整个社区都沸腾了,但让人略感遗憾的是,李飞飞没有选择医学、金融这种能通向富裕阶层的敲门砖专业,而是选择了自己痴迷的——物理。“真是张好彩票,可惜浪费了。”邻居们无法理解。

“直到ImageNet出现,一切才变得切实可行起来”

90年代末,的计算机热下,另一个问题引起了李飞飞的注意:机器可以掌握人类的智慧吗?李飞飞就此关注到了人工智能领域。

但当时正值“AI寒冬”,整个领域停滞不前,缺乏突破,很难获得研究资金。这个时候入行,显然不是好时机,李飞飞不在乎这些。

李飞飞从普林斯顿毕业时的毕业照

教机器像人一样识别图片中的物体,是人工智能研究领域一直都希望攻克的一项重大难题。

而这也是李飞飞最重要的贡献——创建了数据库ImageNet,有人工智能领域的从业者评论,“没有ImageNet,就没有现在的深度学习革命”,李飞飞也因此被誉为“AI教母”。

但在起步之处,李飞飞ImageNet的想法就遭到了几乎所有人的一致反对。“我听到的劝阻之声已经多得够我用一辈子了(可能下辈子也够了)。”李飞飞说。最后她终于遇到了第一位支持者,李凯教授是微处理器架构领域的领军人物。

微处理器架构是一门将数百万纳米级晶体管排列到世界上最复杂的设备中的艺术,因此他比大多数人都更了解指数思维的力量。他相信李飞飞的方向是正确的。

他毫不犹豫地为李飞飞的研究捐赠了一套工作站,解决了项目亟需的算力问题。

李凯有一个极聪明的一年级研究生叫邓嘉,他要给邓嘉找个新导师。于是,李飞飞和他便组成了一个两人团队,开启了这个似乎需要成千上万甚至更多贡献者的项目。

大多数同事对李飞飞的假设都不屑一顾。单从理论上讲,这一切确实说不通,但这是她人生中第一次感受到一种毋庸置疑的自信。无论需要多长时间,李飞飞都确信她们正在做一件大事,一件也许具有历史意义的大事。

李飞飞确定了一个目标,为每个物品类别搜集1000张不同的照片:1000张不同的小提琴照片、1000张不同的德国牧羊犬照片、1000张不同的抱枕照片,直到涵盖全部2.2万个类别,也就是一共需要大约2000万张图片。

但即便是这个数字,也只是最终成品数据库的情况。她们可能需要从数亿张照片,甚至10亿张照片中筛选,才能达到目标。

“我从理论上能理解,但这个工作量也太大了,属于天文数字,可不是谷歌搜索几次就能完成的。”邓嘉面露疑色。

按照既定的速度,ImageNet的完工需要整整19年的时间。

这么久以来,李飞飞第一次不知道接下来该怎么办了。更重要的是,此时,她的“师爷”吉滕德拉也站在反对者的一边,让她深受打击。“我几乎可以看到我的北极星在逐渐暗淡下来,我的道路又陷入了黑暗之中。

一个可怕的想法开始在我心头升起:我承担的风险比我意识到的更大,而现在回头已经为时太晚。”李飞飞回忆。

然而,一切都还没有结束。在一位叫孙民的研究生的建议下,李飞飞知道了亚马逊开发的土耳其机器人。

正是这款机器人它把我们起初的大学生标注员队伍变成了一个由数十人、数百人、数千人组成的国际团队。随着我们获得的支持不断扩大,邓嘉给出的预计完成时间急剧缩短,先是15年,然后是10年、5年、2年,最后不到1年。

但资金需求,也逼近团队所能负担的极限,2009年,李飞飞决定跳槽去斯坦福,这里为她的研究提供了新的研究资金。到2009年6月,ImageNet的初始版本终于完成:收集了1500万张图片,涵盖了2.2万个不同类别。这些图片筛选自近10亿张候选图片,并由来自167个国家的4.8万多名全球贡献者进行了标注。

ImageNet不仅在规模和多样性上达到了李飞飞多年来梦寐以求的水平,还保持了一致的精确度:每张图片都经过了手工标注,并在层次结构中进行了组织,经过了三重验证。

从数量上看,李飞飞已经实现了既定目标,建立起了当时人工智能史上最大的人工编辑数据集。

“我们的研究大胆且具有前瞻性,虽然并不完备,但能引发思考,其中很多在概念上也很简单。但直到ImageNet出现,一切才变得切实可行起来。”李飞飞说。

李飞飞的辛勤付出让机器具备像人一样“看”的能力,历史上第一次变成现实。更重要的是,她用大数据训练多层神经网络的想法,从图像扩展到语音、文字、视频等其他领域,引爆了持续到现在的AI革命。

以美国东北部的臭水沟为起点,李飞飞开启了迈向星辰和大海的征途。

2024年2月,芯片巨头英伟达宣布成立一个新研究部门,通用具身智能体研究实验室。该实验室的领导者是两位华人90后博士:范麟熙和朱玉可。

他们有一个共同的导师,李飞飞。

生在北京,长于四川,又从中国到美国,由物理专业到人工智能领域,靠着其坚强、疯狂与热爱,李飞飞,完成了从一个洗衣妹跨进AI这场科技革命中心的转变。

0 阅读:0

衷心书院

简介:感谢大家的关注