《我看见的世界》作者:李飞飞
2018年6月26日,对很多人来说,不过是普通的一天,但是,在大洋彼岸的华盛顿特区,这一天,对一位华裔女科学家而言,是那么的不同寻常。
这天,她怀着紧张不安的心情,匆匆前往美国国会大厦,去参加一场庄严肃穆的听证会。她要在美国众议院科学、太空和技术委员会,就“人工智能”的话题做证,并阐明自己的观点。前一天,在从美国西海岸飞往华盛顿的红眼航班上,她几乎一夜未眠,一遍又一遍地演练着自己的发言。
到达会议现场,她进入证人席,在写有自己名字的席位前坐了下来。在一片沉寂中,她感到肾上腺素飙升,传遍了全身。她深深吸了几口气,努力让自己保持平静。作为人工智能领域的前沿专家,今天,在这样重要的场合中,她到底要阐明什么观点呢?
思来想去,她决定把焦虑抛到脑后,毫无保留地分享,自己在这个行业的希望与恐惧,信念和摇摆。她决定坦然告诉公众,人类文明正处在一场科技革命的风口浪尖。这场革命已经改变并将重塑着我们的生活方式。要想安全、公平且可持续地利用这场变革的力量,光靠科学本身还远远不够。如果仅仅追求颠覆却不考虑可能导致的后果,就会犯下不可弥补的错误。
简而言之,在即将开始的听证会上,她要告诉世人的是:人工智能必须明确以人为本,必须尊重全球社会的集体尊严。
这位令人尊敬的华裔女科学家,名叫李飞飞,早年随父母从成都移民美国。1995年,她以全额奖学金被普林斯顿大学物理学专业录取。求学10年后,她获得加州理工学院电气工程博士学位,确定了自己在计算机视觉领域的使命,创建了ImageNet项目,这是一个包含1500万张图片的大型图片数据库。项目做成后,起初没有被业内重视,但最终成为现代人工智能的关键催化剂。2020年到2021年,李飞飞当选美国国家工程院、国家医学院和艺术与科学院三院院士,并入选《时代》杂志“百大AI影响力人物”。
那么这位上世纪80年代成都出来的平民女孩,是怎么在异国他乡披荆斩棘,成长为世界顶尖科学家的呢?这一路的艰辛不易,李飞飞都浓缩在了她的自传《我看见的世界》这本书里。而且,值得一提的是,这本书不仅是李飞飞勇往直前,创造不凡人生的励志成长史。也是一部翔实壮阔的现代人工智能发展史。
那么,接下来,就让我们一起翻开这本书,来看看李飞飞这一路跌宕起伏的传奇经历,以及在这个过程中波澜壮阔的科技发展。
远赴重洋,困境中渐渐崛起
20世纪80年代,李飞飞的童年在成都度过,她的父亲在化工厂的计算机部门工作,母亲原是高中老师,后来成为办公室职员。家人自小教育李飞飞,要努力学习,充分发挥自己的潜力。
上初中后,李飞飞对物理学表现出了浓厚的兴趣。1992年,她跟随父母移居美国,在新泽西州一个叫帕西帕尼的郊区小镇安家,随后进入帕西帕尼高中读书。
初到异国,陌生的语言环境和截然不同的文化氛围,给十几岁的李飞飞带来了很大的内心冲击。即使是最简单的家庭作业,她也需要几个小时才能完成,几乎每一步都要求助词典,这让她感到很沮丧。
她的父母也很忙碌,父亲在一家台湾商人的店里找了份修理相机的工作,母亲在礼品店当收银员,两人下班都很晚,收入微薄,仅够维持生计。
为了补贴家用,课余时间的李飞飞也开始打工。她通过报纸上的分类广告,找各种兼职来做,有时去中餐馆当服务生,有时去给别人做家务,还帮人遛过狗。尽管兼职挣的钱很少,但也能适当改善一些家里的生活。渐渐的,家里终于可以每个月存下一点钱,去商店买东西时,也不用那么在意价格了。
这个新的移民家庭,为生计奔波劳苦的日子,才刚看到希望,李飞飞的母亲身体就出了状况。其实在出国前的几年里,母亲身体就不太好,到了美国,天天守在收银台旁,工作劳累,她的健康开始每况愈下。就在这个时候,李飞飞的父亲又不幸失业了,家里再度陷入困顿。
移民群体生存的不易,促使李飞飞加倍努力读书,她想通过学习来分散注意力,也渴望恢复在中国时曾经优异的学业水平,通过成绩来证明自己。只是,英语仍然是她前进道路上的最大障碍,几乎每句话都要借助词典才能理解,学习的速度非常慢,尤其是数学的学习,更令她泄气。
为了提高数学成绩,李飞飞开始像其他同学那样,放学后去数学老师萨贝拉先生的办公室,向他请教问题,并提前开始做作业。
萨贝拉先生是学校的首席数学教师,是个不折不扣的数学行家。在他每天的悉心辅导下,李飞飞开始渐渐克服语言的障碍和学习的障碍。她还发现,自己和老师之间有很多共同点,除了对数学的热爱之外,两人都喜欢读科幻小说和名著。萨贝拉先生推荐了很多好书给李飞飞,课余阅读这些书的过程,提高了李飞飞的整体思考能力,她开始走上了全面发展的道路,学习成绩自然而然地提高了。
萨贝拉先生的热忱和给予,获得了李飞飞的深深信任,她第一次向一个美国人敞开心扉,倾诉家庭的困难,和她作为一个十几岁的孩子,对父母的不满情绪,而萨贝拉先生亦师亦友,像指导顾问一样,总是耐心地倾听,化解她的情绪,两人建立了深厚的师生情谊。
高中毕业前夕,面临上大学的选择,因为家里负担不起常春藤盟校的学费,李飞飞的目标主要是州立大学和社区大学,但她内心一直对一所顶级高校念念不忘,那就是普林斯顿大学,所以即使知道没机会去,李飞飞也象征性地提交了申请。
那年12月的一个寒冷下午,李飞飞收到了普林斯顿大学的回信。如果是录取通知书,信封会非常厚实,因为里面会装满新生的入学材料和后续说明。然而,她的那封信却很薄。
李飞飞觉得已经知道结果了,但还是拆开了信。万万没想到,信里带来了让她不敢相信的惊喜:普林斯顿大学录取了她,并且告诉她,她的申请进入了提前录取周期,因此回复是用薄信封寄出来的。
不仅如此,信里还有一封名为“经济援助”的文件,上面写了很多法律细节,李飞飞没有完全看懂,便拿着信去学校,找萨贝拉先生看。萨贝拉先生又带着李飞飞去找校长确认。最后得知,普林斯顿大学不但录取了李飞飞,还为她提供了近乎全额的奖学金。
这是到美国这么久以来,李飞飞第一次有了类似自信的感觉。她说,在萨贝拉先生的指导下,自己重新找回了尊严。
沉迷科学,找到自己的北极星
普林斯顿大学的校园就像一个梦境,让李飞飞在兴奋之中觉得有些不真实,无论是精密的实验室那纯粹的科学魔力,还是规模恢宏的众多图书馆,或是校园里丰富的艺术收藏品,都让她感到自己置身于一个超凡的世界之中,呼吸着极其新鲜的空气。
当然,这背后也有很多纠结。作为移民,李飞飞始终觉得,自己似乎应该把学业作为毕业之后找到好工作的敲门砖,比如进入医学、金融或工程等有着丰厚报酬的领域,来承担奉养父母的家庭责任,让这个新移民之家摆脱社会边缘生活。
但与此同时,她的内心始终有个声音在唱反调,提醒她去追求自己从小就充满好奇心的物理学。当她把困惑告诉父母后,父母表现出的是毫不犹豫的支持,他们叮嘱女儿,不要忽视内心对科学的热情。
在李飞飞读大学期间,她的母亲因为心血管状况恶化,做了一次手术,之后,在萨贝拉先生的慷慨帮助下,李飞飞的父母开了一家干洗店来维持生计。随着业务渐渐稳定下来,父母的状态变得比之前给人打工要好很多。
家里的情况好转,李飞飞才能更加安心地读书。在普林斯顿大学这所现代物理学的殿堂里,她如饥似渴地学习着物理,与此同时,她还作为本科生去加州大学伯克利分校参与了一项实验,通过计算机研究大脑的奥秘。
尽管实验只持续了一周,但再次回到普林斯顿大学时,李飞飞觉得自己已经脱胎换骨,她开始意识到,自己所痴迷的物理学,其意义不在于方程式或者概念,而是对其象征意义的追寻和探索。每个科学家穷尽一生都会在苍穹之中寻找属于自己的北极星,不管是一个问题,一个假设,还是一个赌注,哪怕追到天涯海角,也毫不犹豫。
现在,李飞飞也要找到属于她自己的那颗北极星。
1999年,李飞飞在普林斯顿大学的学习生涯即将结束,她又一次面临科学抱负和现实生活之间的两难选择。当时,网络经济正在蓬勃发展,拥有数学背景和名校学位的人,在金融街炙手可热。许多华尔街的大公司纷纷向她抛出了橄榄枝,提供了令人艳羡的起薪、福利和晋升机会。只要点点头,她就能结束家里负担的债务,结束父母在干洗店日复一日的劳累,为母亲提供再次手术的经费保障。
此时此刻,自己应该何去何从呢?李飞飞考虑了好几天,终于跟母亲提起了这件事,她说自己面试了几家华尔街巨头,他们给的条件很诱人。
母亲平淡地问:“这是你想要的吗?”
李飞飞说:“光是薪水,就足以改变我们的生活了。”
母亲又问了一遍:“飞飞,这是你想要的吗?”
李飞飞说:“妈妈,你知道我想要什么,我想成为一名科学家。”
母亲简洁地回答:“那还有什么好说的呢?”
面对李飞飞的纠结,母亲的回应总是一针见血。
很快,李飞飞前往加州理工学院读研,兼修两个方向:神经科学和计算科学。因为神经科学能让她更加深入地了解大脑的能力,而计算科学可以利用工程学的原理来建模,甚至复制智能能力。她想找到自己的北极星,也就是通过视觉研究,解开智能之谜。
“视觉研究”探索的是人类认知中的一个核心现象,用五个字来简单概括就是“所见即所知”。李飞飞要搞清楚,人类是怎么看见世界的,人工智能又该怎么看到世界?
在加州理工学院的第二学年即将结束时,李飞飞已经阅读了大量文献,参加了很多研讨会和专题会,看到了足够的第一手资料,从而认识到了这样一个重要的事实:视觉知觉依赖于分类。
也就是说,我们的大脑会自然而然地把看到的细节进行归类,比如,当眼前出现蓝色天空下的一棵绿树时,我们的眼睛看到蓝色和绿色的图案,视觉里是光线、颜色和细节,而大脑会立刻把这些细节进行归类,归类为绿色的树木,蓝色的天空。正是这种分类的能力,带给了人类难以估量的能力。
既然人类是这样看到世界的,那么机器能不能做到呢?如果让电脑像人类一样去熟悉视觉世界,又会带来什么结果呢?
当然,这有一个前提,要想让电脑成功识别东西,首先要提供大量的示例材料,让计算机算法充分接触视觉世界里丰富繁杂的事物,获得感知体验,才能在面对新事物时,展现出卓越的识别能力。
从这个思路出发,李飞飞在导师的带领下,创建了一个大规模的图像数据集,他们策划了100个分类的图片,比如:手机、汽车、披萨、雨伞、停车标志,等等,每个类别里都有各种各样的例子。他们花了好几个月的时间,在图片搜索引擎里查询,挑选出同类物体最好的图片,然后裁剪和调整照片的尺寸,再贴上标签分类。
这个图像数据集合在2004年完工,包括101个类别,9000多个图像,成为有史以来为电脑学习配置的最大规模的图像集合,官方起名叫“加州理工学院101类图像数据集”。计算机算法通过学习这个数据集,性能大幅提升,这个成果让大家无比激动。
不懈努力,在视觉领域成就非凡
在通过视觉研究探索人工智能的道路上,“加州理工学院101类图像数据集”确实提高了算法的能力,但还远远不够,因为这个数据量对于算法的学习而言,并不能带来突破性进展。那么,究竟要多少类别才够用呢?
李飞飞一头扎进茫茫文献中,费了很多功夫,终于找到了线索,现代视觉研究成果的主要贡献者之一欧文·彼德曼在一篇论文中探讨了这个话题。世界上大约有多少独特的“事物”类别?彼德曼认为,有大约3万个。在数据领域,这是一个巨大的数字,并且完全没被开拓过。
从加州理工学院博士毕业后,李飞飞受邀回到母校普林斯顿大学任教,对视觉分类的研究依然是她世界的中心。她和研究生邓嘉组成团队,建立了ImageNet项目,我们这里为了方便大家理解,意译为“图像网”,该项目旨在建立一个超级图像数据库,用于人工智能算法的学习。
两人确定了一个目标:在2.2万个类别的物品下,为每个物品类别搜集1000张不同的照片,比如1000张不同的小提琴照片,1000张不同的牧羊犬照片等等。 这样算下来,大约需要搜集2000万张图片,还不是每张图片找到就能拿来用的,他们需要从几亿张照片中筛选,挑出合适的,然后下载整理,并打好标签,才能达到最终成品库2000万张图片的目标。
这个工作量显然属于天文数字,一开始,他们招募了一些本科生来帮忙,可即便有了帮手,按照当时的进展速度,项目预计需要19年才能完工。
两人又开始优化工作节奏,降低时间成本和金钱成本,他们编写了自动化下载图片的程序,以最快的速度日夜不停地从网上下载候选图片,先迅速填充资料库,再做进一步的整理,但这也仅仅只能缩短一年的时间。
如果想把预期完工时间缩得更短,就要增加10倍的人手,但这完全不现实,因为实验室的资金远远不够。
二人组没有被接踵而来的困难打垮,他们仍在不断寻找新的突破口。没多久,在一个研究生的建议下,他们发现了亚马逊提供的“土耳其机器人”服务,这是一种在线平台众包的工作模式,也就是通过在线平台,有效组织远程的临时工作团队,自动化分配工作任务,并收集工作结果,服务费用又很合理,可以节省很多人工成本。
借助这种众包服务,“图像网”项目由起初零零散散的大学生队伍,一下子变成了由几十人、几百人、甚至几千人组成的国际团队,大大提高了项目速度,整个项目进程急剧缩短到10年、5年、2年、最后不到1年就完成了。
2009年6月,图像网项目宣告初始版本完成,一共收集了1500万张图片,涵盖了2.2万个不同类别,在规模和多样性上达到了李飞飞等人多年来梦寐以求的水平,成为当时人工智能史上最大的人工编辑数据集,但这项工程一开始并没有在业界引发关注。
李飞飞团队没有气馁,他们每年举办一场基于视觉识别的挑战赛,允许参赛团队用“图像网”这个超级数据库训练自己的算法,评估每种算法识别图像的准确率,总错误率最低的算法获胜。
三年后的2012年,在第三届比赛中,一种神经网络算法获胜,图片识别准确率高达85%,创造了计算机视觉领域的世界记录。自此,人们终于见识到了“图像网”的力量。
之后,人工智能愈演愈热,一场深度学习的革命扑面而来。李飞飞在学术休假期间,受邀担任了谷歌副总裁、谷歌云人工智能及机器学习首席科学家。在此期间,她深深感受到了科技行业在技术、人才、数据等各方面深厚的资源和实力,也在人工智能领域开始了新的探索和反思。
2018年6月26日,李飞飞迎来她职业生涯新的里程碑,到美国众议院科学、太空和技术委员会,就“人工智能——威力越大,责任越大”这一主题作证。这就是开头的那一幕,作为人工智能发展的见证者和资深行业翘楚,李飞飞将自己的所见所感分享给世人,认为人工智能在给人类社会带来好处的同时,也会带来不可低估的风险和伤害。要想让人工智能帮助人类,就必须从人类自身开始思考。她强调,应该构建以人为本的人工智能,让这个领域变得更加多元、包容和开放。
好了,到这里,华裔科学家李飞飞的这本《我看见的世界》的精华部分,我们就讲的差不多了。
这本自传讲述了李飞飞凭借勇气、好奇心和脚踏实地地奋斗,一次次突破困境,从底层移民成为顶尖科学家的经历。人生如同大海,因无限可能而浩瀚,因不着方向而迷茫,只有具备坚定的理想和信仰,才能发现穿破黑暗的灯塔之光,找到此生的意义。借助榜样的力量,我们也该好好思考并耐心寻找自己人生的北极星,确立自己的使命,并为此孜孜以求,不懈攀登。