“AI教母”李飞飞讲AI

是欧阳公明仔父 2025-02-13 14:22:51
2月10日,“AI教母”李飞飞在巴黎人工智能峰会上发表开幕式演讲。近 100 个国家的代表参加本次巴黎人工智能峰会,讨论 AI 的安全发展和如何使其具有包容性。 李飞飞在演讲中深入剖析了现代人工智能崛起的三大关键要素:感知算法、认知科学和计算能力的突破,并指出人工智能正经历从“感知智能”向“行动智能”的关键转型,空间智能与具身智能将成为未来发展的新方向。 演讲的核心理念聚焦于“以人为本的人工智能”, 强调科技发展应始终服务于人类福祉,并具体阐释了尊严、能动性与社区三大核心价值,以此构建人工智能伦理的基石。最后李飞飞阐述了人工智能治理的三大原则,倡导构建一个多元健康的人工智能生态系统,鼓励开放合作与公共参与,共同塑造科技向善的未来。 以下是本次演讲实录,经翻译编辑: 主持人:女士们先生们,各位国家元首和政府首脑,尊敬的部长们,亲爱的朋友们和同事们。我很高兴欢迎各位来到巴黎举行的这次前所未有的人工智能峰会,本次峰会由马克龙总统和莫迪总理共同主持。 我谨代表人工智能行动峰会团队,欢迎来到巴黎!欢迎来到大皇宫!欢迎参加人工智能行动峰会!感谢各位。现在,有请李飞飞博士发言。 李飞飞:谢谢,欢迎大家。早上好。 李飞飞:我正在等待幻灯片加载。 李飞飞:希望各位在巴黎度过一个美好的早晨。请问可以播放我的幻灯片了吗?好的,非常感谢。大家早上好!我非常荣幸和激动能与各位相聚于此,并作开幕致辞。我期待着接下来几天富有成效的讨论,甚至能达成一些重要决策。 01 人工智能历史根基 李飞飞:对我们许多人来说,人工智能通常被视为一个关于技术和现代世界的故事,当然也是一个关于未来的故事。这就是我们今天齐聚于此的原因。但对我而言,这更是一个可以追溯到生命起源的故事,一个开始于 5 亿年前的故事。 那是极其遥远的时代,视觉的概念甚至还不存在。事实上,眼睛尚未进化,没有任何生物亲眼目睹过这个世界,所有生命都处在各位在屏幕上看到的黑暗之中。 当然,要用大约 10 分钟的时间来回顾 5 亿年的历史有点长。所以我在这里做一个概括。当进化赋予屏幕上这些简单的生物感知周围世界并做出反应的能力时,哪怕这种感知非常微弱,一场进化“军备竞赛”便拉开了序幕。最初,这还只是一种被动的体验,即简单地让光线进入,但很快就变得更加丰富和活跃。神经系统开始进化,视觉发展为洞察力,“看到”演变为“理解”。理解力进而催生行动,所有这些共同孕育了智能。而这一切,将永远地重塑地球生命的本质。 今天,快进到 5 亿年后,人类的智慧已经引导我们去构想和塑造工作和生活的方方面面。我们不再满足于仅仅拥有大自然赋予的智能。现在,好奇心驱使我们去创造像人类一样智能,甚至超越人类的机器。 因此,我们本周探讨的这项开创性技术的探索之旅,始于 20 世纪中期。英国伟大的数学家艾伦·图灵极具远见卓识,甚至在计算机诞生之前,他已经开始思考如何赋予计算机媲美人类的认知能力。在我看来,他的著作始终是一种挑战,激励着人类大胆想象,去创造他所设想的智能机器。 同样的好奇心和雄心也深深吸引着早期的美国计算机科学家。他们不仅发起了首个探索智能机器可能性的研究项目,更在 1956 年那个闷热的夏天,在“人工智能”这个术语被大众熟知几十年前,创造了这个术语本身。这张幻灯片展示的,正是他们为那次研讨会撰写的最初的研究论文。 坦率地说,有趣的是,他们当时认为只需两个月就能解决这个问题的绝大部分,并揭开智能之谜。或许他们有些乐观,但他们的胆识令人钦佩。今天,这个“两个月项目”已经过去了 820 个月,但我们确实取得了显著的进展。 02 现代人工智能崛起的三大支柱 李飞飞:人们对人工智能的另一个误解是,它仅仅是计算机和工程学的问题。但事实是,人工智能始终是一个充满活力的多学科交叉领域。我们今天所处的现代人工智能时代,是三项意义深远且又各具特色的技术和科学进步融合的成果。 首先是对感知算法的研究,即生物如何理解周围的世界。最终,在艾伦·图灵提出大胆猜想以及达特茅斯人工智能夏季研讨会召开几年后,数学模型的创建成为可能。神经生理学家 Hubel 和 Wiesel 率先揭示了哺乳动物视觉皮层神经元处理的分层结构,从而荣获诺贝尔奖,并彻底改变了我们对视觉处理的理解。大约在同一时期,心理学家 Frank Rosenblatt 构建了最早的神经网络原型之一,即感知器。 这些研究成果持续激励着后来的计算机科学家,特别是早期的先驱者,如 Kunihiko Fukushima、Jeff Hinton、Yann LeCun、Joshua Bengio 等,去设计日益精密的模型,并最终催生了我们今天熟知的深度学习神经网络算法,使机器获得了不可思议的能力。 与此同时,第二个发展脉络开始显现。认知科学家深入探索人类自身的思维,揭示了我们感知周围环境能力的惊人深度和复杂性。他们得出的一个明确结论是,我们的大脑与塑造其进化的环境是密不可分的。大脑不仅仅是禁锢在我们头颅中的机器,更是孜孜不倦的学生,从生命最初的时刻起,就渴望从每一丝光线、每一缕触感、每一声细语中学习。对我个人而言,作为一名在 21 世纪初成长起来的科学家,那时感知算法几乎是我研究领域的唯一焦点。认知科学给我带来的启示之一是“规模”。生物的进化和发展进程,受益于海量的数据来驱动自身学习。我和我的合作者及学生们推测,机器的学习也是如此。 但这一次,数据不再通过生物传感器采集,而是来自现代数字设备和互联网。这启发了我的实验室开展 ImageNet 项目,即首个互联网规模的人工智能训练和评估数据集。我们提出的“数据是神经网络等高容量算法的关键”这一假设,使这些算法重获新生,性能达到前所未有的水平,并由此掀起全球范围内利用大数据发展人工智能的热潮,这也就是现在被称为人工智能scaling law的一部分。 最后,所有这些成就的取得,都离不开算力强大的计算机。没有它们,一切都不可能实现。这一切始于 20 世纪 40 年代提出的计算机架构范式——冯·诺依曼架构 等里程碑式的发展,这一架构至今仍被沿用,并催生了 20 世纪 70 年代初的首批微处理器。有趣的是,正是视频游戏推动了硅芯片原始速度的飞速发展。20 世纪 90 年代初,为了制作更精细的游戏画面而兴起的 “家庭手工业”,在短短二十年内发展成全球产业巨头,英伟达等公司制造出越来越强大的图形处理器 (GPU)。GPU最终补上了最后一块拼图,使神经网络算法能够从互联网规模的大数据中进行学习。因此,在座如果有游戏玩家,我们都要感谢你们。 03 人工智能的新阶段 李飞飞:接下来的内容不仅仅是回顾历史,更是构建未来的蓝图。早在 2012 年的 ImageNet 挑战赛上,我的实验室就率先将算法、数据和算力这三大要素整合起来,首次实现了如此大规模的融合,几乎在一夜之间彻底改变了我的研究领域。这是机器首次能够理解并可靠地描述图像内容,而且是数百万张图像。 如今,我们对此习以为常,但在当时,这是一个尚未解决的难题,这项能力简直宛如科幻小说一般。这是人工智能发展历程中倒下的第一块多米诺骨牌,随之而来的是一连串的里程碑,而且这些里程碑的到来速度似乎一年快过一年。如今,十多年过去了,我们仍在探索这一切的深远影响。这项最初源于学术界的好奇心,如今正受到商业领袖、企业家、行业分析师乃至政治家们经久不息的热切关注,而且这股热潮方兴未艾。 我们现在所处的时代,历史学家们无疑会将其定义为人工智能的第一个真正时代。无论从哪个指标来看,例如计算机科学学位、人工智能项目、投资、新兴创业公司等等,人工智能革命都在不断扩展其规模和范围。在过去的几年里,无需我赘言,随着大语言模型的问世,人工智能领域再次迎来一次更加惊人的飞跃,大语言模型将现代人工智能的算法、数据和算力这三大要素推向了前所未有的高度。Transformer 这种新型架构,利用海量的互联网数据进行训练,并由数量惊人的最先进芯片提供算力支持。正如大家所见,其结果是机器能力实现了比过去十年更加巨大的飞跃。 如今,我们已经习以为常地认为,AI 可以用流利的自然语言与我们对话,回答几乎任何领域的问题,甚至可以生成各种复杂的图像、声音、音乐和视频。ChatGPT 的巨大成功,创下了用户采纳速度的新纪录,这充分证明了这项创新对我们日常生活的深刻影响。而且,这些 AI 的能力绝非只是表面功夫。从图表上可以看出,近年来,AI 模型在从手写识别到博士级科学问题等一系列 benchmark 上的性能都呈指数级增长,在某些对人类极具挑战性的任务中,AI 的性能提升曲线近乎垂直。 李飞飞:在语言理解能力的基础上,大语言模型开始在解决问题中扮演更积极的角色,它们能够分解任务,并为实现现实世界的各种目标规划步骤。正如许多人在 2025 年所称的 “AI 智能体”,是这项对用户和企业都至关重要的技术的最新篇章。但精彩远不止于此,除了语言智能,还有更广阔的天地。请思考一下人类,我们作为一个整体的智能生物。一个崭新的篇章正在开启,在这个篇章中,视觉感知的应用将扩展到更积极主动的层面。在我的研究领域,也就是相机和机器人技术中,人工智能开始在数字或物理的 3D 空间中进行创造、理解、推理和交互。它可以用于与人或物进行互动,我们称之为空间和具身智能。 例如,看这张图片。我们的视觉智能使我们能够轻松识别图中的一切:猫、盆栽、桌子,当然还有那杯牛奶。但这真的是我们通过感知获得的所有信息吗?我敢说,你们在座的各位,看到这张照片时,恐怕不只是理解了图像的内容,肯定还有不少人迫切地想要伸手抓住那杯牛奶,以免它掉在地上摔碎。这只是一个简单的例子,但它突显了从观察到行动的巨大转变。我相信我们正处在一个转折点,人工智能将从观察者转变为与我们并肩行动的执行者。事实上,对于我所敬佩的艾伦·图灵,我现在认为他对未来人工智能的愿景可能过于狭隘和内向了。进化本身就清晰地表明,智能的真正力量不仅仅在于思考,更在于运用思想驱动行动。 想想人类的空间智能,从古代金字塔到工业革命,从科学发现到艺术表达,它为人类文明的建设贡献了何等巨大的力量。当 AI 扩展了我们的空间和具身智能后,我们与周围世界的关系又将发生怎样的深刻变革?它将帮助我们创造什么,发现什么?我们又将共同构建怎样的未来? 现在,让我们快速了解一下快速发展的空间智能技术。我将展示我的斯坦福学生和 World Labs 同事完成的四个案例,分别是:左上角,复杂日常视频的语义标注;右上角,艺术风格迁移;左下角,生成式 AI 算法根据文本提示生成视频;右下角,根据图像创建 3D 世界。没错,大家看到的就是梵高钟爱的画作《法国咖啡馆》,它通过我们的生成式 AI 模型被栩栩如生地展现在一个想象中的 3D 世界中。 同样令人振奋的是,机器人技术,作为具身智能的一种形式,也在快速发展。这两项来自我们实验室的研究,代表着将机器人学习与大语言模型和视觉模型相结合的最新进展,与上一代高度编程和预先设定动作的机器人相比,这些机器人能够在更加开放和真实的执行日常的人类任务。 04 以人为本的人工智能 李飞飞:这些都展现了令人振奋的可能性。但是,如果 AI 不仅能思考,更能行动,成为真正的 “行动机器”,那么我们引导这项技术的集体责任就变得更加紧迫和重要。我认为,说这一切已将我们带到一个具有划时代意义的时刻,也绝不为过。那么,我们该如何应对人工智能发展带来的挑战? 我认为,这也是我们本周齐聚一堂的目的所在。多年来,这个问题一直指引着我的工作。我深知这绝非易事,但有一个核心主题始终贯穿于我的所有研究工作。那就是我所倡导的 “以人为本的 AI ”,它包含三个朴素而重要的价值观:尊严、能动性和社区。 首先是尊严。面对日益强大的技术,我们人类常常需要反思一个根本问题:究竟是什么定义了我们人类自身?抛开我们能够完成的各种任务,作为人类的自豪感,以及自主决策和行动的能力,仍然是我们存在的核心价值。如果 AI 技术能够帮助保护,甚至帮助所有人重拾这份尊严感,特别是那些弱势群体,那将令我无比欣慰。 例如,我们正在进行的一个项目就展示了机器人和 AI 技术如何在未来帮助那些重度瘫痪的患者重获自主性。在斯坦福大学,我的合作者和学生们正在进行一个研究项目,通过非侵入式脑电图技术收集脑电波,AI 算法能够解码患者的意念和指令,并控制机械臂完成一系列精细动作,例如制作一份完整的日式寿喜烧料理。 第二点是能动性。我们实验室的核心宗旨一直是探索 AI 的应用,以增强人类能力,而非取代人类。正如历史上每一次重大技术变革都会重塑劳动力市场,AI 的进步也必将对就业产生深远影响。但我们不应将 AI 视为替代劳动力,而应充分利用 AI 来增强人类自身的能力,从激发创造力到提升医疗健康水平,从加速科学发现到赋能智能制造,AI 的应用前景无比广阔。 AI 的诸多技能与人类技能形成互补,这意味着我们拥有大量机会,可以借助 AI 这种数字或物理的合作来实现自身能力的跃升。在过去十年中,我们实验室在 AI 医疗健康领域的研究表明,AI 在提升医疗质量、减轻医护人员负担方面具有巨大的潜力。例如,以下列举了三个应用场景,展示了如何利用 AI 算法驱动的智能摄像头来帮助医院:1) 提升临床医生的手部卫生规范;2) 辅助记录患者的康复锻炼情况;3) 协助手术器械跟踪管理。 但另一条道路则通向一个由 AI 助力构建的更美好世界,在这里,AI 帮助我们建设更完善、更宏大、更有凝聚力的社区。例如,AI 教育辅助工具可以为越来越多的人群,包括儿童和成年人,提供学习机会。下面是两个例子:左侧,我们利用 AI 和 VR 技术,为患有阅读障碍的大学生提供个性化学习工具;右侧,美国布法罗大学创建了一款 AI 专家系统,旨在缓解言语语言病理学家的短缺,以便及早干预 3 至 10 岁儿童的言语和语言障碍问题。 05 人工智能治理的三大原则 李飞飞:以上种种引出了我今天想与大家分享的最后一个思考。在这个具有划时代意义的关键时刻,我们应如何同心协力,以理性、务实和负责任的态度治理 AI,从而最大限度地发挥其巨大潜力。 首先,至关重要的是,AI 治理必须以科学为基础,而非科幻想象。纵观 Main Street 和 Wall Street,如今关于 AI 的大部分讨论都充斥着夸大其词和耸人听闻的论调,导致 AI 治理政策误入歧途。因此,我们需要用更科学的方法评估 AI 的能力和局限性,从而制定更精准、可执行、且基于现实的政策。 其次,AI 治理应采取务实态度,而非意识形态先行。AI 是一项强大的技术,善用 AI,将有助于改善我们的生活和工作。因此,我们不应限制对这项新兴技术的探索和上游研究,而应将重点更多地放在 AI 的实际应用上,确保 AI 的良性发展,并防范其潜在危害。 最后,我们需要构建一个更健康、更具活力的 AI 生态系统,在这个生态系统中,学术界、创业者、开源社区、公共部门和大型企业都应积极参与, 各自发挥关键作用,共同推动 AI 技术向前发展。既然 AI 将改变世界,就需要各行各业的人都参与到塑造这场变革中来。正如我之前提到的,算法、数据和算力是现代 AI 的三大关键要素。如果这些资源过度集中在少数公司手中,AI 生态系统将因缺乏好奇心驱动的研究、顶尖人才、开源力量和跨学科探索而活力受损。 75 年前,艾伦·图灵预见未来,大胆提出制造思考机器的挑战。今天,我们取得的进展已远超图灵的想象。AI 时代的科技进步令人叹为观止。我认为,现在我们需要提出新的挑战:与其仅仅关注我们是否能创造 AI,不如思考如何让 AI 成为一股向善的力量。总而言之,今天,我想向大家发出挑战,共同构建以人为本的 AI!谢谢大家! 主持人:非常感谢 Fei-Fei 女士!谢谢。
0 阅读:3

是欧阳公明仔父

简介:感谢大家的关注