尹烨X马兆远:人工智能时代,我们最该学什么?

衷心书院 2024-03-26 11:00:48

近年来,随着一系列新一代数字技术的加速推进,未来世界正向我们呈现出其充满科技态的雏形。

2024年,大语言模型ChatGPT的热潮还未退去,文生视频大模型Sora的“横空出世”再次点燃了大家对未来的期待。

未来科技会给我们的生活带来哪些改变?新的科技叙事能够带给我们哪些商业想象?人工智能时代,普通人应该怎么培养未来世界的思维方式?

当人工智能专家遇见生命科学家,将会发生哪些有意思的观点碰撞?3月17日,中信书院联合鹏瑞集团在广州·鹏瑞1号举办了一场聚焦前沿科技的交流活动,特别邀请了华大集团CEO、科普“名嘴”尹烨与南方科技大学教授、英国物理学会会士马兆远,一起解读新趋势,帮大家更早看见未来。

来 源 | 中信书院(ID:citicbook)

编 辑 | 三 昧

尹烨科学只能卡脑子,技术可以卡脖子

我很喜欢这句话,丘吉尔说:“不要浪费一场伟大的危机,危是对所有人的,机是对有准备的人”。这个世界上没有什么事情是学不会的,总有两个东西你会学会的,一个叫南墙,一个叫黄河,到了不改不可的时候,就会危中见机。

我们现在正站在三个大科技的交汇处——1994年中国加入互联网,1999年人类完成第一个基因组,2023年GPT开启人工智能时代。人类历史上技术没有这么快的进步过,也没有这么快的融汇过。但是反过来讲,这些技术可能会给今天人类带来什么?

科学和技术完全不同

科学和技术是完全不同的两个概念,我们轻易不要讲科技。科学是知识,是规律,规律只能发现,不能创造,所以科学无国界;但技术是可以被创造,可以被发明的,是有国籍和商业壁垒的。科学只能卡脑子,技术和产业是可以卡脖子的。

2002年诺奖得主分析,为什么上个世纪80年代的生物技术突然取得了很大的突破?不是科学家变聪明了,是因为工具的发明。新的科学进步首先是来自于新的技术,新的发现再到新的想法。

很多突破并不是从科学到技术再到产业,反而绝大部分是有技术再有工具,比如,先有蒸汽机后有热力学,先有飞机后有空气动力学,先有望远镜后有天文学,先有显微镜后有微生物学,实际上人类是先从技术工具逐渐产生出新想法。

所以只有能造硬件,才能真正引领世界向前奔跑,所以中国不会卡在软件上,只会卡在硬件上,软件叫文无第二,硬件叫武无第一,我们必须在硬件上努力突破。

千万不要信谁能跟上Sora?

这就不得不提到卡脖子的芯片。引入一个最近比较火的概念Scaling Law(标度律),简单来说就是暴力出奇迹。

去年这个时候GPT出现,中国各大公司追的很快,火速开始百模大战。而Sora出来一个月了,为什么没有人追赶,因为第一Sora没有开源,第二我们算力不足,这就是现在的问题。

GPT算力是1750亿训练级,基本上就是搜索引擎中的人类语料库,需要25000张A100芯片算半年。业界普遍认为Sora的总算力需要1万张卡,万卡是能够做文生视频一个门槛值,而中国现在没有万卡算力,一家公司都没有。

千万不要信谁今天能跟上Sora,先问他:你算力够吗?相当于就一个胃能吃5斤米饭吗?这就是所谓的暴力出奇迹,堆不到这个量级的算力就不可能训练出类似的模型。

人工智能,谁先用谁赢

再介绍一个词:涌现。简单来讲,就是整体大于部分相加之和。从科学来讲,化学是物理的涌现,基本的粒子进行一些组合就变成了元素,就有了化学。化学从无机经过一系列的自循环,让自己的熵变低就变成了生命,生命再涌现出来神经系统,就出现了智能。

人工智能来了,会不会打败人类?不会,谁先用谁先赢。汽车取代了马车,但是马车夫变成了司机,你是要变成司机还是天天骂不应该发明汽车?后者肯定不对,一定积极拥抱变化。

技术钝感是当下人类最大的挑战,所谓的“老”不是你头上有白头发,而是你不再接受新的想法。比如,量子应用、合成生物学、类脑计算、零(负)碳农业、可控核聚变、常温超导等等。

与此同时,我们要守脑如玉,一定要相信眼见未必为实,数学对就是对的,物理对就是对的,只有用自然哲学的最高语言数学去量化,才能迎接下一个挑战。只要数据够了,自然会发生涌现,所有的未来判断都希望通过数据导向,而不是靠假说导向去解决问题。

居里夫人说:世上没有真正可畏惧的事情,只有尚未被认知的事情,知之越深,未知越浅。人为什么会焦虑?一是当你的欲望大于能力,二是道理知道的多,知识知道的少。怎么解决焦虑?就是8个字:多学知识,少听道理。

所以守脑如玉有的时候比守身如玉更重要,学习不会让大家变成全知全能,学习唯一的作用是让你们不再害怕未知。

马兆远学人工智能,从MAPLE学起

前两年,我在南科大开始讲逻辑课,为什么逻辑重要?因为有了逻辑才有了现代科学,这个没法回避。在上世纪30年代之后,有几件事影响了现代科学:

哥德尔不完备定理终结了我们对完美工具的幻想,

量子力学结束了我们对确定条件的依赖,

混沌力学告诉我们精确预测未来的不可能性,

贝叶斯统计告诉我们认知本身是信心,是执行度的问题。

所有这些东西构架在一起,完成了对科学的证实启蒙,也形成了现代科学的基本思路。在这之前,古典科学的思维方式先有观点后有证据,而现代科学的思维方式是先有证据后有观点,这也是古代思维和近代思维的核心差别。所以在大学里,我们才开始认真教什么是逻辑,什么是证据第一性,观点第二性。

我们越来越清楚一件事,教给年轻人将来该学什么这件事——能力越差,越要回归本质,回归日常。大学这几年应该学什么东西?延伸到中学和前期的教育,基本上可以教给学生叫MAPLE。

数学(Math)

数学保证我们和硅基生命或者新物种对话,它的延伸就是计算机。我上中学学了C语言,做教授之后开始学Python,现在可以用ChatGPT帮助生成语言,所以学语言本身可能用处不大,但是学数学更本质一点,规则是不变的。

艺术(Art)

艺术是我们跟人类内心的对话,维特根斯坦讲艺术是没法用语言来描述的,只能去体会,但确保我们继承了人类的文化,可以和自己的内心沟通。

物理(Physical)

物理保证人能够和自然对话,这是人跟自然真正接触的第一道防线,从物理之上延伸出来化学,但物理的规则告诉我们怎样去审视自然界哪些东西是真实的。

文学(Literature)

不管是学中文还是英文,至少学两到三种语言,能保证你和人对话,和中国的文化对话,跟另外的文化在一起对话,保证你能跟人有很强的沟通能力。

工程(Engineering)

大学里面很重要的一个问题,对学生动手能力的训练极差,这是中国整个高等教育出现的严重偏差,从小学到大学一直没有教育孩子们怎么动手,更多时候动手是为了考试。

尹烨X马兆远多学知识,少听道理,逻辑为先

主持人:2023年被看作是人工智能大模型的元年,AI技术在全球范围内飞速发展,渗透到各行各业。两位老师在过去一年,有感受到什么非常深刻的变化吗?

尹烨:我这一年多来最大的感触就是,原来一些很基本的语言学的东西确实得到很大的颠覆,最典型的就是翻译在GPT出来之后没活干了,当工具的语言没有必要再学了。但凡语言能干的事情,不管是谱曲、编程,搭建一个简单的网站,甚至未来的文生视频,包括越来越多AI电影都已经做出来了。

马兆远:很多人在问我们,哪些工作将来真的还有用?我们唯一能告诉年轻人的是学习能力还有用。上一代人可以从参加工作到退休只干一件事,我们可能每隔几年就要换一个工作,学习能力是唯一能在这个环境当中决定竞争力的。从ChatGPT、AIGC这些新名词出现的速度太快,与其跟上这么多新名词,不如真的理解其中的道理。

150年前,中国在进行洋务运动的时候,李鸿章、张之洞也学了很多新名词,怕被世界落下,要奋起直追,造工厂,造大船,但是结果并不好。同时期日本进行明治维新,福泽谕吉提出日本要现代化,首先要在思想上要现代化,理解现代科学是怎么发生的,这个思路看起来很笨,确实让日本和中国在学习西方中走上了两条不同的道路。

现在可能也面临类似的问题,美国灌输给我们很多新名词,如果不去“走福泽谕吉的路”,可能和150年前发生的事情是类似的,投入了很多人力物力,但最后还是被打败。教育这件事看起来作用是很慢,但其实长时间积累下来并不慢,而且会让你进步了之后不会退回去。

主持人:从产业结合的角度来讲,人工智能和生命科学结合,和制造业结合,两位老师有没有具体的案例给我们分享一下。

尹烨:人工智能真正在生命科学领域主要是三个大事件。

第一个人类的基因组计划,从1989年美国立项,到1997年突然异军突起,有一个创业者叫麦特尔,大概花两三年时间就赶上人类基因组十多年的成果,由此诞生了一个新的学科叫生物信息学,开始把超级计算用在了生物学的计算上。

第二个比较轰动的是AlphaFold2,根据氨基酸序列就能够直接预测蛋白质折叠模型,这件事是非常夸张的。尽管它不如全世界最牛的5个人,但它替代掉了过去的9995个人,大幅节省时间。

第三个是谷歌阿尔法狗团队做出了AlphaMissense,用AlphaMissense几分钟之内可以把人脑工作替代,尽管里面还有很多错误,但依然大幅提升了效率。

人是最精密的机器人,人是自然演化的产物,人体这么多关节是最牛的“柔性机器人”。每个关节,每个肌肉,每个神经,每个细胞里有上千万个分子,却可以让37万亿细胞在体内来来回回运动,所以仿人是很难的,仿人脑的智能反而是很简单的。我们不要低估了今天的人,人本身就是一个大数据,一个超智慧体,只是我们对自身的认知可能比人工智能的认知还少。

马兆远:去年ChatGPT出来,大家都在炒作ChatGPT,这是微软十几年憋出的大招。在别人已经做的很好的方向上,你本来醒的晚一点,能力还差一点,要想追上,就像你跟朋友在森林里面碰到一只熊,你不需要跑得比熊快,只需要比朋友跑得快一点。很多国内大厂在宣布自己又做这个,又做那个的时候,他的目标不一定是真的要超过美国,可能只是在割韭菜。

从产业角度上来看,在AI行业上不一定追得上,但有几件事仍然值得去做,比如,大基建,电池行业,5G。虽然大家都在提,好像5G和电池行业没怎么赚到钱,但这些方面为大基建提供了很多创新优势。我们想要解决卡脖子问题,不是在别人卡我们脖子的时候,去卡他的脖子,而是他卡你脖子,你掐他大腿,这样才有谈判权。

从2015年量子行业逐渐淡出,我更关注中国这十年最主要的问题是制造业怎么做。在2008年之后,欧美国家意识到金融、房地产难以为继,都在进行再工业化,恢复制造业。

今天中国制造业面临的困境是欧美封堵高端制造业,迅速崛起的东南亚和印度抢夺低端制造业,中国有可能被卡在高不成低不就的状态,这是中国现在制造业面临的核心问题。到现在为止,没有这么大的一个经济体能够顺利渡过中等收入陷阱,如果我们顺利突围,就是人类史上的奇迹,渡不过是正常,渡过才是奇迹。

所以我们希望作为智的主体,高校和科研院所能够把自己的研究能力,贡献给中国的制造业。不要通过科研成果落地,孵化一两个项目,最后创办上市公司,我们已经来不及零敲碎打地做,而是要为产业升级做服务。

作为社会堆积起来的公共主体,大学应该把心态摆正,公共主体的任务就是创造新知识,培养年轻人,是一个服务角色,让学界做学界的事,让产业界做产业的事,在产业界和学界之间搭建良好的沟通机制。只有具备全球竞争力,才能真正把制造业留在中国。

主持人:Sora出来的时候,网上很多人都在讨论,我们为什么落后得这么远,教育到底出了哪些问题?今年两会上也有人大代表提议,建议把人工智能纳入到义务教育当中,两位老师怎么看待这个问题?

尹烨:我认为学人工智能先学逻辑,没有逻辑是理解不了人工智能的。逻辑和数学已经是我们已知的最完备的两个东西了,没有这两个一切都没有用。逻辑是规则,不是规矩。如果凡事都要讲规矩就很麻烦,规矩是潜规则,潜规则换言之就是没规则,这肯定是不行的。

第一,一定要学的就是逻辑。所有孩子学编程,学人工智能,究其根本就是在学逻辑和基本的数学,而数学不要提前去教,学好扎实的运算,在运用逻辑的基础上自然就会。我们常吐槽,世上最难的不是汉译英,而是汉译汉,都是中国字却看不懂,就是不讲逻辑,这才是核心问题。

第二,要学好提示词(Prompt)。提示词高度依赖于语言,人工智能时代,不管是文生图还是文生视频,语言都会非常重要。古希腊的几何是文科,辩论是理科,比较有技术含量,辩论就是训练你的逻辑能力,而且是很短时间之内要融合你的演讲技巧,包括逻辑思维的训练,要把语言这个事好好学。

第三,鼓励大家情景式学习,一定要躬身入局。法布尔3岁就开始研究虫子,后来写出了《昆虫记》,如果没有机会亲近大自然,就不可能爱上生命科学。最近有一个新词叫厕所社交,学校课间10分钟不允许上操场,只允许上厕所,所以孩子们只能在厕所聊两句,这么下去会在人工智能时代培养出大量的人工智障。

最后一点,科学没有高低。科学家需要具备三个特质,第一充满好奇,第二不畏权威,第三不懂就问。从这个意义来讲,不能再强调小镇做题家,死记硬背,单一的应试教育,如果继续这么下去,我们肯定不会收获一个人工智能时代的未来。

不要因为人工智能火了,就要把人工智能纳入义务教育中,而是反复思考我们最缺的是什么,回归教育的本质,教育的本质不是灌输,是像雅斯贝尔斯所说:“教育的本质意味着,一棵树摇动另一棵树,一朵云推动另一朵云,一个灵魂唤醒另一个灵魂。”

马兆远:我们在重新架构到底教育应该是什么样子,尤其是动手能力的培养,机器可能没有办法完成多功能同时要实现的东西,从决策到实现将来可能是孩子们竞争力的体现。尤其有ChatGPT、Sora能帮你去实现很多想法的时候,怎么把东西做出来才重要,也就是所谓的第一性原理。

我们今天看到教育出现的问题,在小学阶段填鸭式教育,短时间之内把所有东西全部塞完,他们在疲于奔命把这门课所有东西按照说明书一步步做完,达到你要给他打的分数,限制了孩子自由探索的权利和时间。当他真正进入这行的时候,会发现学的那些东西都已经过时,该掌握的东西又没有掌握到。

今天高校重新开逻辑课,慢慢地灌输到中小学,有很长的路要走,但这是人类文明的起点。如果不学会逻辑,我们就永远在追满天飞的新名词,永远在追细枝末节,而不知道科学怎么发生,怎么演化,在未来会有哪些趋势。

主持人:当下,人工智能的人才其实非常稀缺,而且存在流动性大、成本高的问题,两位老师有什么好的对策和相关经验吗?

尹烨:人工智能不会是一个行业,而是跟各个行业相结合。企业过去用电脑记账叫电子化,后来连上网叫信息化,现在慢慢结构化,因为有结构的数据才能够进行训练,变成智能化。

回到人工智能三个基本支柱:算法、算力、数据。算法是高度依赖人才,越往上走拼的越是顶尖人才。贝佐斯曾说,如果有1000个地球就可能出现1000个爱因斯坦,可能人类就能在宇宙中走得更远,所以算法是高度依赖于人才。就数据来看,现在各大行业细分领域数据量是不够的,也不是每个行业领域都要学Sora,做文生视频,所以在垂直细分领域我认为中国很有机会。我们现在还是要务实,先回到大数据。

多学知识,少听道理,逻辑为先。有逻辑的道理可以听,没有逻辑的道理千万不要听,每个人的明天都是不确定的,我们只能做好今天确定的事情,而不是一门心思赶时髦。

马兆远:人工智能很难成为一个行业,更像是英文或者计算机语言一样作用工具,每个行业都用,反而垂直领域用起来会比单纯学人工智能的用得更熟。

至于人才培养,其实没有太好的办法,这个行业出现太快。20年前我和李飞飞认识的时候,是人工智能最冷的时代,我在牛津做量子计算,她说读物理太难,转去做人工智能,直到现在人工智能被推上风口浪尖。当年我念大学一直在说21世纪是生物学的世纪,那一届本科生很多去学生物,找工作发现一直在做博士后找不到工作。

职业判断是很难的。当你学会了一些基础之后,可以不断改变自己的职业,去适应变化的时代。我就是特别好的一个例子,在实验物理打下好的基础之后,可以在各个行业游走,比如人工智能就用到了随机矩阵,贝叶斯统计,马尔可夫矩阵,至于上面被套上了哪些名词,涌现、随机森林,底层的数学逻辑是一致的。

0 阅读:0

衷心书院

简介:感谢大家的关注