我们都在讲该做什么,做什么是正确的事,很多人谈到当下是AI+BT的时代,这里来重点谈一下BT,也就是Biotech(生物技术)。
我们史无前例的站到了一个历史上最好的一个时代,来讨论两者的融合。亚瑟克拉克有一句话:任何足够先进的科技都与魔法无异。
94年出现的互联网,99年完成的第一个人的基因组,一直到去年的ChatGPT sora一直走到了今天。我们看到了几个最伟大的技术,在这一个点开始融汇了。这是智人第一次如此高密度的接受我们知识信息技术科学的爆炸。
今年的诺贝尔生理学和医学奖还是坚守在了生命科学的领域,物理奖他给了机器学习,化学奖给了蛋白质结构预测。AI控没控制人类不知道,但是他绑架了诺贝尔奖评委。
我们看到了人类的科学的范式正在改变。从过去的观察和实验,从过去的数学驱动、计算驱动再走向大数据驱动。今天看到了第五范式AI驱动,所以现在已经不是所谓的AI for Science,而是AI is Science,今天的AI就是科学,它已经开始史无前例的在推动着我们人类科学的进步,在向前突破着。
如果生命是一个语言,我们用不同的编程语言再去做programming。但是我们作为生命,其实共享了一套语言叫基因的语言。一个人有37万亿个细胞,每个细胞里有60亿个碱基对。但它的底层就是四个字符,ATCG。水稻4亿个碱基对,大肠杆菌400万个,新冠病毒3万个,然而新冠病毒也可以侵入到人体,因为我们底层的语言是一样的。
生命如此美妙,我们却知之甚少,我们终究会开始学习我们自己身边的语言,基因语言的作用广泛,肿瘤是基因病,罕见病是基因病,乃至大家吃的药。我们能不能喝酒、喝咖啡,是快代谢还是慢代谢,这些都是基因决定。
基因测序大家可以考虑去做一下,因为这个时间,这个基因域的成本,再加上今天的AI辅助的帮助,使得我们今天不用再花十年的时间去当一个遗传咨询师。每一个人都可以借助AI的提示来帮助我们更好的去解读我们的生命密码。
人类迄今为止有一种技术,它的成本下降速度是最快的。有一个下降了1000万倍的技术,基因测序。
摩尔定律,每18个月我们的晶体管密度高一倍,而成本下降一半。今天我们大部分的手机,最新一代的都用到了3纳米的制程,台积电或者说阿斯麦。再往前准备的是14A,1.4个纳米,14个埃的一个光刻。只要我们还没有切割原子,我们至少在这一代的我们以硅基作为GPU、CPU等等这种它的一个摩尔定律还在起效。
DNA,1个人的全基因组的测序成本。第一个人从1990年测到2003年才测完,13年时间大概有美英日德法中六个国家八千多个人,花了38亿美元,只完成了一个人的基因组。
而今天一个人试剂成本99美元,全部数据给你2000人民币以内,时间五分钟,一个人样本可以是血,甚至是唾液,我们就可以把你全部的基础训练给到你。所以可能我们大家更多的考虑的语义,我叫NLP,我们叫自然语义处理,那叫人类的语言。那不是natural language,那是human language。
什么是真正的natural language?我们所有的万千物种就是以DNA为连接的。我们这个领域的光刻机叫做测序仪。华大有全世界目前通量最高的测序仪,一年5万个人,一个人的试剂成本99美元。华大智造在2023年2月发布的,今天,美国也没追上来。
我们不是所有的领域都落后,或者说都要看别人的脸色。在一部分领域我们已经实现了并跑,甚至是领跑。两年前华大与美国这个领域最大的一家友商打专利官司,他赔了华大3.338亿的和解款,这是底层。
能不能在发达国家凭知识产权赢得尊重最为关键。有的时候我们一味谈应用谈落地,其实还需要有人去仰望星空。思想如果不起来,如果只在商业模式上创新,很难能在科技上赢得全世界的尊重,如果我们对科学无贡献,只是在应用上去争取利润,这样的商业文明不够值得夸耀。
当我们今天讨论我们中国的科技在底层要引领的时候应该去看一看,不管你在高校,在研究所,在大学,在创业公司,到底这个公司有没有这个行业的根本的制霸力,核心在于能不能自己造硬件。如果你是玩IT的,芯片是不是你的;如果你是玩软件的,底层的代码是不是你的;如果你是玩农业的,种子是不是你的;如果你做益生菌,菌株是不是你的;如果你做测序,测序仪是不是你的。不掌握基本生产工具和工业母机的这个权利,你就没有办法在长时间的长跑当中能引领。
所以如果你到了一个实验室,实验设备都来自发达国家进口,你只能是一流,绝不是顶尖。因为最好的硬件你根本就买不到,他不卖给你,而且往往最好的硬件也意味着他不成熟。所以真的要在科技研,就要看底层是不是你自己。
希望大家不要对生物有刻板的印象,觉得我们今天的实验室还是试管、烧杯、白大褂,那是万恶的旧社会。希望我们的孩子学会了生命科学,应该在更高科技的环境下去工作。
现在大家反复讨论的scaling law标度律,它的背景是大刘的《三体》。一部伟大的科幻作品会常常引发一个民族、一个国家50年的科学振兴。刘慈欣的一部《三体》让无数人爱上了天体,爱上了物理。
暴力确实能出奇迹,从生命的角度来看它就是这样的。类比三个动物的脑,小鼠脑就是黄豆那么大,猴脑有拳头那么大,而人脑是1400毫升。小鼠有7000万个神经元,猴脑是60亿个神经元,人脑860亿个神经元。我们的额叶新皮层130亿到180亿个神经元,每一个神经元还能跟周围的几百个神经元产生连接。这就是堆CPU,堆GPU,我们堆神经元。
当你从7000万个神经元堆到了860亿个神经元的时候,你就从小鼠的认知变成了人类的智能。这也就是说至少标度律在一定的层面上,它不是所谓今天因为玩了AI才是这么做的。生命早就等在那儿了,可能还能持续的变大。
正如先发散后收敛,先训练后推理。我们记不住大概两岁三岁以前的任何的记忆,因为人的大脑的神经元连接在三岁以前是快速的发散,然后迅速的收敛。我们今天只记住了应该记住的东西,大脑的本身是集约的。
标度律会走多远还不确定,但GPU不可能是我们计算的终极状态,搬电子还是太累了。应该逐渐学会去搬光子、玻色子、费米子。我们今天看到的大脑,大脑不搬电子,大脑搬的是磁。我们今天测到的是脑电,大脑的工作是脑磁。
别忘了还有量子计算,还有光子计算,还有类脑计算。我们仅仅通过在摩尔定律推到极限的GPU这条路可能在某一天会走到它的物理终结,但是标度率这件事情在一定范围内它依然还会起到它的效果。
测序业内也对比过一句话,标度律告诉我们,没钱调算法,有钱买显卡。在我们基因测序的行列,没钱挖数据,有钱多测序。别去猜所谓的什刹海里面有多少条鱼,要有本事把水放干了数一下,这就叫大数据。Full data is big data, 全数据才是大数据。
大家常问到,吃什么东西对胃好,其实应该换一个角度思考,什么都不吃对胃特别好,嘴爽了胃、肠子可能都不爽。真正养生的方法基本上不花钱,就怕你们知道,做不到还不如不知道。
第一件事情调好嘴,吃饭的时候先吃沙拉水果,再吃蛋白碳水。我先把胃撑起来,用果胶把胃撑大再给点果糖去竞争葡萄糖。
接下来迈开腿,泛指的迈开腿动起来就行了。一天7000步到9000步就有获益。即使没有这么长时间,每隔1个小时快速的原地高抬腿跑一分钟获益。当然最好的运动挥拍,网球、羽毛球、乒乓球都很好,两手交替打。
第三件事情,在座的各位是要睡好觉。我们绝大部分的慢性病就从睡不好觉开始,别熬夜,熬夜就是熬命。注意,如果你是有一个伟大的目标,你要去完成一个工作,你可以熬夜。因为这个时候你会有成就感,你会被你的内啡肽滋养,我们叫你进入到了你的心流状态。
这个时候累身不累心不要紧,就怕你没什么事,天天刷这种无厘头的短视频,越刷越进入到一个信息茧房,刷着刷着就睡不着觉了。所以当你睡不好觉的时候,解两道偏微分方程,背50个单词,来两篇古文,马上就能睡着。所以在某种程度上讲,要让自己不断的去提升自己,来对抗我们所谓的这些信息垃圾。
第四个,做好事热情以善,越来越多的文件证明,年轻时候做的好事儿会对一生的成就终身滋养。你就算你做坏事儿,也请你保持好心情,一定要乐天,一定要开心的活着。
我们现在全世界有80亿人,平均寿命七十三,中国78.9,北京已经83了。极端长寿的定义,现在是105、100岁都不行了。我们看了好多个这样百岁超级长寿,105岁的它的量表统计基因都好,生化指标都好。
你说生活习惯那真的是不怎么好。抽烟、喝酒,天天吃咸菜,还有只吃肉不吃菜的。还有个老爷爷特别有意思,每天早晨把孙男弟女叫过来骂一顿,自己很高兴。但大家孙男弟女都学会了配合,他在这个歌中大家也形成一种和谐。
其实最高的境界并非是乐观,而是达观。悲观的反义词词是不悲观,不是乐观,乐观的反义词是不乐观而不是悲观。达观,不以物喜,不以己悲。
尽量去做一个自己特别笃定的人,不要活在别人的评价里。换言之,有人怼你的时候,想一想我们这些人哪个人没挨过网暴,但是如果都没有人怼你,那你这个人生活着还有什么意思呢?
在探索自然的奥妙中,我们常常因为生命的玄妙而震撼、而感动。比如说道法自然,生命是如何实现的?超低能耗的能量转换、物质合成、信息传递的,今天的IT做不到,一克DNA能存的数据量是455个EB,Exabyte,这都是差10亿倍的一个关系。所以与其人类自研,不如道法自然。希望大家能更多的从生命中去学到有意思的答案。
1543年,当哥白尼写出了《天球运行论》,我们已经知道了地球不是宇宙的几何中心,能不能把地球变成宇宙的精神中心,让科技向善呢?地球可以没有人类,人类却不能没有地球,别在那天天说我们保护地球,地球不用你保护,我们唯一能保护的其实就是人类自己。46年前我们不懂试管技术,后来我们发明了试管婴儿技术,800万个孩子就此而诞生,基因技术来确保每个试管婴儿是健康的。
在五年前,我们都觉得罕见病没法治愈,但今天我们用这样的方式可以修改很多上帝开的玩笑。比如说我们已经可以用自体的造血干细胞拿出来,改好了再回输,不要供体了,我们可以用这样的方式去治疗像地中海贫血、镰刀型贫血这样的血红蛋白病。
十年前我们水稻只能种一茬割一茬,但今天多年生稻已经香飘全球,像韭菜一样的水稻种一次可以连续收割九年,十八季。这样的东西已经出来了。十年前我们觉得沙漠很难治理,而今天我们用生物技术已经能让大地复绿了。这是在塔克拉玛干,我们用沙膜技术让这片沙漠长出了牧草。
14年前我们知道了人类的肠道菌群很重要,一篇nature的封面是华大的益生菌。而今天我们知道的植物,它的根系一样需要共菌群,大豆自己固不了氮,大豆是靠它的根瘤菌固氮的,所以如果我们可以早一点给大豆用上这些益生菌,大豆就会长得更好。
18年前我们不知道成人细胞能不能逆转,而今天大家的免疫细胞、干细胞都可以青春常驻,甚至在细胞层面上可以返老还童。推荐大家要把自己的年轻时候的细胞存起来,就像存钱一样去把大家的命存好。我自己就已经回输了我自己的三次的免疫细胞。因为华大有一句话,任何技术要用你自己先用。
1979年我们告别了天花,然而这两年猴痘又来了,摁了葫芦会起来瓢。归根结底是人定顺天,而绝非人定胜天。我们心中当有敬畏。
什么叫技术?在过去异想天开,看今天勉为其难,未来习以为常,这样的事物我们就叫技术。然而我们知道的越多,我们不知道的就更多。
须知我们还要考虑法律、道德,包括文化、宗教。做生命科学的要特别重视伦理。华大伦理课第一句话,没有科技的人文可能是愚昧的,但没有人文的科技一定是危险的。毕竟科技只能决定人类奔跑的速度,而爱文明和美才能决定我们奔跑的方向,希望我们向上向善。