本周,Nature 发文列出 2024年值得关注的七项技术。这已是 Nature 连续第三年发布此类盘点文章,其中涉及生物学领域的几项技术不得不看。
图片来源:Nature 官网
拥抱未来:深度学习应用于蛋白设计
蛋白相关技术是生物学领域永恒的热点话题,Nature 也连续三年对其特别关注。
从最近三年里对相关技术的描述,可看出这项技术的突飞猛进。2022 年关注的是蛋白结构解析,2023 年关注的是单分子蛋白的序列解析 —— 显然,两者均与了解蛋白有关。今年关注的则是蛋白的应用:将深度学习应用于蛋白的设计。
其实,早在 20 年前华盛顿大学的 David Baker 团队就实现了蛋白设计合成领域中一项里程碑式的壮举。他们使用计算工具设计并合成出一种全新的球状蛋白 Top7。这个包含 93 个氨基酸的蛋白如设计中那样进行了折叠,并且是惰性的。尽管没有发挥任何有意义的生物功能,但它的诞生意味着蛋白序列设计和结构预测之中的秘密可以被不断迭代的算法所掌握。
Top7 图片来源:Baker Lab 官网
现在,de novo 的蛋白设计已成为一种实用工具,用于设计定制的酶和其他蛋白 —— 新蛋白一旦被设计出来,SPPS 和 NCL 等技术再应用于蛋白合成。华盛顿大学的生物化学家 Neil King 与 David Baker 合作,设计了基于蛋白载体的疫苗和药物。这在一年半前是完全不可能的事情。
图片来源:论文截图
显然,这项设计的突飞猛进应归功于算法的进步和数据的积累,前者有赖于人工智能和深度学习的推广普及,后者则依靠不断扩大的表明蛋白序列和结构关联的数据库。
过去的一年,使用大型语言模型(LLM)的 ChatGPT 等工具被人熟知,这些工具也可以用来处理蛋白序列,建立和调整现有的蛋白 —— 只不过需要重新定义「单词」和「句子」。
David Baker 的实验室开发了一个设计蛋白的软件 RFdiffusion,其他类似的工具也有很多几种。使用这些工具,科学家们能够设计出全新的蛋白来贴合感兴趣的靶点。靶点既可以是蛋白靶点,也可以是非蛋白靶点,如 DNA、小分子甚至金属离子。
图片来源:文献截图
在蛋白合成自动化的今天,蛋白的设计如果能借用深度学习实现自动化,新型功能蛋白将会层出不穷,工程酶、转录调节、功能性生物材料等领域也会开辟出新篇章,甚至酝酿诺奖。
改造命运:基于 CRISPR 技术的大片段 DNA 插入
提到诺奖,基因编辑技术是过去十年里也是最热门的生物学话题之一,CRISPR 技术的两位女发明人已在 2020 年分享诺贝尔化学奖。
图片来源:诺奖官网
Nature 同样连续三年对 CRISPR 技术给予特别关注。2022 年关注基于该技术的临床诊断,2023 年关注该技术如何能应用在更广阔的场景中,今年关注的则是大片段 DNA 的插入。
2023 年 12 月,美国 FDA 批准了首个基于 CRISPR 的基因编辑疗法 Casgevy,用于治疗 12 岁及以上镰状细胞贫血。上周,FDA 继续批准该疗法用于治疗 12 岁及以上输血依赖性 β-地中海贫血。这是基因编辑技术作为临床工具的硕果。
Casgevy 在 FDA 的备案信息 图片来源:FDA 官网
现有的 CRISPR 技术擅长引入小段 DNA 序列,包含数千个核苷酸的更大 DNA 序列的精确和可编程插入仍很困难,但新解决方案已令此变为现实。
CRISPR 技术原理 图片来源:塔夫茨大学官网
斯坦福大学的分子遗传学家丛乐博士和他的同事正在探索一种来自噬菌体的 DNA 精确重组酶 —— 单链退火蛋白(SSAP)。当它与活性丧失的 dCas9 系统结合后,可在 DNA 双链不断裂的情况下将 2000 个碱基的大片段 DNA 高效精准地定点插入。
图片来源:文献截图
无独有偶,MIT 的 Omar Abudayyeh 和 Jonathan Gootenberg 在 2022 年报道了一种通过特定靶向位点的可编程添加(Programmable Addition through Site-specific Targeting Elements,PASTE)技术,可精确插入多达 36000 个碱基的 DNA。
图片来源:文献截图
两种技术相比较,丛乐博士认为 PASTE 在体外修饰和培养患者来源的细胞中有广阔前景,而对于人体细胞的体内修饰,SSAP 可能提供了一个更优的解决方案,因为体积更大的 PASTE 需要三个单独的病毒载体才能进行递送,编辑效率上或许不如 SSAP。
基因编辑技术并不仅仅与人类健康有关。
中科院遗传与发育生物学研究所的高彩霞团队将之前自己开发的 ePPE(Engineered Plant Prime Editor)与刘如谦团队开发的 epegRNA(Engineered pegRNA)结合,在植物细胞内实现了最高效率可达 50% 以上的短片段 DNA 的精准定点插入。
团队将这种双系统与筛选出的高效的酪氨酸家族位点特异性重组酶 Cre 结合,开发出能实现大片段 DNA 精准插入的 PrimeRoot 系统,在水稻和玉米中精准定点插入的片段长度最长可达 11100 个碱基对,效率最高为 6%,且插入完全精准可预测。
图片来源:文献截图
这项技术可以用于赋予不同农作物抗病性和病原体抗性,高彩霞认为,PrimeRoot 系统可以应用于任何植物物种。
基因编辑的下一个诺奖,似乎并不遥远。
看见自己:人类细胞图谱计划
新上榜的人类细胞图谱计划(Human Cell Atlas,HCA)是继人类基因组计划之后最令学术界期待的又一科研盛事。
图片来源:HCA 官网
该计划愿景非常宏大,旨在全面了解人类身体中所有细胞类型的结构、功能、相互作用及其在健康和疾病状态下的变化。这无疑将改变人类对生物学和疾病的理解,并带来疾病诊断和治疗方式的重大进步。
作为一项开放的全球倡议,HCA 创立于 2016 年,由英国 Wellcome Sanger 研究所的 Sarah Teichmann 和美国著名生物技术公司 Genentech 的 Aviv Regev(当时在博德研究所)共同发起。目前计划合作单位包括来自全球 94 个国家 1500 多个科研单位的 2900 多名科学家,既有生物学家、临床医生、技术专家,也有物理学家、计算科学家、软件工程师和数学家。
2022 年,浙江大学医学院郭国骥团队使用自主研发的 Microwell-seq 单细胞分析平台,绘制出跨越胚胎和成年两个时期、涵盖八大系统的高分辨率人类细胞图谱,率先构建首个人类细胞图谱基本框架。
图片来源:Nature 官网
2022 年 5 月 13 日,Science 专门报道人类细胞图谱计划取得的一系列重大突破。四篇论文呈现出涵盖人体 33 个器官和系统,超过百万细胞级别的细胞图谱,这是对人类细胞多样性和空间分布的一次空前详尽的刻画。
当期封面 图片来源:Science 官网
2023 年 9 月,中科院深圳先进技术研究院李汉杰团队绘制出人体免疫系统发育图谱。通过自主搭建的单细胞转录组测序平台,结合生物信息学手段、多重免疫荧光染色、体外功能实验等技术,研究团队对发育中的 30 万个免疫细胞进行「解码」,成功构建出横跨 18 个发育阶段、19 中组织的人类胚胎免疫系统发育高分辨率图谱。
图片来源:文献截图
需要注意的是,HCA 只是人类细胞和分子图谱绘制的更恢弘系统的一部分。类似的计划还有 NIH 资助的人类生物分子图谱计划(The Human BioMolecular Atlas Program,HuBMAP),以及脑科学计划(Brain Research through Advancing Innovative Neurotechnologies,BRAIN)中准备全面构建人类大脑单细胞图谱的 BICCN 计划(BRAIN Initiative Cell Census Network),还有由艾伦研究所资助的 Allen Brain Map。
HuBMAP 介绍 图片来源:NIH 官网
尽管上述细胞图谱计划均有丰硕成果,但要彻底完成人类细胞全图谱的绘制仍尚待时日。可以预见,当这一盛举完成之时,科研产出将是无价的!
自 1962 年 DNA 双螺旋结构研究斩获诺奖以来,与基因有关的诺奖层出不穷,细胞图谱的绘制必然会在诺奖中增加一个热门大项。
前述三项技术与生物学深度相关,其他四项值得关注的技术还包括脑机接口、超高分辨率显微成像、3D 打印纳米材料和 Deepfake 检测。与前两年相比,信息与计算科学技术,尤其是人工智能的进步成为融合创新的核心支撑。
2024 年已经来了,你对本领域的哪些技术充满期待呢?