尹烨解读前沿科研:罕见病药物研发太难?AI来帮忙预测候选药物

尹烨 2025-01-03 18:10:52

大家好,我是尹烨。今年的诺贝尔物理学奖和化学奖都颁给了人工智能,引发了很大的争议。很多人开玩笑,“AI 管没管住人类不知道,反正管住了诺贝尔奖评委会。”

但是我前段时间也给一个解读:“第五范式” ,一种新的 AI 驱动的科学范式是不是已经到来了?

所以现在已经不是简单的“ AI 为了科学”,而是“ AI 就是科学”。

今年获得诺贝尔化学奖的 AlphaFold ,到目前为止已经预测了超过 20 亿个蛋白质结构。人类 98.5%的蛋白质都已被它预测出来,当然不是完全验证完,只是预测了。但在此之前,几代结构生物学家努力了差不多半个世纪,人类才仅仅解析了约 20 万个蛋白质结构。

从 20 万到 20 亿,这是上万倍的效率差别。可以说我们过去很多医学研究、药物研究就像缓慢前进的马车,而 AI 的到来就相当于蒸汽机、电动机、火车的发明,突然加快了我们的行进速度,从而让我们整个的医学、药物、生命科学的研究的速度一日千里。

在当下医学领域中,有哪些领域是需要AI的大算力,包括借助AI智能的?

实我能看到的一个领域就是罕见病的药物研发。罕见病药物有一个外号叫“孤儿药”,什么意思呢?就是关心的人少,患病人数少,市场需求小,所以药物的研发难度就大,成本高、周期长。

所以罕见病患者长期都面临着药物短缺的问题,有些有药买不起,有些压根就没有药。差不多也只有5%的罕见病有对应的药物研究,而且很多也只能维持而无法治愈。这就是罕见病的治疗难度为什么居高不下的一个原因。

但你如果计算一下的话,比如全世界一年共有 9000 万个新生儿。就算发病率仅有 10 万分之 1 ,那每一年还有 900 个得病的孩子,就是 9000 万里面的 10 万分之 1 。

所罕见病并不罕见。每一种罕见病的患者固然少,但是所有罕见病加在起来已经差不多快8000种了。我国的罕见病患者的数量保守估计 2000 万到 3000 万,全球罕见病的患者不会少于三个亿。

那么用AI的大算力,用它的智能,能不能为罕见病药物研发做点什么?

最近哈佛学院的研究团队开发了一个叫 TxGNN 的AI模型,试图为罕见病寻找更多的有效潜在治疗药物。他们所采用的思路就叫“药物再利用”,意思就是老药新用。已经批准的药物上,有没有一些可以拓展的适用症。

其实药和病之间不是一一对应的,你比如说我们就是藿香正气水,它其实能管好多种不同的症状,所以药物往往是存在多效性,特别是有些靶点是多靶点的药物,可以用在不同的疾病上。

很多年前有一个药物叫沙利度胺( Thalidomide ),一开始是用于治疗孕妇怀上孩子后强烈的妊娠反应、孕吐。

后来发现使用这个药物会导致胎儿畸形,这个药物后来被下架了。但到了1964年,沙利度胺又重新被启用了,为什么呢?因为它还是有它的正向的因素,可以治疗麻风病相关的并发症,到2006年又可以被用于治疗多发性骨髓瘤。

所以这种药物再利用或者老药新用的优势就在于研发成本比较低。因为药物都是成熟的,相比于从零开始做化学药或生物药,所需资金更少。。第二,它的研发时间,尤其是上市时间就会变短。至少很多的成熟的药物已经通过了安全性、有效性评估。包括即使有它的局限性不良反应,也都评估的相对清楚。

就可以省去很多早期的临床实验的阶段,让药物迅速的在新适应症上有一个快速上市的途径。

这个哈佛团队就是使用 TxGNN 模型,在市面上已有的药物当中来寻找老药和新病之间的关系。

他是怎么做的呢?就算 AI 再厉害,也得有训练集,先做一个医学知识图谱来训练它。

这个知识图谱当中有 17080 种疾病的机制和 7957种 药物的机制。然后他们使用图神经网络模型(GNN),把这些疾病和药物扔到网络结构当中,然后让他们之间互相关联,自我优化,使它符合医学知识图谱当中的几何构造。

我们可以想象一下红楼梦里贾王史薛四大家族,将里面复杂的人际关系构成一幅图,差不多就是这个意思。

然后研究团队把AI模型给分成两个模块。第一个是预测模块,去预测药物的适应症,包括禁忌症。第二个是自解释模块,也就是如何进行预测的知识路径按照一个灰箱,最好是白箱的方式来明确它是根据怎样的方式把特定的疾病和药物联系到一起。

目前TxGNN有哪些预测成果呢?

一个例子是它预测了唑吡坦( Zolpidem ),这是一种常用的短效安眠药,但发现它可能对一种罕见的遗传病 Kleefstra 综合征有潜在的效用。Kleefstra 综合征是由一种由 EHMT1 基因突变引起的罕见病,会引起生长发育迟缓、智力障碍,包括导致自闭症谱系障碍等等。这个病没有特效治疗药物,而唑吡坦被AI推荐为头号候选药物。AI认为唑吡坦可能会降低自闭症的易感性,并改善我们的前额皮质,就是大脑的额叶这一部分的功能。

事实上以前已经有部分的医学证据支持,唑吡坦确实可以改善严重脑损伤或者神经发育障碍患者的语言能力、运动技能和警觉性。当然唑吡坦到底对治疗 Kleefstra 综合征是否有效,未来能否开放给对应药物,还需要更多的研究。但 AI 无疑大大地节省时间,提高了效率。

TxGNN 的预测成果还有很多,我就不一一去列举了,感兴趣的朋友可以去看看原文。

我经常说其实药物研发最大的失败,不是研发不出来,而是研发出来了患者却负担不起。未来在大算力的帮助下,罕见病的药物研发实际上有望进一步的降低成本,缩短研发周期,让罕见病药物摘掉“孤儿药”的帽子,也让更多的罕见病患者从无药可治到有药可医。

你认识多少种罕见病呢?怎么看待用 AI 来预测罕见病乃至未来的常见病、多发病的药物?欢迎您留言分享。

参考资料:

[1] Huang, K., Chandak, P., Wang, Q. et al. A foundation model for clinician-cntered drugrepurposing. Nat Med (2024). https://doi.org/10.1038/s41591-024-03233-xV

0 阅读:0