在人工智能的所有应用中,医疗行业位列首位
ChatGPT的发布引发了一波AI浪潮,而人工智能正站在驱动第四次科技革命的前沿,其强大的发展潜力预示着一个崭新的科技时代即将到来。
AI技术深度融入各行业带来创新突破,为产业升级和创新提供持续动力。在人工智能的所有应用中,医疗行业位列首位。黄仁勋在一场大会上直接喊出了:人人都必须学会计算机的时代过去了,人类生物学才是未来。英伟达已经在生命科学领域投入了大量的精力,包括打造生物医药的生成式AI平台 BioNeMo,目前已经有十多个AI模型,包括小分子建模工具、OpenFold 蛋白质预测模型,以及与Recursion开发的用于靶点和药物发现的Phenom-Beta模型等。
在3月18日英伟达GTC大会上,有90场活动与健康/生命科学相关,盖过了汽车、半导体、云服务等热门赛道,活动数目位居全行业第一。从过去的一年,英伟达也在用实际行动支持AI制药,2023年以来,英伟达已经投资了9家AI制药公司。
据中商产业研究院统计,2020 年 AI+医疗已占人工智能市场的18.9%。另据 IDC 统计数据,到 2025 年人工智能应用市场总值将达 1270 亿美元,其中医疗行业将占市场规模的五分之一。从基础层到应用层,医疗AI广阔市场大有所为。
AI技术对于研发、制造、医疗终端消费等多个场景都能够实现触达和价值赋能。从技术维度看,AI从供给端改变了医疗领域的发展轨迹和运行模式;从市场维度看,人工智能技术为现有医疗工作带来流程改进与效率提升。
通过AI为传统的医药产业链赋能,带来产业变革,而其价值体现在扩容(新产品)、降本(减少费用)、增效(提高效率)这三个方面。而商业模式分为平台服务、硬件设备、软件服务三个方向,各自有各自的核心壁垒。
AI可以大幅缩减药物研发周期,助力医药研发
AI制药的快速发展集中在2018伊始,国外以谷歌DeepMind,国内以英矽智能为首的公司相继为业内熟知,2020年行业进入加速发展期,资本开始大量涌入赛道,催化公司发展,业内合作纷纷建立。
相较于传统的药物发现过程,AI赋能在临床前发现阶段缩短药物研发周期,根据Exscientia的数据, 可平均节约药物合成时间40~60% ,降低研发成本,并提高研发成功率12%~14%。例如国内的AI制药龙头公司,英矽智能在临床前发现阶段的靶点发现到先导化合物的优化,只需要约18个月完成,总体投入不超过270万美金,而这个过程过去往往需要五年甚更长,并需要投入数亿美金。
目前药物研发和用药安全是AI技术在制药领域的主要应用, 其中靶点确认、分子生成是当前 AI 赋能的重点领域,化学反应设计是 AI 技术应用取得进展的环节之一。
AI 制药作为新兴领域,复杂多元,技术壁垒、人才壁垒高,当前市场参与者也呈现多元化格局,大型药企包括传统药企和 CRO 公司,互联网企业以及初创企业都依据各自的优势 快速切入布局当中。
从成立时间上看,中国分别在2018年和2021年分别迎来了一波创业潮,成立了几十家AI制药公司。技术领域上,主要还是集中在AI+小分子领域。另外,中国 AI+CRO 公司最大的创业背景仍然来自高校和研究机构的成果转化,是 AI 制药创新发展的源动力和引擎。
AI+蛋白质作为医药的主要分支,随着靶向药物、合成生物学的流行而越来越受到重视
AI蛋白结构结构预测领域两大开源模型:
2020 年 12 月,谷歌最新人工智能程序 AlphaFold2 成功基于氨基酸序列预测了生命基本分子——蛋白质的三维结构。AlphaFold 是由 Alphabets/Google 旗下的 DeepMind 开发的人工智能程序,它能够执行蛋白质结构的预测,该程序被设计为一个深度学习系统。AlphaFold AI 软件有两个主要版本。AlphaFold1 在 2018 年 12 月的第 13 届蛋白质结构预测技术关键评估(CASP)的总体排名中名列第一。AlphaFold2 在2020 年 11 月的 CASP 比赛中再次夺得第一名。AlphaFold2 对于蛋白质预测的准确度水平远高于任何其他团队和程序。2021 年 7 月 15 日,AlphaFold2 在《自然》杂志上作为开源软件和可搜索的物种蛋白质组数据库一起发布。即使在不知道相似结构的情况下,AI 也可以在原子层面上精确预测蛋白质结构。也就是说,之前备受关注的 AlphaFold2 终于开源了。
无独有偶,作为相当热门的研究领域,Science 同样在当月发表了一篇论文,介绍并开源了一个可媲美 AlphaFold2 的开源新工具 RoseTTAFold。从结构上来看,RoseTTAFold 是一个三轨(three-track)神经网络,意味着它可以兼顾蛋白质序列的模式、氨基酸如何相互作用以及蛋白质可能的三维结构。
大量公司和资本涌入AI+蛋白质领域:
2021年7月,人工智能公司DeepMind和欧洲生物信息研究所合作,完成了人类蛋白质组98.5%的蛋白质结构预测。蛋白质组学开始被各界视为开启精准医疗的钥匙,伴随而来的则是资本大量涌入、企业纷纷布局。互联网巨头Meta也卷入这场竞赛,用150亿参数语言模型,预测了6亿+蛋白质结构。
据不完全统计,目前中国AI蛋白质企业共有21家,根据技术主要分为三类:AI蛋白质预测、AI蛋白质设计和AI蛋白质组学,其中前两类占大多数。
但客观来讲,AI在蛋白质组学领域更多是用来分析数据,并不触达核心,真正的关键在于硬件平台,即产生数据的手段。
针对的下游需求基本上分为两种,AI蛋白质预测更加垂直一些,还是围绕在靶点这一块,基本上集中在药物研发领域;而AI蛋白质设计用途明显更多,为多种行业提供蛋白质产品,商业化机会更多。
值得注意的是,AI在蛋白质领域的突破,尤其是对酶的设计、改造使其活性、稳定性表现大幅提升,让不少合成生物学公司看到了新技术的潜力,一些企业研发出自己的计算平台,推动业务的发展。
综上,AI在制药领域的应用已经非常广泛,可以极大的缩短新药研发的周期,目前应用的环节主要集中在靶点确认、分子生成和化学反应设计,针对的药物类型以小分子药物为主,多采AI+CRO的业物模式。在AI蛋白质组学领域,也有大量的创业者和资本涌入,主要集中在蛋白质结构预测、蛋白质设计等领域。当然,AI制药的发展还面临着诸多挑战和困难。例如,数据的质量和数量对AI算法的准确性至关重要;此外,AI算法的可靠性和可解释性也是亟待解决的问题。然而,随着技术的不断进步和应用的不断深化,这些问题都将逐步得到解决。