引言
肿瘤新抗原研究的进展加速了肿瘤免疫疗法的开发,包括癌症疫苗、过继细胞疗法和抗体疗法。新抗原由肿瘤细胞基因突变产生,能激活T细胞反应,具有强免疫原性和肿瘤异质性。新一代测序和人工智能技术的进步使得快速识别和预测肿瘤新抗原成为可能。然而,识别引发强大T细胞免疫反应的新抗原仍然像大海捞针:其涉及三种高度多态性生物序列(TCR/抗原/HLA)的复杂相互作用,需要从大量序列组合中筛选出真正结合的TCR-抗原-HLA三元组;其次,构建物理上可解释且数据高效的预测方法对于增强对人类免疫反应的理解至关重要;此外,生物序列在个体中差异大,模型如何捕获残基相互作用内在模式并泛化到罕见的序列是一个重要问题。目前,仍缺乏全面的解决方案。
2024年9月27日,华东理工大学药学院、华东师范大学药学院、人工智能新药创智中心李洪林团队、华东师范大学计算机学院张凯团队,联合复旦大学类脑智能科学与技术研究院张捷团队、上海市第六人民医院胡晓勇团队等多家单位合作在Nature Machine Intelligence发表题为Sliding-attention transformer neural architecture for predicting T cell receptor-antigen-human leucocyte antigen binding 的研究论文。研究人员提出了“物理启发的Sliding-Transformer”算法—PISTE,用于TCR-抗原-HLA结合预测和肿瘤新抗原筛选。该算法在Transformer模型中引入了新颖的物理先验,以残基相互作用的梯度场为指引实现氨基酸残基的逐步定位,从而模拟两个(或更多个)生物序列相互滑动并形成亲和的虚拟过程,为探索TCR/抗原/HLA的复杂相互作用和人类免疫反应的分子基础提供了新的视角和方法。该算法达到了90%以上的精度,提供残基相互作用的清晰图景,并在临床相关的免疫应用方面显示出巨大潜力,为肿瘤新抗原筛选和个性化癌症疫苗研究提供了实用的工具。这项研究不仅体现了人工智能、药学、临床医学与计算科学的交叉融合,也展示了多学科团队合作在推动医学前沿研究中的重要作用。

图1. PISTE用于TCR-抗原- HLA结合预测和个性化新抗原筛选。(a)新抗原筛选的流程。(b)PISTE的网络结构,包含序列编码模块,滑动注意力模块和基于比对的池化模块(Credit: Nature Machine Intelligence)
模型预训性能
由于负样本的选择对于评估TCR-抗原-HLA识别模型的泛化性能至关重要,作者分别使用三种采样方法生成负样本,包括:random shuffling、unified peptide和reference TCR负采样。在两个外部测试集上,将PISTE与其他方法进行比较,采用了三种常用的评价指标,包括AUROC,AUPR,PPVn。结果表明,PISTE在三种场景下的均显著高于其他竞争方法。此外,作者使用PISTE作为工具来恢复和可视化参与不同结合结果的生物序列的分布。通过利用PISTE获得了对于3种特定pHLA复合物的不同TCR的低维表示并采用t-SNE聚类。结果表明PISTE可以捕获结合生物序列的共同属性和亚群的有用表示。揭示物理上有意义的残基水平相互作用
除了准确预测序列水平的结合状态外,PISTE还可以生成物理上有意义的注意力矩阵,揭示了残基水平的相互作用。作者收集了86个结合的TCR-抗原-HLA三元组及其3D结构,并专门检测了TCR-抗原接触关系和HLA-抗原接触关系。PISTE预测HLA-抗原相互作用矩阵与真实接触矩阵的相关系数为0.75,TCR-抗原相互作用残基关系矩阵的相关系数为0.916,证实了PISTE能够识别TCR、抗原和HLA分子之间复杂的相互作用模式。考虑到PISTE不需要任何3D结构数据进行训练,这是一个强有力的证据,为研究人类免疫反应的分子基础节省了大量的时间和实验成本。免疫学应用潜力
作者进一步证明了PISTE在几个免疫研究应用中的效用,包括:检测抗原特异性T细胞克隆。作者使用来自4个健康供体的44个肽- HLA复合物(pHLA)的10X单细胞TCR测序数据,调查了抗原特异性T细胞克隆与结合分数之间的关系。使用PISTE来预测单个T细胞与pHLAs之间的结合亲和力(分数),并记录了最强的分数,结果显示这些结合分数与T细胞克隆率呈正相关,表明对特定抗原表现出优越亲和力的T淋巴细胞对克隆扩增的偏好增加。TCR-抗原-HLA相互作用影响肿瘤进展和免疫治疗响应。作者通过使用SKCM和GBM队列,探讨了PISTE预测的免疫原性新抗原负荷作为生物标志物的潜力。免疫原性新抗原负荷(INAL)被描述为能够与TCR结合的突变肽的数量,其对应的野生型肽不诱导任何TCR相互作用。结果显示免疫原性新抗原负荷与SKCM和GBM患者的免疫治疗反应和总生存率相关,显著性高于肿瘤突变负荷(TML)和新抗原负荷(NAL)的对照组,表明PISTE预测的免疫原性新抗原负荷具有预后价值。前列腺癌新抗原的筛选和鉴定。作者结合生物信息学方法分析了8例接受手术治疗的前列腺癌患者的肿瘤全外显子组测序、肿瘤转录组测序和匹配的正常外显子组测序数据,然后利用PISTE预测TCR-新抗原-HLA相互作用,并根据结合结果筛选新抗原。对于每位患者,我们综合个性化排名前3-4位的新抗原,通过细胞水平实验验证了这些新抗原引起的免疫反应。结果显示,75%(6/8)的患者对PISTE预测和筛选的至少一种新抗原引起免疫应答,这表明,PISTE作为预测工具在肿瘤新抗原的识别和筛选中具有显著的有效性和实用性。总之,PISTE算法将物理/生物的先验规则与数据驱动的神经网络框架有机结合,实现了全新的Transformer的注意力机制:(1)位置编码的动态更新,有效模拟了残基沿其相互作用梯度场迭代移动的虚拟过程;(2)残基相互作用的计算,全面纳入了残基类型、残基位置和相互作用类型,使模型能够以更加接近第一性原理的方式从训练数据中提取信息。PISTE在预测TCR-抗原-HLA结合方面表现出色,是鉴定免疫原性新抗原的重要步骤。同时其为阐明人类免疫反应的分子基础和个性化新抗原筛选/优先排序方面具有极好的通用性,预示着在个性化免疫治疗和癌症疫苗开发领域的巨大潜力。此外,PISTE为分析和预测复杂生物分子相互作用的范例框架。参考文献
1. Xie, N., Shen, G., Gao, W. et al. Neoantigens: promising targets for cancer therapy. Sig Transduct Target Ther 8, 9 (2023).2. Katsikis, P.D., Ishii, K.J. & Schliehe, C. Challenges in developing personalized neoantigen cancer vaccines. Nat Rev Immunol 24, 213–227 (2024).3. Blass, E., Ott, P.A. Advances in the development of personalized neoantigen-based therapeutic cancer vaccines. Nat Rev Clin Oncol 18, 215–229 (2021).4. Wells, D. K., van Buuren, M. M., Dang, K. K., Hubbard-Lucey, V. M., Sheehan, K. C., Campbell, K. M., ... & Defranoux, N. A. Key parameters of tumor epitope immunogenicity revealed through a consortium approach improve neoantigen prediction. Cell 183(3), 818-834 (2020).5. Hudson, D., Fernandes, R.A., Basham, M. et al. Can we predict T cell specificity with digital biology and machine learning?. Nat Rev Immunol 23, 511–521 (2023).https://www.nature.com/articles/s42256-024-00901-y责编|探索君
排版|探索君
文章来源|“BioArt”
End
往期精选
围观
一文读透细胞死亡(Cell Death) | 24年Cell重磅综述(长文收藏版)热文
Cell | 是什么决定了细胞的大小?热文
Nature | 2024年值得关注的七项技术热文
Nature | 自身免疫性疾病能被治愈吗?科学家们终于看到了希望热文
CRISPR技术进化史 | 24年Cell综述