引言
胞间信号交流 (cell-cell communication, 简称 CCC) 是所有多细胞生物的基本功能之一。生物组织中存在着由多种细胞组成的复杂的三维空间结构,而其中存在着大量的复杂的CCC。因此利用机器学习手段建立分析模型成为解析CCC的重要手段。目前已有的分析模型主要是利用对单细胞测序数据(single cell RNA-sequencing)中已知配体-受体对的搜索来判断两个细胞间是否存在CCC。此类手段在逻辑上看似简单直接,但在应用上存在明显的缺陷。第一,此类工具深受配体-受体数据库(一般为蛋白到蛋白的结合的数据库)的限制,不可以用于预测由新的、未知的CCC。第二,配体和受体在不同细胞间的mRNA表达不等同于两者间的蛋白与蛋白结合。用这种蛋白到蛋白的结合数据库作为筛选的标准,并不适用于基于转录组的测序数据。于此对应,通过研究同一通道的下游基因的mRNA表达量,才能够更好的预测CCC的活跃程度。第三,大多数CCC推断工具不能够准确的在单细胞分辨率下分析CCC。
2024年9月3日,来自德克萨斯大学西南医学中心的王涛博士团队在Nature Methods上发表了标题为Mapping Cellular Interactions from Spatially Resolved Transcriptomics Data的文章。作者开发了名为Spacia的全新的多实例学习(Multi-instance learning) 模型,实现了在单细胞分辨率下对细胞信号交流的分析与推断。不同于其它方法,Spacia 的模型利用单细胞空间转录组 (single cell spatially resolved transcriptomics) 数据中的空间和基因表达信息将细胞信号传输问题转换成为多实例学习问题,再利用贝叶斯统计方法来实现模型的参数推断。Spacia不依赖于已知的配体-受体对,可以用于探索未知的CCC通道。同时,此模型可以预测单细胞之间的CCC,预测CCC中的正相关以及负相关基因表达关系,并且推测不同CCC的空间特征。
图1:Spacia模型简图。左:Spacia模型的输入输出数据;右:Spacia模型预测的CCC在组织体内的空间分布(Credit: Nature Methods)Spacia模型能够帮助研究者从各种生物学样品的单细胞空间转录组数据中获得新的知识。作者首先用Spacia模型分析了前列腺癌的肿瘤微环境。他们通过分析发现,癌细胞的上皮-间质转化过程(epithelial-mesenchymal transition,EMT)不仅被纤维化细胞诱导,还可以被周边免疫细胞激发。由于上皮间质转化过程通常和谱系可塑性变化(lineage plasticity)相关。前列腺癌细胞的谱系可塑性现在被认为是激素疗法抗药性的一个重要机理。作者们继续分析了来自这些间质细胞的CCC和不同癌细胞谱系的关系。研究发现,不同间质细胞可能会选择性诱导几种谱系,并且其诱导强度与细胞的空间分布具有强相关性。接着,作者利用Spacia对由PD-L1介导的肿瘤与CD8+ T细胞之间的信号交流进行了分析,对多种癌症建立了其独特的CD8-PDL1基因表达特征(CD8-PDL1 signature)。他们的后续分析中显示,此特征与病人的生存以及对免疫疗法的响应表现出高度一致性。此结果表明,Spacia可以通过对病人的肿瘤微环境的分析以帮助研究者探寻疾病的生物学机制,寻找新的疾病治疗的靶点,和预测各种治疗方案的效果。图2:Spacia模型对前列腺癌的肿瘤微环境分析结果。上:Spacia模型所预测的fibroblasts,endothelial cells,和B cells对肿瘤细胞EMT的激活作用强度的空间分布;左下:肿瘤细胞的EMT强度;右下:肿瘤细胞的谱系可塑性强度变化(Credit: Nature Methods)Spacia可以用于对目前市面上存在的多种空间转录组测序技术(MERSCOPE/Vizgen, Xenium and Visium HD/10X, 和CosMX/Nanostring)所产生的数据进行分析。除肿瘤学之外,Spacia在其他高度依赖复杂CCC的自身免疫病、传染病及生物发育等疾病模型与生理过程中也有着广泛的应用前景。参考文献
https://www.nature.com/articles/s41592-024-02408-1责编|探索君
排版|探索君
文章来源|“BioArt”
End