引言
胞间信号交流 (cell-cell communication, 简称 CCC) 是所有多细胞生物的基本功能之一。生物组织中存在着由多种细胞组成的复杂的三维空间结构,而其中存在着大量的复杂的CCC。因此利用机器学习手段建立分析模型成为解析CCC的重要手段。目前已有的分析模型主要是利用对单细胞测序数据(single cell RNA-sequencing)中已知配体-受体对的搜索来判断两个细胞间是否存在CCC。此类手段在逻辑上看似简单直接,但在应用上存在明显的缺陷。第一,此类工具深受配体-受体数据库(一般为蛋白到蛋白的结合的数据库)的限制,不可以用于预测由新的、未知的CCC。第二,配体和受体在不同细胞间的mRNA表达不等同于两者间的蛋白与蛋白结合。用这种蛋白到蛋白的结合数据库作为筛选的标准,并不适用于基于转录组的测序数据。于此对应,通过研究同一通道的下游基因的mRNA表达量,才能够更好的预测CCC的活跃程度。第三,大多数CCC推断工具不能够准确的在单细胞分辨率下分析CCC。
2024年9月3日,来自德克萨斯大学西南医学中心的王涛博士团队在Nature Methods上发表了标题为Mapping Cellular Interactions from Spatially Resolved Transcriptomics Data的文章。作者开发了名为Spacia的全新的多实例学习(Multi-instance learning) 模型,实现了在单细胞分辨率下对细胞信号交流的分析与推断。不同于其它方法,Spacia 的模型利用单细胞空间转录组 (single cell spatially resolved transcriptomics) 数据中的空间和基因表达信息将细胞信号传输问题转换成为多实例学习问题,再利用贝叶斯统计方法来实现模型的参数推断。Spacia不依赖于已知的配体-受体对,可以用于探索未知的CCC通道。同时,此模型可以预测单细胞之间的CCC,预测CCC中的正相关以及负相关基因表达关系,并且推测不同CCC的空间特征。
参考文献
https://www.nature.com/articles/s41592-024-02408-1责编|探索君
排版|探索君
文章来源|“BioArt”
End