许多细菌相关疾病,如炎症性肠病或结直肠癌,都与肠道细菌过度生长有关,而肠道细菌被认为是不良因素。但当研究人员使用机器学习算法从肠道微生物群中预测微生物密度(称为微生物负荷)时,他们发现微生物负荷的变化,而不是疾病,可能是导致疾病相关微生物物种出现的驱动因素。
研究人员于 2024 年 11 月 13 日在 Cell Press 杂志《Cell》上报告称,患者微生物负荷的差异是粪便样本中细菌特征的一个关键因素,即使在患病患者中也是如此,而患者微生物负荷受到年龄、性别、饮食、原籍国和抗生素使用等因素的影响。
“我们惊讶地发现,许多以前被认为与疾病有关的微生物物种,更能通过微生物负荷的变化来解释,”这项研究的资深作者之一、欧洲分子生物学实验室 (EMBL) 海德堡的 Peer Bork 说。“这表明这些物种主要与腹泻和便秘等症状有关,而不是与疾病本身直接相关。”
微生物负荷长期以来被认为是微生物组研究的一个重要因素,但由于实验方法成本高、劳动密集,大规模分析受到很大限制。研究人员利用机器学习方法克服了这一问题。他们开发了一种基于相对微生物组组成的粪便微生物负荷预测模型,并将其应用于大规模宏基因组数据集,以探索其在健康和疾病中的变化。
“测量粪便样本中的微生物负荷需要付出很多努力,我们很高兴能够获得两个大型宏基因组数据集,其中微生物负荷是通过实验测量的,”同样来自 EMBL 的 Michael Kuhn 和这项研究的另一位资深作者说。“通过我们的方法,我们希望将这些数据推广到更大的领域,并且通过我们提供的工具,可以预测所有成年人肠道微生物组研究的微生物负荷。”
该团队为这项研究生成的数据集包括欧盟资助的 GALAXY(酒精性肝纤维化中的肠肝轴)和诺和诺德基金会的 MicrobLiver 项目中的数千个宏基因组和实验测量的微生物负荷。他们还使用了之前公开的 MetaCardis 研究人群的宏基因组和微生物负荷数据。对于探索性数据集,他们使用了之前研究中的数万个宏基因组,包括来自日本和爱沙尼亚的人群。
研究团队承认这项研究存在局限性。由于分析仅基于关联,他们无法确定明确的因果关系方向,也无法提供机制见解。此外,所开发的方法仅适用于人类肠道微生物组:需要不同的训练数据集来预测其他栖息地的微生物负荷。
未来的研究将侧重于与疾病更直接相关的微生物物种,而不依赖于微生物负荷,以更好地了解它们在疾病病因中的作用及其作为生物标志物的潜在用途。此外,将这种预测模型应用于其他环境,如海洋和土壤微生物组,可以进一步深入了解全球范围内的微生物生态学。