NatGenet|黄海亮/葛天合作开发跨人群精细映射(fine-...

小赵的备忘录 2024-08-28 11:42:41

引言

在过去的二十年里,全基因组关联分析(Genome-wide association studies,GWAS)在人类复杂性状或疾病的遗传分析中,取得了巨大成功。数以万计的疾病相关联基因组区域被研究者们发现。然而,由于基因组中的连锁不平衡(Linkage Disequilibrium, LD),这些区域很难被精确定位到具体的遗传突变位点。通常,这些区域会包含几十甚至上百个高度连锁且具有相似统计学显著性的突变位点,其中包括可能导致性状改变或致病的因果变异(causal variants)。精细映射方法能够进一步缩小GWAS结果的范围,并计算每个遗传变异是否为因果变异的后验概率,这将有助于后续研究揭示这些变异的具体功能【1-3】。

2024年8月26日,来自麻省理工学院-哈佛大学Broad研究所的黄海亮团队和葛天团队合作在Nature Genetics上发表了文章Fine-mapping across diverse ancestries drives the discovery of putative causal variants underlying human complex traits and diseases,共同开发了一项精准高效的跨人群精细映射分析工具——SuSiEx,此工具通过整合不同人群(如亚洲、非洲、欧洲等)遗传多样性,有效提升了精细映射方法的检测效力,精度和分辨率。通过使用该方法,研究者从GWAS结果中,发现了更多的候选因果变异,提升了研究的精度和分辨率。

SuSiEx是基于单群体精细映射分析模型SuSiE(Sum of Single Effects)【4】的拓展。SuSiEx假设因果变异在人群中是共享的,即某个突变是否为因果变异与人群无关,但考虑到环境等非遗传因素的影响,模型允许这些变异在不同群体中的效应有所不同。与SuSiE类似,SuSiEx基于贝叶斯变量选择,并将迭代贝叶斯逐步选择应用于模型拟合。此外,SuSiEx还估计因果关系出现在每个群体中的概率,并利用这些概率推断群体特异性的因果突变。

精细映射分析一览(Credit: Nature Genetics)

研究者首先进行了一系列全面的模拟,系统评估了SuSiEx的性能。通过改变群体间遗传相关性、因果突变数量、遗传力等模拟参数,从多个角度(如检测效力、覆盖度、准确度、分辨率、鲁棒性等)对SuSiEx进行了评估。模拟结果表明,SuSiEx在覆盖度、准确度和鲁棒性方面表现出色,并且相比单群体精细映射方法,SuSiEx具有更高的检测效力和分辨率。接下来,研究者将SuSiEx与其他现有方法(如单群体精细映射合并分析方法、基于元分析的精细映射方法、贝叶斯跨群体精细映射分析方法)进行比较,结果显示SuSiEx在易用性、分辨率和准确度等方面表现更佳。随后,研究者将SuSiEx应用于不同人群生物样本库的数据分析。具体而言,他们将该方法应用于英国生物银行(UK Biobank)的欧洲人和非洲人群体数据,以及台湾生物银行(Taiwan Biobank)的东亚人群体数据。研究者筛选出25个在这两个数据库中共有的数量性状,并选出13,420个可能包含因果变异的基因组区域。通过使用SuSiEx分析三个人群的数据,研究人员共发现了14,361个99%置信集合(credible set),即该集合有99%概率包含因果突变。与仅使用单一人群数据的精细映射分析相比,SuSiEx在跨人群数据分析中发现了更多置信集合,其最佳位点的后验包含概率(Posterior Inclusion Probability, PIP)也更高,且后验包含概率大于95%的置信集合数量也显著增加。这些结果都凸显了SuSiEx方法及其在跨人群精细映射分析中的优越性。最后,研究人员利用SuSiEx对精神分裂症进行了精细映射研究。他们使用了“精神类疾病基因组学研究联盟(Psychiatric Genomics Consortium, PGC)”提供的欧洲人和东亚人群体的精神分裂症GWAS汇总统计量和连锁不平衡信息【5】。SuSiEx在193个基因组关联区域中成功识别出215个99%置信度的置信集合,其中213个被推断为欧洲人群中的因果突变,95个被推断为东亚人群中的因果突变。在这213个置信集合中,有11个包含后验包含概率大于95%的突变位点。与预期一致,SuSiEx的表现优于已发布的PGC精细映射分析结果。总体而言,文章介绍了一种精准高效的跨人群精细映射分析工具SuSiEx。通过整合多人群数据、明确建模群体特异性等位基因频率和连锁不平衡模式,SuSiEx发现了基因组中的更多因果变体,并可使用GWAS汇总统计量进行分析。

参考文献

1. Huang, H. et al. Fine-mapping inflammatory bowel disease loci to single-variant resolution. Nature 547, 173–178 (2017).2. Maller, J. B. et al. Bayesian refinement of association signals for 14 loci in 3 common diseases. Nat. Genet. 44, 1294–1301 (2012).3. Cortes, A. et al. Identification of multiple risk variants for ankylosing spondylitis through high-density genotyping of immune-related loci. Nat. Genet. 45, 730–738 (2013).4. Wang, G., Sarkar, A., Carbonetto, P. & Stephens, M. A simple new approach to variable selection in regression, with application to genetic fine mapping. J. R. Stat. Soc. Series B Stat. Methodol. 82, 1273–1300 (2020).5. Trubetskoy, V., Pardiñas, A.F., Qi, T. et al. Mapping genomic loci implicates genes and synaptic biology in schizophrenia. Nature 604, 502–508 (2022).https://doi.org/10.1038/s41588-024-01870-zhttps://github.com/getian107/SuSiEx

责编|探索君

排版|探索君

文章来源|“BioArt”

End

0 阅读:0