文献解读|梨T2T水平参考基因组揭示片段化和全基因组复制驱动的基因组进化

元莘生物 2024-09-10 14:18:54

导语

梨是蔷薇科植物中分布广泛的一员,栽培历史悠久,有22多个品种,5000多个品种,具有不同的形态、生理和适应特征。当前,已有8个梨基因组发布在GDR(蔷薇科基因组数据库)和NCBI。这些基因组促进了功能基因组学的发展,进一步指导了梨的育种。然而,由于技术的限制,梨的基因组中仍然存在许多空白,导致遗传信息的丢失,限制了我们对梨基因组结构和进化的认识。今天,小编给大家分享的文章是近期发表在《Horticulture Research》上的一篇文章,文章以砂梨代表性品种“云红1号”为研究材料,建立了国际上首个梨T2T水平高质量无缺口基因组。并且,该文章利用组装后的基因组揭示了片段化复制和全基因组复制驱动的重复基因形成及功能分化,并进一步探究了重复基因功能分化对梨果实重要性状的调控机制。

文献标题:Telomere-to-telomere pear (Pyrus pyrifolia) reference genome reveals segmental and whole genome duplication driving genome evolution

发表期刊:Horticulture Research

影响因子:8.7

发表时间:2023.10.12

测序策略:Illumina(~65x)+PacBio HiFi(~43x)+ONT ultra-long(~152x)+Hi-C(~107 x)

研究思路

研究结果

1. “云红1号”T2T无间隙参考基因组

“云红1号”(YH1)隶属于梨属,是云南原产的砂梨地方品种,也是亚洲红皮梨的代表。该研究为了生成端粒到端粒(T2T)水平的基因组,结合多种测序技术,包括Illumina、PacBio HiFi、ONT ultra-long和Hi-C,最终得到了基因组大小为501.20 Mb的gap-free基因组,contig N50为29.26 Mb。基于重复序列预测出全部着丝粒及端粒区域,基因组17条染色体均达到T2T水平。使用多种方法评估YH1基因组的完整性,二代短读长映射到基因组,发现基因组覆盖率高达99.97%;BUSCO评估结果显示核心基因完整度为99.00%;Merqury计算得出基因组碱基调用准确率高于99.99%。基因组注释结果显示,经注释的基因集捕获了1614个BUSCOs参考基因集的98.00%,高于先前发布的梨基因组。以上结果都表明该研究组装的得到的YH1砂梨T2T水平基因组的高质量和完整性。

2. YH1的T2T基因组与之前两个梨基因组的比较

与之前公布的“翠冠”和“Nijisseiki”的基因组相比,YH1基因组的完整性、连续性和准确性都有了显著的提高。主要的改进在gaps数,“翠冠”中发现了442个gaps,“Nijisseiki”中发现了76个。该研究还鉴定了三个砂梨基因组之间的变异,发现了大量SNP和结构变异(SVs,包括插入、缺失、易位和倒位)。在YH1与“翠冠”或“Nijisseiki”之间发现的变异比在“翠冠”与“Nijisseiki”之间发现的变异要多得多。这些变异可能会改变基因结构和调控区域,从而可能导致梨品种间的表型差异。

3.片段化重复对梨基因组进化的影响

SDs是长度大于1kb的重复DNA序列,在基因组内具有至少90%的核苷酸同源性。SDs是基因组不稳定的热点,可导致基因拷贝数变异和功能创新。SD区域占YH1基因组序列的10.76%(53.94 Mb / 501.20 Mb),6.27%的SDs(1035 / 16,504)大于10 kb。发生在染色体间的SDs占78.14%(12,896 / 16,504),高于发生在染色体内的SDs(3608 / 16 504)。染色体内SDs的平均长度(7732.52 bp)高于染色体间SDs的平均长度(2307.69 bp)。染色体内SDs比染色体间SDs具有更高的序列同一性。计算重复基因的Ks值,作为其相应SD生成时间的代用指标。结果显示,58.85%(901 / 1531)的重复基因对的Ks值低于0.15,表明这些基因重复发生在最近的WGD事件之后。染色体间SDs的重复基因Ks值(平均Ks = 0.26)显著高于染色体内SDs的重复基因Ks值(平均Ks = 0.20)(p值= 1.96e-07, Wilcoxon秩和检验)。因此,SD在基因复制和梨基因组进化中发挥了重要作用。KEGG通路富集分析表明,SD复制基因主要富集在类黄酮、苯丙素生物合成、淀粉和蔗糖代谢等通路中,可能参与应激反应。

4.基因复制后的表达分化

为了揭示梨中重复基因的差异,鉴定了重复基因,然后利用转录组和WGBS数据评估了重复基因在转录和甲基化水平上的差异。共鉴定出1531对SD基因对和12,256对WGD基因对。与随机基因对相比,SD或WGD基因对与表达水平高度相关。WGD基因对的Ks峰值约为0.15,大于SD基因对的Ks峰值。这表明大部分的SD基因对出现在最近的一次WGD事件之后。较高比例的SD基因的Ka/Ks值大于1,表明更多的SD基因处于正选择压力之下。甲基化水平的变化可调控基因表达。对重复基因的甲基化水平(CG、CHG和CHH)进行了量化,发现在SD和WGD基因对的三个基因类别(AED、Sub、和NoDiff)中出现不同的甲基化模式。许多AED和Sub基因已被证明与果实发育和质量有关。这些结果表明,重复基因的分化可以产生新的理想性状,为梨的育种提供了遗传资源。

5.MYB10和 MYB114的复制和功能分化

在这项研究中,从YH1基因组中发现了三个MYB10基因和两个MYB114基因的拷贝,每对拷贝都表现出强烈的非对称基因表达模式。在去核果皮样本中,MYB10-2基因比其他两个拷贝(MYB10-1和MYB10-3)的表达量更高。MYB10-2基因在果皮样品中的表达量高于其他两个拷贝(MYB10-1和MYB10-3)。此外,只有MYB114-2在果皮样品中表达。MYB114-1在所有样本中均呈低表达水平(TPM值小于0.2)。WGCNA分析表明,MYB10-2和MYB114-2与CHS、DFR、ANS和UFGT等花青素生物合成相关基因共表达,证明MYB10-2和MYB114-2是花青素生物合成的重要调控因子。利用9个蔷薇科主要物种的基因组序列进行系统发育分析,结果显示砂梨P. pyrifolia、杜梨Pyrus betulifolia、苹果Malus domestica、无毛山楂Crataegus pinnatifida和花楸树Sorbus pohuashanensis中的MYB10拷贝分布在三个支系中,而碧桃Prunus persica中的三个MYB10则聚成了另一个支系,表明碧桃P. persica的MYB10复制事件可能在最近经历WGD事件的其他物种中并不常见。在苹果、砂梨、杜梨、花楸树和毛山楂的基因组中,发现了一至四个MYB114的拷贝,并且所有来自梨属物种的MYB114拷贝被聚类为两个支系。梨中三个MYB10拷贝的Ks值在0.17至0.19之间,与最近一次WGD事件的Ks值峰值重叠,表明MYB10基因的复制可能发生在那次WGD事件中。两个MYB114拷贝的Ks值表明,MYB114复制可能发生在梨和苹果分化时期。这些结果表明,MYB10和MYB114经历了不同的基因复制事件,降低基因表达可能有助于保留梨中的拷贝。

研究总结

该报道了红皮梨“云红1号”(YH1)的端粒到端粒(T2T)无间隙基因组。基因组长501.20 Mb,Contig N50长为29.26 Mb。所有17条染色体均组装至T2T水平,具有34个端粒,17个着丝粒。通过填补所有未封闭的缺口,YH1的完整性比之前的P.pyrifolia基因组(‘Cuiguan’和‘Nijisseiki’)显著提高。鉴定出1,531个片段重复(SD)驱动的重复基因,并在应激反应途径中富集。染色体内SD驱动了抗病基因的扩增,这表明SD在梨适应性进化中具有潜力。大部分重复基因表现出剂量效应或亚/新功能化,这可能影响农艺性状,如石细胞含量、糖含量和果皮赤褐色。“云红1号”T2T水平的基因组和相关遗传信息有助于对亚洲栽培梨进行品种改良。

参考文献

Sun M, Yao C, Shu Q, He Y, Chen G, Yang G, Xu S, Liu Y, Xue Z, Wu J. Telomere-to-telomere pear (Pyrus pyrifolia) reference genome reveals segmental and whole genome duplication driving genome evolution. Hortic Res. 2023 Oct 12;10(11):uhad201. doi: 10.1093/hr/uhad201. PMID: 38023478; PMCID: PMC10681005.

0 阅读:0

元莘生物

简介:专注于分子生物学好和高性能计算在医学领域的应用