引言
在基因组中,转录因子(transcription factors, TFs)通过特定序列的结合位点来调控基因表达。然而,不同TFs在基因启动子(promoters)和增强子(enhancers)中的结合位点常常呈现出相似的组合,这些结合位点如何编码多种重叠的基因表达程序仍然是一个重要的研究课题。每个细胞都以独特的方式解释相同的基因组,这一过程的核心是序列特异性TFs,它们通过解读基因组中的调控序列语法来组织调控程序。然而,这些调控程序是如何编码的仍然大多不明。许多调控元件包含相似的TFs序列模式,大多数TFs广泛结合于调控序列,基因调控结果却因而变化不大。这导致我们目前难以仅从DNA序列预测基因表达模式,并且对大多数人类基因转录的调控方式还不清楚。之前的研究表明,TF结合位点的间距、方向和拷贝数,以及TF结合位点的亲和力,均能影响转录输出。然而,关于TF结合位点如何构建基因调控程序的普遍规律仍然很少,这限制了合理解释基因组或理解调控序列中突变对基因调控或疾病表现的影响。7月17日Nature的研究报道“Position-dependent function of human sequence-specific transcription factors”,通过研究人类序列特异性转录因子在不同转录起始位点(transcription start sites, TSSs)的功能,揭示了TFs对转录起始的影响是位置依赖的。通过分析TF结合位点相对于TSS的位置,研究人员发现了多个具有高度优选位置的序列模式。该研究利用自然遗传变异、内源性TF蛋白水平的扰动以及大规模并行分析自然和合成的调控元件的方法,展示了TFs结合对转录起始的影响是位置依赖的。具体而言,研究人员发现在不同的TSSs附近,某些TFs的结合位点具有显著的定位偏好。例如,NRF1、NFY和Sp1等经典激活因子不仅能够激活也能够抑制转录起始,其功能取决于它们相对于TSS的精确位置。该研究还展示了这些TFs和它们的间距共同引导了转录起始的位置和频率。这些发现揭示了相似的TF结合位点组合如何根据其空间配置产生不同的基因调控结果,并说明了DNA序列多态性可能如何导致转录变异和疾病。该研究发现在转录起始点周围,TF结合位点的偏好位置是这些因子功能的反映,体现了它们在调控转录起始中的多种机制作用。该研究揭示了如何通过结合位点的空间配置来解码基因组中的调控信息,这对于理解基因调控和非编码DNA突变如何导致疾病有重要意义。在基因组中,转录因子(Transcription Factors, TFs)通过特定序列的结合位点调控基因表达。然而,不同TFs在基因启动子(Promoters)和增强子(Enhancers)中的结合位点常常呈现出相似的组合,这些结合位点如何编码多种重叠的基因表达程序仍然是一个重要的研究课题。为了揭示TFs结合对转录起始的影响是否是位置依赖的,该研究利用自然遗传变异、内源性TF蛋白水平的扰动以及大规模并行分析自然和合成的调控元件的方法进行实验。研究团队设计了三种不同的DNA插入片段,用于TSS-MPRA(Massively Parallel Reporter Assay)分析。每种设计包含400-500个DNA插入片段,长度为155 bp,并与4或5个独立的11 bp条形码耦合,以优化其分子特性和多样性,从而每种设计生成2000个DNA插入片段 。通过分析TF结合位点相对于TSS的位置,研究人员发现了多个具有高度优选位置的序列模式。例如,NRF1、NFY和Sp1等经典激活因子不仅能够激活也能够抑制转录起始,其功能取决于它们相对于TSS的精确位置 。细胞培养与RNA提取:研究使用U2OS、HepG2、HEK293T和Vero E6细胞,在37°C和5% CO2的条件下培养,培养基为含10% FBS的DMEM。使用siRNA和mRNA进行转染,并在24小时后收集RNA样本 。csRNA-seq分析:csRNA-seq(small capped RNAs, ~20–60 nucleotides)和总小RNA-seq输入测序读数使用HOMER工具进行修剪,并与相应的基因组(GRCh38/hg38, GRCm38/mm10)比对。仅考虑唯一比对的读数(MAPQ≥10),并丢弃剪切或软剪切的比对读数,以确保准确的TSS位置 。突变分析:通过TSS-MPRA评估TF结合位点突变对转录起始的影响,选择133个人类启动子和增强子进行突变。突变后的TF结合位点在其自然富集的位置上与转录抑制相关,而在其他位置上的突变则与转录起始增加相关 。转录因子(TF)功能的依赖位置效应(Credit: Nature)
核苷酸频率偏差:在图a中,展示了在人类U2OS细胞的TSS附近的核苷酸频率偏差。这些数据揭示了在TSS区域内,核苷酸的分布存在显著的偏差。TF结合位点富集:图b展示了许多TF结合位点在基因组范围内活跃TSS的特定位置上显著富集。NRF1、NFY和Sp1等TF在TSS上游显示出明显的富集,而在TSS下游则显著减少。结合位点的富集或耗尽模式:图c展示了结合位点相对于TSS的位置分布,使用HOMER2工具识别出TF结合位点在TSS相对位置上的富集或耗尽情况,例如NRF1结合位点在TSS上游显著富集。结合位点的功能分布:图d总结了463种已知人类TF结合位点在TSS相对位置上的富集或耗尽情况,展示了这些结合位点在不同位置的分布规律。结合位点位置与转录活性的关系:图e和图f展示了NRF1结合位点相对于TSS的位置如何影响其转录活性。通过敲除NRF1,发现结合位点在TSS上游的TSS转录活性降低,而结合位点在TSS下游的TSS转录活性增加。模型验证:图g通过过表达一个无转录活化域的NRF1突变体(dnNRF1),进一步验证了结合位点相对于TSS的位置如何影响转录活性。结果显示,当NRF1结合位点位于TSS上下游时,均会导致转录活性降低。NRF1功能模型:图h展示了NRF1结合位点位置对TSS去抑制的模型,提出了NRF1在TSS上游结合位点可能通过空间阻碍机制抑制下游TSS的转录起始。TF结合位点的定位偏好研究发现,在转录起始点周围,TF结合位点的偏好位置是这些因子功能的反映,体现了它们在调控转录起始中的多种机制作用。例如,NRF1位点更倾向于位于TSS上游,而YY1位点则偏好位于TSS下游。自然遗传变异揭示了位置依赖的功能和不同类别的转录因子(TFs)(Credit: Nature)
遗传变异对基因调控的影响:图a和b展示了基因组中的自然DNA多态性如何显著影响基因调控。在这两个示例中,SPRET小鼠株系中的遗传变异消除了NF-κB(p65)结合位点,这与下游转录起始的减少(图a)或解除转录起始的抑制(图b)相关。这些结果表明基因调控是位置依赖的,突变的结合位点相对于TSS的位置决定了其影响。TF结合位点的功能依赖位置:图c显示了Sp1结合位点突变对转录起始的影响,结果表明这些结合位点对转录起始的影响是位置依赖的。变异使Sp1结合位点削弱,在其优选位置(上游TSS)时显著与转录减少相关,而在下游TSS位置时则显著与转录增加相关。信号依赖的TF功能:图d展示了刺激NF-κB(p65)结合位点的突变在不同时间点的影响,表明这些结合位点的功能在受到KLA刺激后显著改变,进一步证实了TF功能的位置信号依赖性。TF类别的分类:图e总结了TF结合位点的功能类别,分为纯激活因子(如PU.1),纯抑制因子(如ZEB2)和双功能因子(如Sp1)。这些分类表明TFs在调控转录起始中的功能依赖于其结合位点相对于TSS的位置。全基因组分析:图f展示了全基因组范围内的TF结合位点突变影响,揭示了463种已知人类TF结合位点中有300种以上的结合位点在至少一个位置上与转录起始变化显著相关。TF结合位点的功能影响根据其相对于TSS的位置进行分类,表明这些TF在基因调控中的功能是高度位置依赖的。合成DNA序列的实验验证为了验证这些发现,研究团队设计了一种合成的150 bp DNA序列,并在整个序列中以2 bp为增量插入NRF1、NFY、YY1或Sp1的结合位点。TSS-MPRA捕捉到的结果显示,TF结合位点的插入常常导致新的TSSs出现,进一步支持了TF结合位点对RNA聚合酶II招募和定位的强烈影响。自然增强子区域的验证研究还在自然增强子区域进行了NRF1结合位点扫描,结果显示,NRF1结合位点的位置不仅影响转录起始的位置和频率,而且其他TF结合位点的存在也会对NRF1的功能产生影响。疾病相关变异的分析通过分析疾病相关的变异位点,研究发现这些变异位点通常位于TF结合位点附近,且这些变异会显著影响TSS选择,从而改变基因表达水平和基因调控程序。例如,GWAS鉴定的变异位点rs11122174位于一个NRF1结合位点内,显示出与邻近TSS位置相关的位点依赖性变化。基因组中的TF定位效应在全基因组范围内,TF结合位点的定位与其功能存在显著相关性。例如,活化因子如Sp1、NRF1和NFY在其结合位点位于TSS上游时促进转录起始,而当这些位点位于TSS下游时则抑制转录起始 。多重TF结合位点的协同作用通过分析多个TF结合位点的间距和相对位置,研究发现这些TF的协同作用能够显著影响转录起始的位置和频率。这些发现揭示了TF结合位点的空间配置在基因表达调控中的关键作用 。该研究揭示了TF结合位点的空间配置如何解码基因组中的调控信息。这些发现对于理解基因调控和非编码DNA突变如何导致疾病具有重要意义。通过进一步的研究和实验验证,未来有望在精准医疗和基因治疗领域取得重要突破。例如,利用TF结合位点的定位偏好,可以设计更有效的基因调控工具,用于治疗因基因表达失调引起的疾病。总之,该研究通过系统的实验设计和数据分析,揭示了转录因子结合位点的空间配置在基因表达调控中的关键作用,为理解复杂的基因调控网络提供了新的视角。未来的研究可以进一步探索其他TFs的定位偏好及其在不同生物学过程中的功能,从而推动基因组学和生物信息学的发展。参考文献
Duttke SH, Guzman C, Chang M, Delos Santos NP, McDonald BR, Xie J, Carlin AF, Heinz S, Benner C. Position-dependent function of human sequence-specific transcription factors. Nature. 2024 Jul 17. doi: 10.1038/s41586-024-07662-z. Epub ahead of print. PMID: 39020164.https://www.nature.com/articles/s41586-024-07662-z责编|探索君
排版|探索君
转载请注明来源于【生物探索】
End