徐彦辉团队《Science》揭示转录起始复合物识别启动子及动态组装的分子机制

以人类为代表的高等生物,进化出复杂的基因表达调控机制,利用同一套基因组遗传信息,分化出数百种不同的细胞类型,以适应对复杂生长发育过程的需要。转录起始过程发生在几万种不同基因的高度多样化的启动子区。围绕这些启动子区,人体细胞产生极其复杂和精细的调控,如染色质重塑复合物BAF/PBAF剔除核小体暴露出启动子DNA使转录发生,组蛋白修饰和DNA甲基化修饰动态调控转录因子和转录共激活因子招募,3D基因组背景下的增强子和启动子环化,及近期备受关注的液液相分离等。上述过程的综合结果都是导致抑制或不同程度的促进转录起始复合物在启动子区的组装及后续的转录激活,实现基因差异性表达,决定细胞的表型和发育过程。以转录为核心的异常造成一半以上的人类肿瘤发生。因此,围绕启动子区转录起始过程的调控,是细胞体系内最为核心的生命过程之一,对其研究一直是生命科学的重大前沿课题。

为实现复杂的基因表达调控,人体细胞中进化出以RNA聚合酶II(Pol II,以下简称聚合酶)为核心的转录前起始复合物(preinitiation complex,PIC),识别几乎所有编码基因和大部分非编码基因的启动子区,响应各种转录调控信号,起始基因转录。数十年的研究提出,在PIC复合物的逐步组装过程中,转录因子TFIID首先识别基因的启动子,招募聚合酶Pol II和通用转录因子TFIIA, TFIIB, TFIIF组装形成核心PIC(core PIC,cPIC),进一步招募TFIIE形成中间态PIC(intermediate PIC,mPIC),招募TFIIH形成完整最终态PIC(holo PIC,hPIC)。完整PIC包含50余个蛋白质,分子量达2.6 MDa,具有高度的复杂性和动态性,对其进行结构解析一直是领域内的难题。其中TFIID复合物是最关键的因子,由TATA框结合蛋白(TATA box-binding protein,TBP)和13个TBP-相关蛋白(TBP-associated factor, TAF1-13)所组成,分子量达到1.3 MDa,识别启动子并参与整个PIC组装过程。

目前的教科书中对转录起始模型是TBP特异性识别并弯曲含有TATA box的启动子(TATA box promoter),招募聚合酶并组装PIC启动转录。然而,有超过85%的人类基因启动子不含有TATA box,称为TATA-less启动子。并且几乎所有的基因转录过程都需要完整TFIID复合物,其功能并不能够被TBP所替代。因此,尽管已有大量基于TBP的PIC复合物结构研究,包含TFIID的完整PIC是如何在不同类型启动子上进行组装的,一直没有得到阐明。对于超过85%以上基因,转录起始是如何发生的,是转录领域长期未能解决的难题。

2021年4月1日,我室徐彦辉课题组在Science杂志上在线发表了研究长文(Research Article)“Structural insights into preinitiation complexassembly on core promoters”(《结构研究揭示转录前起始复合物识别启动子及动态组装机制》)。该项研究首次报道了包含TFIID的完整PIC结构,揭示了PIC如何识别不同类型启动子并完成多步组装的完整动态过程。




徐彦辉课题组经过多年努力,利用冷冻电镜方法,解析了PIC组装过程中所有关键组装步骤和状态的复合物结构。按组装先后顺序包括:单体状态TFIID(14种共20个蛋白,1.3MDa)两种构象,结合启动子的TFIID两种构象,核心cPIC复合物(38个蛋白多肽链,2.1 MDa)两种构象,中间态mPIC(40个蛋白多肽链,2.2 MDa)两种构象,完整状态hPIC(50个蛋白多肽链,2.6 MDa)两种构象。为研究PIC对各种不同类型启动子的识别,研究人员在涵盖所有启动子类型(三种)的8个启动子及5个突变启动子上,组装PIC复合物并进行了结构分析。上述共25个复合物结构提供了PIC组装的不同阶段,不同功能状态,不同启动子类型的全覆盖结构信息。研究分析发现:

(1)TFIID含有多个DNA结合区,具有较高的序列包容度,可识别各种不同类型的基因启动子。TFIID招募聚合酶Pol II和通用转录因子逐步组装成完整PIC复合物。令人意外的是,尽管单独TBP仅弯折TATA box启动子DNA,但是在PIC复合物中,TBP以相同的方式弯折TATA box(存在于~15%基因)和TATA-less(存在于~85%基因)启动子,该过程依赖于TFIID的存在,因此在以往基于TBP的PIC研究中,无法观察到。这一发现颠覆了对TBP只结合TATA box的传统看法,很好解释了PIC组装和基因转录为何可发生在几乎所有基因的启动子上。

(2)针对不同类型启动子,PIC通过两种方式将启动子推动至聚合酶催化中心上方准备转录,提出“双路径启动子推动”模型(two-track promoter deposition)。第一种为“三步到位”,既PIC组装过程产生Park,Neutral,Drive三种启动子构象逐步到位。第二种为“直接到位”,既在组装早期就形成Drive构象启动子并一直维持到组装完成。“三步到位”方式的功能有待进一步深入研究,可能的一个解释是作为激活基因表达的检查点,既所有因子都满足条件下才到达Drive位置,以避免非必要情况下的转录发生。

(3)处于Drive构象的完整PIC,为转录起始做好了两方面准备。CDK7激酶磷酸化聚合酶的C端结构域(CTD),是转录起始的关键调控步骤。启动子到位后可通过PIC中解旋酶使模板链DNA进入聚合酶催化中心开始转录。TFIID促进两种酶活性亚基在PIC中的正确定位。


图注:PIC动态组装的模式图。TFIID识别启动子(内圈)以及PIC对于不同启动子类型的两种组装方式(外圈)。P、N、D分别代表Park、Neutral和Drive三种启动子构象。右图:三种复合物状态中启动子构象的比对(红色:cPIC,黄色:mPIC, 绿色:hPIC)。下图:cPIC组装过程中在启动子上PIC模块进行匹配(matched modular separation)和重定位(repositioned modular separation)过程模式图。模式图中的结构均来源于本研究工作。DBE:TFIID结合模块(TFIID-binding element)


该项工作是近年来转录领域的重要突破,在分子水平上展示了高度动态的转录起始过程,为后续研究基因表达调控奠定了理论基础。

据悉,复旦大学附属肿瘤医院助理研究员陈曦子(复旦大学生物医学研究院2014级博士生)、复旦大学生物医学研究院2017级博士生戚轶伦、2016级博士生武子涵、2020级博士生王鑫鑫、2016级博士生李佳蓓、2017级博士生赵丹、复旦大学附属肿瘤医院副研究员侯海峰为本文共同第一作者,徐彦辉为通讯作者。




发布日期:2021/4/7