第十章 真核生物基因表达调控
第一节 染色质结构与基因表达
染色质是细胞核中基因组DNA与蛋白质构成的复合体。染色质的基本结构单位是核小体。10 nm粗的纤维可以进一步盘绕成30 nm粗的纤维。在分裂期,30 nm粗纤维再折叠成具有一定形态结构的染色体。分裂期结束后,染色体又转化为染色质。按照功能不同,可将染色质划分为活性染色质和非活性染色质。前者是指那些具有转录活性的染色质,而后者则用于表示缺乏转录活性的染色质。在结构上,活性染色质和非活性染色质也有很大的差异。具有转录活性的染色质区域为一种开放、松散的结构。而非活性染色质呈现一种高度浓缩的形态,转录机器不能与其中的启动子结合,因而没有转录活性。异染色质就是一种典型的非活性染色质。 一、位置效应
位置效应(position effect)是指一个基因由于在基因组的位置发生改变,而发生的表达上的变化。 二、活性染色质的特征
与非表达区域中核小体结构紧密、间隔规则相比,其核小体组装较为伸展或不规则。这样的一种结构有利于转录因子的结合,以及RNA聚合酶沿模板的滑动。在转录起始区以及某些特殊的区域,核小体的构象变化更为明显,DNase I和微球菌核酸酶等非特异性内切酶可用于检测这种变化。 三、染色质结构的调节
在原核细胞中,RNA聚合酶和调节蛋白可以自由地接近DNA。由组蛋白和基因组DNA两部分组成的染色质结构限制了转录因子对DNA的接近与结合,实际上起着阻遏转录的作用。基因转录需要染色质发生一系列重要的变化,如染色质去凝集,核小体变成开放式的疏松结构,使转录因子等更容易接近并结合核小体DNA。有两种方式可以显著改变DNA的易接近性:组蛋白的乙酰化和核小体重塑。组蛋白的去乙酰化,则可以使染色质凝集,引起基因沉默。
1.组蛋白N端尾的修饰对染色质结构及基因转录的影响
每种核心组蛋白包括一个~80个氨基酸残基构成的保守的区域称为组蛋白
---
--WORD格式--可编辑--
折叠域(histone fold domain)和一个突出于核小体核心之外、由20个氨基酸残基组成的N端尾。N端尾的相互作用对核小体的聚集和染色质折叠非常重要,也是组蛋白的主要修饰部位。核小体N端尾的修饰作用包括位点特异的磷酸化、乙酰化和甲基化。
2.核小体重塑
核小体重塑涉及在基因组一个较短的区域中核小体位置的改变或者结构的改变,是一个能量依赖的过程,由核小体重塑复合体(chromatin remodeling complex)催化完成。重塑复合体利用ATP水解释放的能量,介导二种主要的反应:(1)组蛋白八聚体沿DNA滑动;(2)在不改变位置的情况下使核小体变成一种较为松散的结构。 四、染色质结构的区间性 1.绝缘子
绝缘子是一组在真核生物基因组中建立独立的转录活性区的调控元件,它具有两种性质。第一,当绝缘子位于增强子或者沉默子与启动子之间时可以阻断增强子对启动子的作用。第二,绝缘子可以使其界定的基因的表达不受位置效应的影响。在转基因时,目的基因整合到染色体上的不同位置,因位置效应作用基因的表达水平差异很大。但是,如果在目的基因的两侧连接上绝缘子,目的基因往往不受染色体位置效应的影响。
2.基质附着区(matrix attachment region, MAR)
无论是在原核细胞还是在真核细胞中,基因组DNA形成巨大的环状结构,环的基部附着在染色体支架上。在细菌中环的长度大概是40 kb,而真核生物的DNA环要长一些,大约60 kb。 3.基因座控制位点
人类的β-珠蛋白基因簇长约60 Kb,含有5个功能基因,它们的排列顺序是5’- ε-γG-γA-δ-β-3’。其中ε在胚胎早期表达,γG和γA在胎儿时期表达,δ和β在成体中表达。每个β-珠蛋白基因都有自己的一套调控系统,但它们的表达还要受到基因簇上游12 Kb的基因座控制位点(locus control region, LCR)的控制。LCR具有增强转录的功能。 4. 沉默子
---
--WORD格式--可编辑--
在酿酒酵母中,HML和HMR位点,以及接近端粒的染色质区域,形成一种抑制性染色质结构,因此在转录上是沉默的。HM位点上的沉默效应是由位点两侧、短的被称为沉默子的特异序列起始的。HML的沉默子分别是HML-E和HML-I;HMR的沉默子分别是HMR-E和HMR-I。
第二节 DNA甲基化与基因组沉默
一、DNA甲基化
DNA甲基化是指在DNA甲基化酶(DNA methyltransferase)的作用下,以S-腺苷甲硫氨酸为甲基供体,将甲基转移到DNA分子的胞嘧啶碱基上形成5-甲基胞嘧啶的过程。胞嘧啶的甲基化作用不是随机的。在脊椎动物基因组中胞嘧啶甲基化仅限于5’-CG-3’二核苷酸,植物中仅限于5’-CG-3’二核苷酸和5’-CNG-3’三核苷酸。
DNA的甲基化反应分为两种类型。第一类是维持甲基化(maintenance methylation)。当复制刚刚完成时,仅有亲本链上的C被甲基化,而子链的对应位点上的C未被甲基化。维持甲基化则是使子链上的这个C被甲基化,保证两个子代DNA分子保持与亲本分子相同的甲基化模式。第二类是从头合成甲基化(de novo methylation),可在基因组新的位置上添加甲基,从而改变了基因组局部区域的甲基化模式。 二、DNA甲基化与基因组沉默
DNA甲基化可以引起基因沉默。把甲基化的或未甲基化的基因引入细胞,检测它们的表达水平,结果显示甲基化的DNA不表达。在检测染色体DNA的甲基化模式时,发现DNA甲基化水平与相邻基因的表达水平呈负相关。
甲基化的生物学效应是由各种mCpG结合蛋白(methyl-CpG-binding proteins, MeCP)介导的。MeCP与启动子区甲基化的CpG岛结合,募集一些蛋白质,形成转录抑制复合物,阻止转录因子与启动子结合,从而抑制基因转录。 三、DNA甲基化与基因组印记
在一个二倍体细胞中,常染色体基因有两个拷贝,一个来自父本,一个来自母本。多数情况下,两个基因在功能上是等价,它们在表达水平上具有可比性。但在少数情况下,二倍体细胞核中同源染色体上的一对等位基因中只有一个可以表达,另一个因甲基化而沉默,这种现象就是基因印记,就如同基因被打上了亲
---
--WORD格式--可编辑--
代的印记。对一些印记基因来说,来源于父本的等位基因不表达,来源于母本的基因表达。对另一些印记基因来说,情况刚好相反。
在人类和小鼠中已经发现了100个印记基因。研究得比较透彻的两个例子是人类的Igf2基因(insulin-like growth facotr-2)和H19基因。Igf2编码胰岛素生长因子2,参与细胞间信号传递,它和H19位于人类第11号染色体上相互邻近的位置。在细胞内,位于父本来源的同源染色体上的Igf2基因是活化的,位于母本来源的Igf2基因被关闭。H19基因的情况刚好相反:来自母方的拷贝处于工作状态,来自父方的拷贝则处于关闭状态。基因组印记与基因组甲基化模式有关。
第三节:真核生物的特异性转录因子
真核生物蛋白质编码基因的表达不但需要通用转录因子,也需要特异性转录因子。特异性转录因子结合于启动子的上游元件,或者结合于远离启动子的增强子元件,对基因的表达进行调控。一个典型的特异性转录因子具有下面3个基本特征:
1. 应答一种特异性信号,激活一个或者一组基因。
2. 与大多数蛋白质不同,转录因子能够进入细胞核,识别并结合于DNA分子上特异性序列。
3. 直接或间接地与转录起始装置发生作用。 一、转录因子的分离、鉴定
对于像酵母、果蝇、以及其他在遗传上容易操作的真核生物,可以利用经典的遗传分析的方法鉴定编码转录因子的基因。然而,对于不适合进行遗传分析的脊椎动物来说,大多数转录因子是通过生物化学的方法纯化出来的。
1.利用生物化学的方法分离转录因子
2.利用遗传学的方法鉴定编码转录因子的基因 二、转录因子的功能域
一系列的研究表明,Gal4蛋白有两种不同的功能域:DNA结合域(DNA-binding domain)与特异性的DNA序列相互作用;激活域(activation domain)与其他的蛋白质相互作用从而刺激从邻近启动子开始的转录。在这些实验中,研究人员检测了gal4的各种缺失突变对蛋白质的功能产生的影响。实验所用的受体细胞缺少GAL4基因,这样就可以排除内源的野生型Gal4蛋白对实
---
--WORD格式--可编辑--
验的干扰。
Gal4蛋白N末端一段短的缺失便会破坏转录因子与DNA的结合能力。然而,一系列含有不同长度C-末端缺失的Gal4蛋白质,只要缺失的范围不越过第72个氨基酸残基,仍然会保持与UASGAL序列专一性结合的能力。因此,Gal4蛋白N-末端的72个氨基酸残基组成的结构域具有与UASGAL序列的结合能力。
C末端缺失大约125或更多个氨基酸残基同样会彻底消除Gal4激活转录的能力,但是这些缺失并不影响它们的DNA结合能力。如果把Gal4的N末端DNA结合结构域与长度不同的C-末端片段直接融合所形成的截短的蛋白质,尽管这些转录因子失去了大部分的中央区,仍保持有激活报道基因转录的能力。因此,Gal4蛋白C末端大约100氨基酸区段含有激活结构域,当把它与N末端的DNA结合结构域融合后,同样能够激活报道基因的转录。
1.DNA结合域:螺旋-转角-螺旋结构域(helix-turn-helix domain);锌指(zinc finger);碱性亮氨酸拉链(leucine zipper);碱性螺旋-环-螺旋(helix-loop-helix)
2.转录激活结构域:酸性激活结构域;富含谷氨酰胺结构域(glutamine-rich domain);富含脯氨酸结构域(proline-rich domain) 三、转录因子的作用方式 1、活化子
我们已经描述了在体外Pol II从一条裸露的DNA模板起始转录所需要的条件。但是细胞内高水平、受调控的转录还需要基因特异性的活化子(activator)。活化子是一种能够激活基因表达的DNA结合蛋白。真核生物的活化子可以通过两种途径激活转录:促进转录机器在启动子上的装配;另一种方式是活化子募集核小体的修饰成分来改变基因附近染色质的性质,以利于聚合酶的结合。 2、抑制子
大多数真核生物的转录因子都是促进转录的活化子。然而,在真核细胞中也存在着对转录有抑制作用的转录因子,即抑制子。一些抑制子在DNA分子上的结合位点与活化子的结合位点存在重叠,也有一些抑制子的结合位点转录的起始位点重叠。因此,当它们与DNA结合时就会阻止与转录起始有关的蛋白质与DNA的结合。
---
--WORD格式--可编辑--
然而,在很多情况下真核生物的抑制子并非是通过直接干扰活化子或者转录因子与DNA的结合来发挥作用的。与活化子一样,抑制子可以通过招募核小体修饰酶或者与转录机器直接作用抑制转录。抑制子和活化子招募不同的核小体修饰酶。例如,抑制子招募的组蛋白去乙酰化酶去除组蛋白N端的乙酰基来抑制转录。下面我们通过一个具体的例子来说明抑制子是如何抑制转录的。
第四节 转录因子活性的调节
真核生物基因的转录受活化子和阻遏蛋白的调控。在多细胞有机体中,一个基因的表达模式在很大程度是由转录因子和基因调控序列相互作用决定的。因此转录因子的作用就必须受到控制。 一、转录因子的表达调控
很多转录因子的表达被限定在特殊类型的细胞中。甲状腺素运载蛋白(Transthyretin,TTR)是一种与甲状腺素结合的血清蛋白,主要在成体的肝细胞和脉络丛细胞中表达。在TTR基因的调控区中鉴定出了10个调控蛋白的结合位点。其中一个是碱性亮氨酸拉链蛋白AP1的结合位点,大多数细胞都含有这种转录因子。其余9个位点结合4种转录因子,它们分别是D/EBP,HNF1(hepatocyte nuclear factor 1),HNF4和HNF3。D/EBP是第一个被克隆和测序的亮氨酸拉链蛋白,作用于几个肝细胞特异性基因。HNF1含有一个同源异型域。HNF4是一种C2H2锌指蛋白。HNF3的DNA结合域是winged-helix group的原型。除了在肝细胞中表达以外,这几种转录因子还会在其他几种类型的细胞中表达。D/EBP在脂肪细胞、小肠细胞和某些脑细胞中表达,但是不在肾细胞中表达。而HNF4在小肠细胞和肾细胞中表达,但是不在脑细胞中表达。HNF1主要在成体的肝细胞中表达。转录因子在不同类型细胞中的差异分布是由于编码这些因子的基因在细胞中的差异表达造成的。 二、激素对转录因子活性的调节 1、脂溶性激素对转录因子活性的调节
某些转录因子的活性受到激素的调节。激素是由特定的细胞分泌,通过血液循环作用于有机体不同部位的靶细胞。有一类激素为脂溶性小分子,它们可以穿过细胞膜和核膜,与细胞内的受体结合。脂溶性激素,包括各种类固醇激素(steroid hormones)、类视黄醇(retinoid)和甲状腺素(thyroid hormones)等。这些分子
---
--WORD格式--可编辑--
在分子结构上差别很大,但它们的作用机制相似。在细胞内这些信号分子与它们的受体结合后,激活受体。被激活的受体作为转录因子与DNA结合调节靶基因的转录。
二、信号转导对转录因子活性的控制
尽管脂溶性激素能够穿过细胞膜直接与细胞或者细胞核中的转录因子结合,然而多肽类和蛋白质类激素却不能穿过细胞膜进入细胞,而是首先与细胞表面专一性的受体结合,将信号传入细胞。这些激素受体是跨膜蛋白,胞外区有激素的结合位点。激素的结合导致受体构象的变化,引发胞内的生化事件,并且最终导致转录因子的活化和基因表达的变化。 1、STAT参与的信号转导
干扰素和白细胞介素等许多细胞因子都是胞外的信号多肽。它们与其表面受体结合导致一种转录因子STAT(signal transducer and activator of transcription)的活化,使其靠近C-末端的一个酪氨酸残基磷酸化。如果细胞表面受体是酪氨酸激酶家族的成员,则它能直接激活STAT。如果它是一个酪氨酸激酶相关受体,那么它自身没有磷酸化STAT的能力,而是通过JAK起作用。
JAKs具有酪氨酸激酶活性,附着于受体的胞内区。当配体与受体的结合后,两条受体链会聚集在一起,激活了JAKs的酪氨酸激酶活性,使细胞因子受体上的一个特定的酪氨酸残基磷酸化。STATs通过其SH2结构域与受体上的磷酸酪氨酸残基结合。SH2结构域是一段保守的氨基酸序列,约100个氨基酸残基,首先被鉴定为原癌蛋白Src和Fps的保守序列,后来发现存在于许多参与细胞内信号传递的蛋白质中,特异性地结合蛋白质上的磷酸酪氨酸残基。一旦被募集至受体上,STAT也被JAC磷酸化。STAT上的磷酸酪氨酸残基又成为其他STAT的结合位点,于是就形成了同源或异源二聚体。被激活的STATs二聚体进入细胞核,激活靶基因的转录。 2、受体酪氨酸激酶信号转导系统
受体酪氨酸激酶(Receptor tyrosine kinase, RTK)是一组十分重要的细胞表面受体。RTK的配体是水溶性或是与细胞膜结合的多肽/蛋白质类激素,包括神经生长因子(nerve growth factor,NGF),血小板衍生生长因子(platelet-derived growth factor,PDGF),纤维细胞生长因子(fibroblast growth factor,FGF),表
---
--WORD格式--可编辑--
皮生长因子(epidermal growth factor,EGF)和胰岛素(insulin)等。当配体与此类受体结合时,受体的蛋白酪氨酸激酶活性被激活,并引发信号转导级联,使细胞的生理活动和基因的表达模式发生改变。RTK信号通路有着广泛的生物学功能,包括调节细胞的增殖和分化,以及细胞的代谢活动等。
所有RTK都有一个胞外结构域,一个跨膜的疏水α螺旋和一个胞内结构域。胞外结构域含有一个配体结合位点,胞内区有一个具有蛋白酪氨酸激酶活性的区域。与配体结合会造成大多数以单体形式存在的RTK形成二聚体。在二聚体中,每一单体的蛋白激酶活性磷酸化另一单体上的一组特定的酪氨酸残基,这一过程被称为自体磷酸化(autophosphorylation)。有一些RTK的亚基,例如胰岛素的受体,是被共价键连接在一起的。尽管这些受体与配体结合以前是以二聚体或者四聚体的形式存在的,然而自身磷酸化的发生仍需要配体的结合。通常认为配体的结合诱发的构象变化激活了受体的激酶活性。
Ras是一种在RTK的下游起作用的GTP结合开关蛋白,它能够在结合GTP的活性状态与结合GDP的非活性状态之间相互转换。Ras的活性需要鸟苷酸交换因子(guanine nucleotide-exchange factor,GEF)的介导。GEF和Ras GDP复合体结合,导致Ras构象的改变,释放出GDP。由于细胞内GTP的浓度远比GDP高,GTP就会自发地与Ras结合,并释放出GEF。Ras的失活需要另一种蛋白质,GTP酶激活蛋白(GTPase-activating protein,GAP)的帮助。GAP结合Ras GTP复合体使Ras自身的GTP酶活性提高了100倍,GTP的水解又使Ras回到失活状态。
哺乳动物的Ras蛋白与人类的多种肿瘤有关。突变的Ras能够结合,但是却不能水解GTP,因此处于一种永久的活化状态造成细胞的转化。
RTK和Ras是通过GRB2和Sos发生联系的。GRB2通过其SH2结构域和RTK上一个特定的磷酸酪氨酸残基结合。SH2是最初在细胞质Src蛋白激酶中发现的一段保守性氨基酸序列,约有100个氨基酸残基,而后在其他各种信号传递分子中亦有发现。不同的SH2结构域的三维结构十分相似。每一SH2结构域选择性地与一段包含一个磷酸酪氨酸残基的氨基酸序列结合,例如,Scr酪氨酸蛋白激酶能够与任何含有磷酸酪氨酸-谷氨酸-谷氨酸-异亮氨酸核心序列的多肽链紧密结合。
---
--WORD格式--可编辑--
GRB2还通过两个SH3结构域与Sos蛋白结合。Sos是一种鸟嘌呤核苷酸交换因子。SH3结构域大约由55~70个氨基酸残基组成,存在于许多与胞内信号传导有关的蛋白质中。SH3结构域选择性地与Sos以及其他富含脯氨酸的序列结合。
因此,当RTK被激活后,就会在细胞膜的胞质面上形成一个由RTK、GRB2和Sos构成复合体。在复合体中,GRB2是一种衔接蛋白,它一方面与RTK结合,两一方面与Sos结合。复合体的形成导致Sos从细胞质转移至细胞膜,这样Sos就与它的底物,膜结合的Ras GDP,彼此靠近。遗传学和生物化学的研究表明Sos的C-末端抑制其核苷酸交换活性,而与GRB2的结合可以解除这种抑制作用。Sos与Ras GDP的结合造成Ras构象的改变,使无活性的、与GDP结合的Ras释放出GDP。由于细胞中GTP的浓度高出GDP大约10倍,GTP优先与Ras结合,形成RasGTP,激活下游的效应分子。
另外几种蛋白质分,包括GAP,结合到活化的RTK上特定的磷酸酪氨酸残基上,这种结合使得GAP靠近RasGTP,这样GAP就可以促进Ras循环。
---
因篇幅问题不能全部显示,请点此查看更多更全内容