课程地址: 复旦大学遗传学
promoter
) 指的是和转录调控识别相关的特定 DNA 区域,它通常在基因转录起始位点的 5’上游。TATAAT
。-35 序列的保守序列为 TTGACA
。间隔碱基的数目以及上游的碱基序列也较为保守。大肠杆菌基因转录的基本过程
( 1 ) 转录起始后,大肠杆菌 RNA 聚合酶沿着 DNA 双螺旋移动,将双链打开,以其中一条链为模板,以碱基互补配对方式从 5’-3’形成 mRNA,形成一段 DNA-RNA 杂合链。
( 2 ) 随后 mRNA 与模板链分开,两条 DNA 链重新形成双螺旋,mRNA 单链释放出来。
( 3 ) σ 因子只与转录起始有关,RNA 链合成了 8-9 个碱基后,σ 因子就从全酶中释放出来,参与下一个转录识别,循环使用。
( 4 ) RNA 链的延伸由核心酶催化。
( 5 ) 转录终止有两种不同方式和相应的终止子:不依赖ρ因子的转录终止子,具备特定的 DNA 序列特征帮助 mRNA 从模板链解离;依赖ρ因子的转录终止子,是 RNA 结合蛋白,能在终止子位置上将 mRNA 从模板链解离出来。
大肠杆菌转录起始水平调控
大肠杆菌转录终止水平调控
大肠杆菌色氨酸基因的衰减作用 ( attenuation
)
发现原因:在色氨酸阻遏蛋白编码基因 trpR
缺失突变体中,色氨酸存在时色氨酸操纵子的转录水平是没有色氨酸时的 1/10。也就是说,在丧失色氨酸操纵子调节作用的突变体中,大肠杆菌仍然能响应环境中色氨酸浓度的变化,改变基因的转录水平。
后来发现,执行这一调控作用的特殊基因序列,叫做衰减子 ( attenuator
) 。
在色氨酸操纵子第一个结构基因 trpE
上游、启动子下游有一段 162bp 的调控序列,负责编码色氨酸 mRNA 的引导序列,称为 TrpL
调节区,负责色氨酸操纵子的衰减调控。
衰减子序列:位于色氨酸操纵子的 114-141 位,符合转录终止子的结构特征,色氨酸操纵子下游结构基因的转录也会随之提前终止。
转录终止子的结构特征:即在一段富含 G/C 的回文序列下游连接了一串 A/T 碱基对。G/C 区的 mRNA 产物倾向形成发夹结构,导致结合其上的聚合酶构型改变,在下游的 A/T 位置终止转录。
TrpL
内部存在 4 段可以形成发夹结构的序列:Region 1-4。这 4 段序列有两种配对方式:12 配对、34 配对 ( 构成回文序列,转录提前终止 ) ;或 23 配对,1、4 保持单链。此外,TrpL 的 27-71 位还存在 14 个氨基酸的编码序列,内部有两个连续的色氨酸 Trp
密码子。
■ 当环境中缺乏色氨酸时,核糖体停止在 mRNA 链上,占据 1 区位置,因此 2 区和 3 区配对,转录终止信号无法形成,转录继续进行。
■ 当环境中有充足色氨酸时,核糖体不再占据 1 区的位置,3 区和 4 区配对,形成终止信号,从而抑制了下游基因的继续转录。
衰减作用是操纵子模型的重要补充,除了色氨酸操纵子,还有很多其他操纵子的转录也涉及到衰减作用的调控,且一定程度上,衰减作用的调控比操纵子更精细。
此外,在衰减作用中,tRNA 介导的翻译和 RNA 聚合酶介导的转录是同时进行的。原核生物转录和翻译相互藕联是衰减作用得以实现的重要前提。
转录前调控层次
转录起始调控层次
转录后调控层次
PIC
) 包括 4 种基本组分:启动子、非核心启动子:位于转录起始位点附近,属于近端调控元件
增强子、沉默子、绝缘子:属于远端调控元件
启动子:具有高度保守性,有几种基本元件,但结构和位置不完全恒定。
① 约 30-40%蛋白质编码基因启动子 -30 区含有 TATA box
,负责识别 TATA box 的蛋白质亚基叫做 TBP
。
② BRE
位于 -35 区
③ INR
位于转录起始位点
④ DPE
位于 +30 区
一般 RNA 聚合酶识别Ⅱ的启动子需要至少含有以上两种保守元件。
非核心启动子:也称为启动子邻近元件 (promoter-proximal elements
),是位于转录起始位点上游 -100 至 -200bp 区域的 DNA 元件。通常与转录因子结合后负责基因的广谱转录。
常见的非核心启动子元件:
① GC box
:也称 SP1 box,保守基序为 GGGCGG
② CCAAT box
:保守基序为 GGCCAATCT
增强子 (enhancer
) 能够通过调节转录起始前复合物的组装提高基因的转录效率。
■ 最早克隆的增强子来自于 SV40 病毒 DNA,研究发现,如果将这个病毒中的一段长 72bp 的增强子移动到报告基因启动子上游、编码序列内部或下游,都能显著激活基因的表达。甚至反向插入到报告基因中,也不影响基因的转录激活作用。
■ 增强子有特定的核心序列
■ 增强子的转录激活作用不受到序列颠倒、移位的影响,即增强子的功能与它的方向和位置无关。
■ 尽管增强子常离启动子数千 bp,但能通过形成回环的方式作用于位于启动子上的转录起始前复合物。
■ 案例:果蝇 yellow 基因突变品系
果蝇 yellow 基因负责体表的色素合成,突变型果蝇呈黄褐色。
一些特殊的突变体仅在部分器官出现黄褐色变异,其他器官颜色正常。
突变位点在 yellow 基因上游和内部的增强子中,存在多个不同的增强子,每个增强子分别负责在特定的器官或发育时期激活 yellow 基因的表达。 因此,增强子具有组织特异性转录激活作用。增强子是真核基因时空特异性表达调控的重要手段。
沉默子 (silencer
) 是基因转录的负调控元件。
■ 和增强子的调控方式很类似,参与时空特异性基因的表达关闭,不受距离、方向和位置的限制。
■ 案例:单倍体酿酒酵母有两种接合型 a 和 α
接合型的表型是由 MAT 座位中的接合型基因控制,接合型基因的完整拷贝和各自启动子位于 MAT 座位两侧的 HMLα和 HMRa 座位上。
当接合型基因位于这两个座位上时完全不转录;只有当两侧的基因插入 MAT 座位上时才能进行转录,并决定酵母的接合类型。
研究发现,在距接合型基因启动子上游 1kb 处有沉默子。
绝缘子 (insulator
) 是不让远端调控元件对基因的转录激活或转录抑制发挥作用 的 DNA 调控元件。
■ 如果绝缘子位于基因 A 的启动子和某个远端的顺式调控元件(如增强子)之间,可以中断启动子和增强子的通讯,抑制增强子对基因 A 的转录激活作用。
■ 如果绝缘子位于表达活跃的基因 B 和表达沉默的异染色质之间,可以保护表达活跃的基因不受异染色质的干扰,促进基因 B 的转录。
不同 DNA 元件的协作
淡蓝色圆圈:核小体
黄色椭圆:染色质结合蛋白,可以促进染色质的包装,形成转录不活跃的异染色质
■ 图中,沉默子 S 位于异染色质内部,异染色质扩散并包围了启动子 P2,遏制了 P2 的转录;绝缘子 I1 阻止了异染色质的扩散,在 I1 右侧形成常染色质区域;增强子 E1 能与同一个启动子区的 P1 交互,而增强子 E2 因为受到绝缘子 I2 的阻断,不能影响 P1 的转录。
■ 可见,通过这些不同 DNA 元件的相互协作,基因组被划分成很多类似的独立的转录调控单位,互不干扰的进行基因的转录表达。这是原核生物基因组所没有的机制,也是实现真核基因特定时间空间表达的基本前提。
普遍转录因子
普遍转录因子 (General-transcription factor
) 负责识别和结合不同的核心启动子,然后和 RNA 聚合酶Ⅱ组装成转录起始前复合物。用 TFⅡ加不同字母命名
各类普遍转录因子的功能
TFⅡD
:含有 TBP
亚基,负责识别和结合核心启动子元件 TATA box
TFⅡA
:稳定 TFⅡD
和启动子的结合,阻止其它抑制分子的结合
TFⅡB
:和核心启动子元件 BRE
结合,增强启动子和转录因子的结合
TFⅡE
:促进启动子序列的双链打开,促进转录,控制 TFⅡF
的活性
TFⅡF
:类似 σ 因子,和 RNA 聚合酶结合,参与起始识别并促进延伸
TFⅡH
:激酶活性和解旋活性
管家基因的转录起始
普遍转录因子、RNA 聚合酶和启动子组成的复合物可以负责管家基因 (house-keeping gene
) 的表达,即在机体的所有细胞中基本都恒定表达的一类基因。如新陈代谢基因、细胞骨架基因。
特异转录因子
特异转录因子和普遍转录因子最主要的区别在于它们不是所有 RNA 聚合酶转录起始复合物的必要组分。
和增强子、绝缘子等组织特异性表达调控元件结合负责识别这些 DNA 元件,发挥转录调控作用。分为激活型转录因子 (activator
) 和抑制型转录因子 (repressor
)。前者发挥转录激活作用,多和增强子结合;后者发挥转录抑制作用,多和沉默子结合。
转录因子通常含有两个重要的但相对独立的结构域:
DNA 结合结构域 (DNA Binding Domain
) 负责与特定的 DNA 调控元件结合﹔
激活结构区域 (Activation Domain
) 负责激活(抑制)基础转录复合物的活性。
利用转录因子独立的双功能结构域可以来筛选未知的互作蛋白,这种方法称为酵母双杂交系统 (yeast-two-hybrid system)。
其他不与 DNA 直接结合的调控蛋白,包括:共激活/共抑制因子、中介子
共激活/抑制因子 (coactivator
/co-repressor
) 指的是不能直接与 DNA 结合,而是通过与转录因子结合参与到转录起始复合物组装中的蛋白质。
共激活因子协同作用的是激活型转录因子,发挥转录激活作用。
共抑制因子协同作用的是抑制型转录因子,发挥转录抑制作用。
中介子 (mediator
) 指介导特异性转录因子与转录起始复合物之间相互作用的一类蛋白质因子。具有接头蛋白活性、染色质修饰活性等。
奢侈基因的转录起始
RNA 聚合酶、普遍转录因子、核心启动子、DNA 远端调控元件、组织特异性转录因子、共激活/抑制因子和中介子构成了一个更为庞大和复杂的转录起始前复合物,调节组织特异性基因 (tissue-specific gene
)/奢侈基因 (luxury gene
) 的转录起始。这类基因是在特定细胞类型中独特性表达的基因,它们的基因产物往往决定了特定细胞的生物学特征。
小结:
1. mRNA 加帽
2. mRNA 加尾
AAUAAA
的转录终止序列,以及其下游富含 GU/U 的特征序列,招募其他蛋白一起完成初级 mRNA 转录本的切割,随后在 polyA 聚合酶作用下进行 polyA 加尾,随着 polyA 尾的延伸,一些结合蛋白结合到 polyA 上。3. mRNA 剪接
4. mRNA 编辑
mRNA 出核和定位
mRNA 翻译与降解
进入细胞质的 mRNA 有两条出路:
降解:细胞内不再需要的 mRNA 会以降解的方式被及时清除。
翻译:如果细胞内外环境提示,仍需 mRNA 的蛋白质产物,mRNA 就会进入核糖体进行翻译。
真核细胞大多数 mRNA 的半衰期只有 30min 左右。
真核细胞的 mRNA 在起始翻译和进入降解之间保持着动态平衡,这个平衡取决于细胞内外的环境。
mRNA 降解的三种常见途径:
a. 脱腺苷化依赖途径:利用脱腺苷酶移除 mRNA 的 polyA 尾,给出 mRNA 降解信号,然后按 5’-3’或 3’-5’方向进行 mRNA 的降解。这是大多数真核 mRNA 降解的方法。
b. 脱腺苷化非依赖途径:由脱帽酶脱帽开启降解过程。
c.核酸内切酶介导的 mRNA 降解途径:依赖于核酸内切酶从 mRNA 内部将 mRNA 切割成没有保护的两段独立的 mRNA 片段,然后启动降解过程。
mRNA 翻译:真核基因的翻译起始同样需要大量蛋白质因子的参与,机制复杂,在此不一一介绍。
详见:【中科院】分子生物学-朱玉贤第四版-笔记-第 14-16 讲 真核生物基因表达调控
蛋白质加工
蛋白质降解
如果翻译产生的蛋白质不再需要,或者形成的是一个错误折叠的异常蛋白,细胞会立即主动清除这些蛋白质。
生物学意义:蛋白质降解可以动态调节细胞内基因的表达产物,从而实现基因的表达调控。
泛素 (ubiquitin
,简称 Ub
):是一个 76 个氨基酸构成的小分子蛋白质,在真核生物中高度保守,并因其广谱表达而得名。泛素通过与蛋白质底物的赖氨酸残基连接,形成多聚泛素链,指导标记蛋白质被蛋白酶体识别并发生降解。
泛素-蛋白酶体途径:
■ 泛素-蛋白酶体降解系统涉及 3 个重要蛋白质:泛素激活酶 E1、泛素结合酶 E2、泛素连接酶 E3
① 在 ATP 供能条件下,E1 与 Ub 结合,E1 将 Ub 转移到 E2 上。
② 同时 E3 识别和结合底物蛋白,并通过与 E2 的相互作用,将 Ub 转移到底物蛋白质上。
③ 更多的 Ub 添加到底物蛋白质上形成一条多泛素链,多泛素化的蛋白质被 26S 蛋白酶体识别从而被迅速降解。
蛋白质稳定性调控
(1) E3 活性调节:E3 的活性可以影响与它结合的底物蛋白的量,从而决定有多少底物蛋白质可被降解。E3 可以被磷酸化修饰改变构象,与其他互作蛋白结合。
(2) 底物蛋白调节:底物蛋白自身也可以通过修饰与其他蛋白结合、水解等过程,改变自身与 E3 结合的能力,从而影响被降解的速率。
泛素化的其他调节功能:除了多泛素化可以影响蛋白质稳定性,泛素也是蛋白质修饰中的一种关键基团,从而参与蛋白质活性的调节。
免疫球蛋白编码基因
免疫球蛋白(抗体)是具有抗原决定簇结合特异性的各种球蛋白的总称。
基因组中含有 3 个独立的免疫球蛋白 (Ig) 基因簇,包括 1 个 H 链 (IgH) 基因簇和 2 个 L 链基因簇 (Igκ 和 Igλ)。
如图所示,以人的基因组为例,这 3 个基因簇的组成包括 4 个区域:
头尾分别是由 30-45 个抗体可变区编码基因片段构成的 V 区
一个或少个抗体恒定区编码基因片段构成的 C 区
在 V 区和 C 区中间的 D 区和 J 区,带 D 区的基因片段只出现在重链编码基因中。
DNA 重组
在 B 细胞分化成熟的过程中,三个基因簇中的基因片段通过 DNA 重组得到上百万种免疫球蛋白编码基因,实现表达调控。
一个 D 与 J 连接,再将 V 连接到 DJ 复合物中,得到重组后的 VDJ 外显子,转录之后在和 C 区的外显子剪接到一起形成一条完整的 mRNA 链。
epigenetics
):由 DNA 甲基化、组蛋白修饰、RNA 介导的基因沉默等造成的染色质结构适应性变异,可改变染色质的表达活性,但并不一定可遗传。核小体的包装程度在转录、复制、修复等过程中发生的动态变化被称为染色质重塑 (chromatin remodeling
)。
通常情况下,染色质末端端粒和中段着丝粒区域属于异染色质区,能被核染料染成深色。异染色质由于包装程度过高,几乎没有基因表达活性。
染色质其他区域属于常染色质区,染色较浅。常染色质结构较疏松,基因表达所需的蛋白质能够自由进出,并控制基因表达。
染色质的包装程度和基因表达的效率之间存在对应关系。
组蛋白修饰主要发生在组蛋白的 N 末端和 C 末端。
■ 修饰类型包括乙酰化、甲基化、磷酸化、泛素化等共价修饰。
■ 修饰位点以赖氨酸居多,还有精氨酸、丝氨酸和苏氨酸。
■ 不同位点的不同修饰状态可以动态调节染色质包装,从而对应不同的 DNA 行为。
H3 的修饰类型
在 K9 位置发生的 3-甲基修饰可以招募异染色质结合蛋白 HP1
,促进异染色质包装,诱导基因沉默。
如果 3-甲基修饰发生在 K4 位置,且 K9 位置被乙酰基取代,则导致 HP1 蛋白的解离,促进蛋白的转录。
如果 3-甲基修饰发生在 K27 位置,也可以导致基因沉默,但方式不同,是由另一类染色质修饰蛋白复合物 PRC
介导的。
组蛋白修饰蛋白
HAT
(histone acetyltransferase) 调节组蛋白的乙酰化
SWI/SNF
(switching inhibited and sucrose nonfermenter) 调节组蛋白的乙酰化
HDAC
(histonedeacetylase) 调节组蛋白的去乙酰化
HMT
(histone methlytransferase) 促进组蛋白的甲基化
当组蛋白的多个位点被特异性化学修饰后,一类被称为“阅读复合物 (reader complex)”的多亚基复合物能够识别和结合这些被特异性修饰的核小体,然后进一步招募其他蛋白质调节染色质的转录活性。
DNA 甲基化的表达调控机制
案例:小鼠 Agouti 毛色(胡椒面色),是由 Agouti 信号蛋白 ASP
的编码基因决定的。
■ ASP 的基因转录在正常情况下受到毛发周期特异性启动子的调节,控制 ASP 在毛发发育的特定阶段表达,从而促进毛囊细胞合成黄色的棕黑素,产生胡椒面色的表型。
■ 实验室构建了很多 ASP 基因的突变型等位基因,其中一种突变体 AVY 的内含子内部插入了一个反转录转座子元件 IAP,导致下游 Agouti 基因组组成型表达,被过度激活,表现为黄色、肥胖,易患高血糖、肿瘤等疾病。
■ 当研究者给这种怀孕母鼠食谱中增加额外的叶酸、维生素 B12、胆碱、甜菜碱等,而不进行任何遗传手段的干预时,子代小鼠表现为形态各异,其中一部分与母鼠完全不同,其中的遗传机制就是 DNA 甲基化。
DNA 甲基化
■ DNA 修饰主要是 DNA 甲基化 (DNA methylation
),指的是 DNA 序列中的的胞嘧啶(C)能够被甲基化修饰,形成 5-甲基胞嘧啶 (5mC
)。
■ 在哺乳动物细胞的基因组中,DNA 甲基化主要发生 5’-CpG-3’中的 C 上。
■ DNA 甲基转移酶 (DNMT
, DNA methyltransferase) 催化 DNA 甲基化修饰,能维持已有的或建立新的 DNA 甲基化标记。
CpG 岛
在哺乳动物基因组中,CpG 二核苷酸的分布显著不均匀。
>98% 的基因组序列 CpG 密度低,1 CpG/100bp,且多数被甲基化修饰;
<2% 的基因组序列 CpG 密度高,1 CpG/10bp,且多数未被甲基化修饰,这种成簇分布的 CpG 往往位于基因的转录调控区域,因此命名为 CpG 岛。
■ CpG 岛指的是是哺乳动物基因组中长度为 0.3~3kb,富含 CpG(GC 含量大于 50%)二核苷酸成分的 DNA 序列。
■ CpG 岛的修饰状态与下游编码基因的表达效率密切相关。
■ 甲基化和去甲基化的 CpG 岛能够招募不同的 DNA 结合蛋白,动态调节染色质的结构。
■ 甲基化的 DNA 能被一类含有甲基化 CpG 结合功能域的蛋白质特异性识别,在其他蛋白质(如组蛋白去乙酰化酶)的共同作用下形成复合物,促进染色质的压缩,从而关闭了该区域启动子的转录活性。去甲基化的 CpG 则作用相反,促进染色质结构的释放,增强基因的转录。
全基因组 DNA 甲基化分析
约 60%的人类基因上游含有 CpG 岛,可以通过 CpG 岛的甲基化水平调节基因表达。
基因组中不同区域的 CpG 岛甲基化水平不同,同一个体的不同组织细胞之间,或同一组织细胞的不同发育阶段,DNA 甲基化修饰状态亦会发生动态的变化。
基因组印记的原理
基因组印记 (genomic imprinting
) 指的是亲本来源不同而导致等位基因表达差异的一种遗传现象。
DNA 甲基化是基因组印记最重要的方式之一。
基因组印记的过程:在哺乳动物的生殖细胞的发育时期和植入前胚胎期,其基因组范围内的甲基化模式先通过大规模的去甲基化,再通过特异性的甲基化发生重编程,从而产生具有发育潜能的细胞,新产生的基因甲基化状态遗传给分化细胞。
假设:某一基因座 (A/a) 受到甲基化印记的影响。A 对 a 完全显性,将杂合的 Aa 小鼠杂交。
△ 在这两只亲代小鼠的体细胞中,由于印记的影响,a 被甲基化修饰不能表达,A 没有被甲基化修饰,可以正常表达,因此亲本小鼠表型为野生型。且在这两只亲代小鼠的整个生命周期中,这种印记的方式不会发生改变,小鼠在该基因座上自始至终表现为野生型。
△ 在生殖细胞发育的过程中,首先亲代原有的所有印记被去除,随后根据配子的亲本来源不同,基因被重新印记。所有雌配子中该基因座不被甲基化修饰,所有雄配子中该基因座都被甲基化修饰。
△ 雌雄配子结合得到子一代小鼠,它们的印迹模式与亲本不同。杂合子有两种表型:雌未被甲基化的 A 和雄甲基化的 a(野生型)、雌未甲基化的 a 和雄甲基化的 A(突变表型)。纯合子的 AA、aa 各有一个基因被甲基化修饰,但不影响表型,仍然是野生型和突变型。
△ 因此,基因组印记不仅影响基因表达,还改变了孟德尔遗传的性状分离比,Aa 杂合子杂交子一代形状分离比为野生型:突变型=1:1。
基因组印记的特点:
■ 印记均是在亲代生殖细胞形成的过程中建立的,建立依据是亲本来源。(印记就是记住亲本来源)这就提示我们,哺乳动物父本和母本基因组在胚胎发育过程中可能具有完全不同的作用,都是胚胎正常发育所必须的。
■ 研究者曾尝试利用两个卵子或两个精子进行孤雌生殖和孤雄生殖,结果发现前者胎盘小导致发育受阻,后者胎盘正常但胚胎在体节发育早期就发生死亡。这个现象提示,哺乳动物在进行有性生殖过程中,必须需要来自父本和母本的两套遗传物质,而区别父本和母本基因组的关键之一就是“基因组印记”。
■ 研究推测,一些基因组印记可使得与卵黄囊和胎盘发育所需的部分基因在母本的基因组中失活,另一些胚胎发育的关键基因在父本的基因组中失活。基因组印记是调控胚胎早期发育和胚后生长的重要表观遗传机制。
基因组印记的案例
小鼠 Igf2、Igf2r
■ 小鼠的 Igf2 和 Igf2r 都是印记基因,两者共同调控胚胎的正常发育。 Igf2 父源表达,Igf2r 母源表达。这种与亲本来源相关的表达调控是与 DNA 甲基化有关的。
■ 以 Igf2 基因为例,Igf2 基因上游有一个绝缘子和一个增强子。
△ 在母源染色体上,绝缘子序列未被甲基化,因此可以结合转录因子 CTCF 发挥绝缘子的作用,屏蔽了增强子对 Igf2 的转录激活作用,Igf2 基因表达沉默。
△ 在父源染色体上,绝缘子序列被甲基化,无法结合转录因子,丧失绝缘子的屏蔽作用,增强子转录激活 Igf2 ,Igf2 基因表达。
■ 由于印记的存在,不同突变体小鼠的表型也表现出完全不同的现象。研究发现,父源 lgf2 基因缺失会造成胚胎过小,但母源 lgf2 基因缺失则没有明显表型。母源 lgf2r 基因缺失会造成胚胎过大﹔但父源 lgf2r 基因缺失也没有明显表型。表现出亲本来源不同则表型不同的特殊遗传现象。此外,同时缺失父源 lgf2 基因和母源 lgf2r 基因的结果是胚胎正常。提示两基因的产物相互拮抗,且这种拮抗关系是胚胎正常发育所必需的。
人类遗传疾病
人群中发现 2 类罕见的染色体缺失造成的疾病,患者都是 15q11-13 区域缺失,但在临床上有两种表型,分别为 Prader-Willi 综合征 (PWS)、Angelmen 综合征 (AS)。
PWS 症状:发育迟缓,肥胖,肌张力低下,手足小。
AS 症状:发育迟缓,共济失调,行为障碍,因脸上常有笑容,也成为快乐木偶综合征。
研究揭示,15q11-13 区域存在多个不同的印记基因。其中 UB13A 为母源性表达,缺失导致 AS;一些非编码 RNA 为父源性表达,缺失导致 PWS。
小结:
RNA 干扰现象的发现
共抑制现象︰向矮牵牛花中转入紫色色素合成酶基因,希望能够让花朵更鲜艳,结果却使得矮牵牛花出现了褪色。
RNA 干扰现象的揭示:利用原位杂交的方法研究 Mex-3 在线虫胚胎 4 细胞期的表达情况。
A:未染色的胚胎
B:野生型胚胎染色后
C:加入 Mex-3 的 antisense RNA 后染色,antisense RNA 可以与 Mex-3 互补配对,并诱导 mRNA 的降解,因此,Mex-3 染色程度下降,提示表达量降低。
D:加入双链 RNA 后染色,双链 RNA 序列与 mRNA 同源,结果表明,双链 RNA 几乎完全抑制了胚胎中 Mex-3 的表达。
RNA 干扰 (RNA interference, RNAi
) 指与靶基因序列同源的双链 RNA 所诱导的一种序列特异性的转录后基因沉默现象。
siRNA 介导的 RNA 干扰
小干扰 RNA (small interfering RNA, siRNA
) 是具有 RNAi 作用的第一类重要 RNA 分子。
基本特征:全长 20-25nt。3’末端具有 2bp 突出的粘性末端和羟基,5’末端含有磷酸基团,且 siRNA 的序列与靶基因之间具有高度同源性。
siRNA 来源于双链 RNA(double-stranded RNA, dsRNA)。
dsRNA 来源于人工合成、RNA 病毒入侵。此外,基因组中反向转录的产物或同一基因的双向转录产物也能形成 dsRNA。
siRNA 介导的 RNAi
■ dsRNA
经过核酸酶 Dicer
的加工才能成为 siRNA。
Dicer 属于Ⅲ型 RNA 酶家族,以二聚体形式发挥作用,能特异性识别和结合 dsRNA,并将其切割形成有功能的 siRNA。
■ siRNA
被组装到 RNA 诱导的基因沉默复合体 RISC
(RNA-induced silencing complexes) 中。在 RISC 中,双链的 siRNA 发生解旋,正义链被核酸酶降解,反义链被保留。
RISC 是由内切核酸酶、外切核酸酶、解旋酶等组成的复合体。
■ siRNA 的反义链与靶 mRNA 配对结合,互补结合的 mRNA 被 RISC 复合物中的 RNase 切割降解 mRNA,从而抑制基因的表达。
siRNA 的级联放大作用
siRNA 的反义链与靶 mRNA 结合时,siRNA 可作为一种特殊引物,在 RNA 依赖的 RNA 聚合酶 (RdRp
) 作用下,以靶 mRNA 为模板合成 dsRNA,新合成的 RNA 可继续被降解形成新的 siRNA。因此只需要少量的 siRNA,就能完全抑制靶基因的表达。
大量研究证明,RNAi 在多种生物中存在,是生物抵抗外源病毒基因、抑制内源转座序列或重复序列引起的染色质重塑的重要机制。
同时,由于 RNAi 特异性好,效率高,利用 RNAi 方法,特异性抑制内源基因的表达,实现特定基因的功能分析,也是当下常用的研究策略。
miRNA 介导的 RNA 干扰
miRNA
(microRNA,微 RNA) 是一类新发现的内源性的单链非编码小 RNA ,是具有 RNAi 作用的又一类重要 RNA 分子。
miRNA 普遍存在于线虫、果蝇、哺乳动物等多种真核生物的基因组中。
lin-4
是第一个发现的 miRNA,参与线虫的发育调控。lin-4 以不完全互补的方式与靶基因 lin-14 mRNA 的 3’非翻译区结合,抑制 lin-14 的蛋白质翻译,减少 lin-14 蛋白质的合成。
let-7
是第二个发现的 miRNA,能抑制 lin-41, lin-14, lin-28, lin-42, daf-12 多个基因在线虫多个发育阶段的表达。且在多个物种中发现了 let-7 的同源基因。
miRNA 普遍存在于多种真核生物细胞中。
miRNA 全部由基因组内源基因编码产生,miRNA 基因可以位于蛋白质编码基因的内含子区、UTR 区,也可以位于基因间的间隔序列。
目前已知人的基因组含有数千种 miRNA,可以在转录后水平调控基因组内的约 2/3 左右的蛋白质编码基因的表达。
miRNA 成熟过程
■ 从基因组中被 RNA 聚合酶Ⅱ转录产生初级 miRNA (primarymiRNA, pri-miRNA
)
■ pri-miRNA 经过 Drosha 等 核酸酶的加工形成 miRNA 前体 (precursor miRNA, pre-miRNA
),约含 70nt,呈茎环结构。
■ pre-miRNA 在 Exportin-5
等蛋白的协助下出核。
■ pre-miRNA 在核酸酶 Dicer
的继续加工下形成成熟的 miRNA: 长度在 18-25nt,3’末端有 2nt 突出,结构类似 siRNA,但内部序列与靶 mRNA 之间不完全互补配对。
miRNA 介导的 RNAi
■ 在细胞质中,成熟 miRNA 在解旋酶作用下打开双链,其中一条被包装到 RISC 复合物中。
■ miRNA 对基因表达调控的方式取决于它与靶 mRNA 3’UTR 的匹配程度。
如果不完全互补配对,miRNA-RSIC 复合物则抑制翻译的作用。
如果完全互补配对,miRNA-RSIC 复合物则能降解靶 mRNA (与 siRNA 作用机制相同)。
■ 由于存在不完全互补配对,一条 miRNA 可以调控多个基因,一个基因也可以受到多个 miRNA 的调节。
对比 miRNA 和 siRNA 介导的 RNAi
X 染色体失活
涉及表观遗传的多种机制
剂量补偿效应 (dosage compensation effect
): 在 XY 性别决定类型的生物中,性连锁基因在两种性别中有相等或近乎相等的有效剂量的遗传效应。即在雌性、雄性细胞里,X 染色体的编码产物在数量上相等或近乎相等。
不同生物采用不同的剂量补偿策略。
果蝇:通过增加雄蝇 X 染色体的转录活性来实现补偿。
线虫:降低雌雄同体个体 X 染色体的转录活性来实现补偿。
哺乳动物:采用 X 染色体失活实现剂量补偿。
X 染色体失活 (X chromosome inactivation
) 指雌性哺乳动物在胚胎发育早期细胞中的两条 X 染色体之一独立且随机地失去活性的现象。
失活的 X 染色体保持高度压缩的形式,被称作巴氏小体 (Barr body
) ,在一些组织细胞中可见。观察巴氏小体是简易的判断哺乳动物性别的方法。
案例:玳瑁猫
白斑由常染色体上的皮斑基因 S 决定。
黑色与黄色是由 X 染色体连锁基因 O 控制,O 显性黄色,o 隐性黑色。
XOXo杂合子的雌猫由于 X 染色体失活,因此 Oo 只有一个在发挥作用,在一些细胞中是 XO,表现为黄色皮斑,另一些细胞中是 Xo,表现为黑色皮斑,因此形成了三色猫。
非编码 RNA 介导的 X 染色体失活
研究揭示,X 染色体失活是由 Xist 调控的。X 染色体 Xq13 的 Xic 位点中包含 Xist 基因。
在发生失活的 X 染色体上,Xist 基因转录出非编码 RNA Xist RNA。Xist RNA 包裹在 X 染色体上,并从 Xic 向两端扩展,同时进一步诱发 DNA 甲基化和组蛋白修饰,促进了染色质包装成浓缩态的异染色质,最终造成 X 染色体失活。
在没失活的 X 染色体上,Xist 基因的转录可以被阻断因子关闭,从而逃避失活。