论植物线粒体基因组的复杂性
问:怎么我收到的线粒体只有200K,不是应该500K吗?
答:正常的~
问:怎么我收到的线粒体有2个环?
答:正常的~
植物线粒体(pMtDNA)复杂性概况
01、相比于动物线粒体基因组的大小(10-20k),已知的pMtDNA大小变异非常剧烈,从190k-11Mb不等
02、重复序列变异范围大,大片段结构变异很常见
03、pMtDNA中基因的SNP同义突变率很低,显著低于动物线粒体与核基因
04、越来越多的证据表明:开花植物的pMtDNA并不一定是环状,而是以线性状态或者多种形式共存于细胞中,而且不同生长时期还能相互转变
05、除了参与能量代谢,pMtDNA经常性与植物育性相关
06、编码基因非常保守:24个核心保守基因+17个变异基因,但是保守基因的order可不保守哦,嘻嘻~
07、经常可以注释到大量novel genes,部分基因的功能非常重要,影响植物生育周期与育性
1、眼见为实,有图有真相,颠覆认知
——真实pMtDNA六大物理形态
(A)线性分支状
相互缠绕在一起的线性分子,在一侧会出现聚集,无法确定序列是否连接在一起
(B)简单环状
最为常见、易于理解的pMtDNA状态,也是最容易组装获得完成图的形态
(C)简单线性
线性分子,且无聚集现象,相对容易组装与分析
(D)降解状
分子无明确形态,类似降解的DNA,分析几乎无解
(E)彗星状
具有一个明显的分子聚集点,少量的线性分析与其连接
(F)环状分枝状
线性的分子相互缠绕,形成多个环状结构
以生菜线粒体为例,检测近100张电镜图后,对各类形态进行了统计,发现A类最多。
笔者以前一直认为B类应该最多,不清楚该结论是否具有普适性,生物学处处让人意外啊!
2、pMtDNA分子的变体(isoform)多态性
以下不同isoform都来自于同一个样本的pMtDNA哦!
(1)DR重组
同向重复序列(Direct Repeats)R和T元件之间发生重组,形成两种类型的isoforms
(2)IR重组
反向重复序列(Inverted Repeats)两个T元件之间发生重组,形成两种类型的isoforms
(3)重复序列重组
在短重复序列元件之间发生重组,一般中间的元件全部发生倒位
3、pMtDNA多isoforms共存性
从pMtDNA六大物理特性的角度观察,isoforms在同一物种中可能存在多种情况(想想比例最高的A线性分支状分子吧)
如下是生菜样品pMtDNA的三种isoforms,其中中间形态比例最多,如果组装方法合理,那么该形态会被当作完成图序列。
而上下两种isoforms可能会丢失,但是在基因组共线性分析时可能会找到重组的线索(MW、WNZ和KNZ元件)。
4、三代与三维基因组技术待完善
如果pMtDNA的分子形态只有B或者C,那么PacBio和Nanopore就能解决几乎所有pMtDNA的组装问题,然而现实是残酷的
首先我们看PacBio数据在pMtDNA分子上的深度分布:对于完成图比较了解的研究人员都应该清楚,组装质量比较高的完成图用NGS或者PacBio去进行序列深度、覆盖度统计时,整个基因组上的深度应该比较均匀,但是从下图我们可以看到,由于重组事件的发生,不同元件上PacBio Reads的分布呈现明显的波动。这个波动不仅影响序列组装,另一方面也会影响连接关系的确认。
我们再看国际知名三维基因组测序公司DoveTail的Hi-C技术在pMtDNA上面的应用:相比于传统Mate Pair文库(在PacBio、Nanopore技术横行的今天,MP文库已经几乎进入历史的教科书中),Hi-C在进行连接关系的确认时,也只能将高丰度的分子元件进行连接,对于多种isoforms的情况也暂时无能为力。
总结
1. pMtDNA分子非常复杂,做好研究的心理准备
2. 随着三代与三维基因组技术的发展,未来必然能把各种isoforms全部获取,笔者非常有信心
3. 针对pMtDNA的深入研究,可以为研究植物基因组进化与基因组片段重组提供模型支持,加深人们对于植物重复序列元件的认识与理解
欢迎小伙伴们微信活动交流,一起讨论植物线粒体基因组!