这里的miRNA测序指转录水平的测序。
目前,随着miRNA研究的广泛深入,市面上已经有现成miRNA提取试剂盒。使用试剂盒,即可拿到高质量的miRNA。
miRNA分子较小,成熟的miRNA分子长度约19~25nt。因此在建库前会在3’端和5’端添加序列,保证PCR效率。
通常采取二代单端测序。
注:miRNA是sRNA(小RNA)的一种。目前市场上还有一种测序——sRNA测序(小RNA测序),这种测序得到的序列包括了miRNA、piRNA、tsRNA(tRF&tiRNA)、snRNA和snoRNA等多种类型sRNA。目前市场上还有一种测序——ncRNA测序(非编码RNA测序),这种测序得到的序列包括了tRNA、rRNA、sRNA等多种类型ncRNA。需求不同,选择测序方案不同
miRNA转录起始位点多位于基因间隔区、内含子以及编码序列的反向互补序列上,其前体具有标志性的发夹结构,成熟体的形成是由Dicer/DCL酶的剪切实现的。miRNA具有通过抑制mRNA翻译或促进mRNA降解的转录后水平调节基因表达的能力。多种生理过程和病理学(包括癌症,心血管疾病和代谢性疾病)的结果高度依赖于miRNA表达水平。但是,miRNA活性并不总是与miRNA表达水平相关。
对于miRNA的鉴定,我们将reads序列与已知miRNA数据库miRBase(v22)中的成熟miRNA序列进行比对,从而可以鉴定已知miRNA。
而对于那些未比对到数据库的序列,则利用miRDeep2软件进行新miRNA的预测。
miRNA表达量计算和差异表达miRNA分析与大家熟知的转录组分析是一样的。
补充一个知识点:
为什么会对差异表达基因进行聚类分析?因为在聚类过程中,表达模式相同或相近的基因会被聚集成类,从而依据已知基因功能类比推理未知基因的功能或已知基因的未知功能。
这部分,主要依赖miRNA靶基因数据库的检索。
其原理是依赖Rfam数据库
这里每一个数据库都可以在线访问,但是如果要本地使用,都需要进行数据库文件下载,整理。
一个综合的ncRNA数据库
最最经典的miRNA信息数据库
重点学习前两个数据库
两大部分。针对已知物种和未知物种,分别利用数据库和使用预测软件。但是在真实的分析过程中,两大部分之间可以有交叉。
强调:这里已知物种,是指进行miRNA测序的物种在miRBase、miRDB、miRTarbase数据库都存在miRNA信息。而不是知道进行miRNA测序的物种,这个信息是一定知道的。
强调:这里未知物种,是指进行miRNA测序的物种在miRBase、miRDB、miRTarbase数据库都不存在miRNA信息。而不是不知道进行miRNA测序的物种

