• 易基因|DNA甲基化方法全解析:方法发展、技术应用、优缺点


    大家好,这是专注表观组学十余年,领跑多组学科研服务的易基因。

    2021年03月,《Methods》杂志以“DNA methylation methods: global DNA methylation and methylomic analyses”为题发表了关于DNA甲基化分析方法的综述文章,详细介绍了DNA甲基化分析方法的发展变化、DNA甲基化分析方法的技术应用、不同DNA甲基化分析方法的相对优点。以下为原文总结分享:

    摘要:

    DNA甲基化在真核生物中提供了一个关键的表观遗传调控层,在健康和疾病的许多生物过程中具有重要意义。DNA中胞嘧啶碱基甲基化的功能最初被认为是 “沉默”表观遗传学标记,几十年来一直专注于基因的启动子区域。随着技术升级和研究积累,对DNA甲基化作用的理解扩展到各种基因组环境,包括基因体、重复序列和转录起始位点。而对全面描述DNA甲基化模式的需求催生了多种针对其基因组分布的DNA甲基化分析技术,这些方法能够在基因组水平上从限制区域特定位点单碱基分辨率检测DNA甲基化。这篇综述讨论了主要基于DNA样本初始处理的不同DNA甲基化分析技术:重亚硫酸盐转化(bisulfite conversion),内切酶酶切技术(endonuclease digestion)和亲和富集(affinity enrichment),包括方法学的发展变化、原理、应用及其相对优点。

    一、DNA甲基化分析方法的发展

    DNA甲基化分析技术有多种方法,大致分为两类:分型和分析。这两种技术都适用于高通量应用。当需要在多个样本中研究特定位点时,通常使用分型技术,包括限制性内切酶、PCR和质谱。分型技术包括甲基化特异性PCR(MSP)、重亚硫酸盐测序PCR(BSP)、重亚硫酸盐限制性内切酶分析(COBRA)、重亚硫酸盐PCR后基质辅助激光解吸电离飞行时间质谱法(MALDI-TOF MS)。基于不同介质和平台的DNA甲基化分析方法的发展如图1:

    图1:DNA甲基化方法的发展演变

    液相色谱(LC)是第一个用于定量DNA样品中总5-甲基脱氧胞苷(5mdC)含量的全基因组DNA甲基化平台,基本上DNA样品被DNase、碱性磷酸酶和外切酶依次或同时水解。色谱分离后,基因组DNA甲基化率(MR)表示为5mdC与5mdC加脱氧胞苷(dC)之和的百分比。LC分析可以快速获得和定量实验的整体甲基化水平,但适用于5mdC和dC的内部标准难以制定,基于LC分析的技术难点在于获得甲基化发生位置的详细信息。色谱技术仍然具有很强的活力,且当与荧光、UV和质谱(MS)结合时可以提高灵敏度。在这些改进中,LC/MS为全基因组DNA甲基化定量提供了准确且高度灵敏的方法。

    (1)电泳技术

    起初,科学家们利用二维电泳对基因组范围分析技术进行初步探索,该技术可以获得全基因组中DNA甲基化区域和位置信息。这些研究的RLGS( restriction landmark genomic scanning)技术于1991年首次建立并应用。从那时起,约150项研究使用RLGS来分析DNA甲基化。如使用RLGS研究98例人原发性肿瘤中1184个未选择的CpG岛基因组DNA甲基化水平,RLGS可以依据甲基化敏感限制性内切酶(MRE)靶向潜在CpG位点,该MRE可以选择性酶切CpG位点基因组富集区域或预测可能存在限制性片段的基因组序列。通过二维凝胶电泳分离酶转化产生的限制性片段,在单个实验中检测超1000个CpG位点的CGI。RLGS广泛应用于位点、区域和器官靶向研究,如印记位点和肿瘤。除RLGS外,甲基化位点间扩增(AIMs)和甲基化敏感引物PCR(MS-AP-PCR)的扩增,也已应用于评估基因组甲基化水平。AIMs和MS-AP-PCR都依赖凝胶电泳、PCR产物差异和内切酶,如甲基化敏感或抗性限制酶。由于劳动强度大且分辨率较低,这些凝胶分析技术正逐渐被取代。

    (2)芯片杂交技术

    功能基因组学的革命真正得益于芯片杂交技术的应用。芯片杂交的发展始于20世纪90年代中期。该技术进步和应用极大促进了DNA甲基化组学分析,其分辨率远高于凝胶分析。基于DNA样品的不同预处理,三种主要技术已被用于甲基化筛选的芯片杂交,即亚硫酸盐转化技术、酶切技术和免疫沉淀技术。

    2002年,两个研究团队首次描述了芯片技术在DNA甲基化研究中的应用。常规亚硫酸盐(NaHSO3)处理基因组DNA,在NaHSO3条件下,甲基化胞嘧啶不受影响,而未甲基化胞嘧啶在处理的DNA中转化为尿嘧啶,然后在PCR扩增过程中将尿嘧啶转化为胸腺嘧啶。PCR扩增产物中的胞嘧啶与胸腺嘧啶比率(通常为300-400bp)可用于分析任何目标位点甲基化水平。将PCR产物杂交到有探针的定制芯片上,该探针可以区分未转化和转化的胞嘧啶,从而分析任何感兴趣的CpG位点。亚硫酸盐芯片杂交主要缺点在于亚硫酸处理的DNA只有三个不同碱基(A、T和G)。胞嘧啶碱基确实降低了序列复杂性,导致较大冗余和降低杂交特异性。

    Tompa团队利用甲基化敏感的限制性内切酶(一种异裂酶)将拟南芥的基因组DNA分离成具有甲基化和/或未甲基化CpG位点的片段,将这些片段杂交到定制芯片上,在2002年获得了第一个全基因组水平的拟南芥甲基化组。从那时起,大量的研究工作致力于限制酶方法,包括甲基化敏感酶如McrBC和未甲基化区域靶向内切酶。内切酶方法可以定量甲基化分析和提高灵敏度,并提供比亚硫酸盐芯片技术更广泛的基因组覆盖。然而因为内切酶仅针对包含限制性位点序列,酶切方法的分辨率无法真正达到全基因组水平。

    2006年,免疫沉淀技术获得了拟南芥的第一个DNA甲基化组,这是甲基化分析的一个里程碑。同年还开发了MIRA分析(methylated-CpG island recovery assay)以确定DNA甲基化模式并鉴定肺癌同源结构域基因的频繁甲基化。简单来说,就是通过剪切基因组DNA样品的甲基化CpG位点单克隆抗体免疫沉淀甲基化片段,获得酶切中获得的相似级分,然后将免疫沉淀的甲基化级分与input杂交到芯片上。得到的reads比对数量用于分析DNA甲基化水平。相对来说,免疫沉淀芯片技术分辨率只有数百碱基,但较少偏差。在许多情况下,与目标CpG位置相邻的相关CpG位点范围可能高达1000 bp,所以可以不用盲目追求单碱基分辨率。

    芯片技术的出现促进了更广泛层面对DNA甲基化模式的理解。随着样本量的增加,科学家们持续努力实现获得更经济和更全面的DNA图谱,但总的趋势是芯片技术正在逐渐被测序技术取代,测序技术以其出色的准确性和测序深度而广受好评。

    (3)高通量测序技术

    第一代甲基化测序分析始于1984年,当时Church和Gilbert开发了一种单核苷酸分辨率的基因组DNA甲基化测序分析方案。Maxam和Gilbert利用肼(N2H4)与未甲基化(高反应性)和甲基化(低反应性)胞嘧啶的差异反应性,在胞嘧啶带中产生可鉴别信号,这些信号可以进一步转化为甲基化水平。亚硫酸盐转化的基因组DNA特别适合Sanger化学,因此在20世纪90年代,亚硫酸盐测序(DNA甲基化分析“金标准”)发展促进了甲基化测序的突破,相关技术自2005年已商业化。2007年,基于亚硫酸盐的焦磷酸测序(一种合成测序方法)通过释放焦磷酸转化,定量监测核苷酸掺入成比例光信号的实时转化。许多表观基因组项目,如人类表观基因组计划(HEP,始于2000年)和NAME21实验(National Methylome 21,始于2005年),极大改进了甲基化测序分析技术。其中RRBS是一个典型技术。

    与第一代测序(Sanger测序或毛细管测序)相比,下一代测序(NGS)(第二代测序)平台的开发,如Roche 454、Illumina和Applied Biosystems,从根本上改变了基因组学中的甲基化分析方法。NGS平台通过克隆扩增和空间分离的DNA模板或流式细胞术(FCM)分离的单个DNA分子,可以实现单碱基分辨率下的DNA甲基化分析。但NGS的一个主要警告是减少了对大规模生物信息学的读长要求。

    为避免在扩增的DNA片段合成过程中逐渐失去同步reads并保证read质量,NGS技术大大缩短了读长。读长的缩短需要生物信息计算的近似启发式,可能会增加组装偏差。通过单个DNA分子序列reads,正在积极开发第三代测序(Long-read sequencing,长读长测序)的新DNA甲基化分析方法。基于NGS技术的甲基化分析中,由于长DNA分子的分割,甲基化信息的较长模式丢失。第三代测序利用其他碱基的5mC独特信号,可以实时检测长读长单分子的DNA甲基化。

    二、DNA甲基化分析技术的应用

    由于第三代测序正在开发过程中,NGS测序平台在DNA甲基化分析方法中仍然占主导地位。由于PCR反应中缺乏内源性和合成的热稳定DNA甲基转移酶,DNA甲基化信息将在PCR扩增期间被敲除,因此几乎所有DNA甲基化测序都依赖于基因组DNA的预处理,现有的DNA甲基化NGS测序分析技术分为三大类:亚硫酸盐转化、酶切和富集。以下为一些常用甲基化分析方法原理、应用和相对优点。这些方法主要基于扩增或杂交前基因组DNA的不同预处理,重点介绍几种基于芯片和捕获的DNA甲基化分析平台。

    (1)DNA甲基化重亚硫酸盐测序分析技术

    经亚硫酸盐处理的基因组DNA中未甲基化胞嘧啶残基可以比甲基化胞嘧啶更快脱氨基并转化为胸腺嘧啶。由于亚硫酸盐转化的DNA仅由三种不同的碱基组成,限制了其对芯片杂交的适应性,特别是基因组范围的DNA甲基化分析。但亚硫酸盐处理的DNA特别适合测序分析,由于NGS测序平台开发,亚硫酸盐测序技术目前在DNA甲基化分析中发挥主导作用。

    简化基因组重亚硫酸盐测序(RRBS)

    亚硫酸盐处理的DNA增加了测序过程中的冗余。RRBS技术由Meissner等人于2005年开发,通过仅针对基因组的部分序列(6%-12%CpG)来减少测序冗余,主要覆盖启动子区域和重复序列,在亚硫酸盐转化前主要使用两种限制性内切酶Msp I(在C_CGG处酶切)和Bgl II,以将CpG中的基因组DNA片段富集。

    简言之就是基因组DNA首先被特异性限制性内切酶酶切产生末端带有CpG的片段(通常在50–300 bp范围内)。酶切产生的粘性双链DNA末端在3'端修复,在两条链中添加额外的腺苷(A-Tailing)。DNA片段与甲基化序列接头连接,可以防止亚硫酸盐转化过程中胞嘧啶脱氨。使用凝胶电泳纯化选择所需大小的片段,用亚硫酸盐处理DNA片段,将未甲基化的胞嘧啶脱氨基为尿嘧啶。PCR扩增和纯化后,将DNA产物适配到测序平台上进行测序(图2)。

    图2:WGBS和RRBS实验流程

    RRBS凭借着高灵敏度可用于快速分析肿瘤中的异常或整体甲基化状态,尤其可以靶向难以用常规亚硫酸盐测序方法和在许多肿瘤类型重复序列分析的甲基化区域,非常适合用于发育生物学中的甲基化状态分析。由于RRBS通过特异性限制性内切酶对基因组中CpG富集区域进行分析,大大减少了所需测序数据量,仅需10–300 ng样本量即可有效和准确分析,具有时间和成本效益,且对DNA的input质量要求不高。但RRBS中使用的限制性内切酶不能覆盖所有CpG富集区域,且PCR部分非校对聚合酶可能会增加RRBS中的PCR测序偏差。双链DNA的不完全转化(亚硫酸盐仅转化单链DNA)或PCR扩增退火也可能导致亚硫酸盐的不完全转化。当然,有一些方法可以提高亚硫酸盐转化率和减少PCR扩增再退火:DNA提取中的扩展蛋白酶K处理可以提高亚硫酸盐反应基因组DNA的质量和数量,如糖原和鲑鱼精子DNA可用于促进亚硫酸盐转化和DNA沉淀,在低熔点琼脂糖封闭溶液包埋DNA可以减少DNA损失并预防DNA退火,在亚硫酸盐转化之前对DNA预变可改善双链DNA转化,向亚硫酸盐溶液中添加高浓度(6M)尿素也可能破坏DNA碱基配对的稳定性。

    全基因组重亚硫酸盐测序(WGBS)

    全基因组重亚硫酸盐测序(WGBS),也称“亚硫酸盐测序”、“BS-seq”、“methyl-seq”、 “methylC-seq”,是单碱基分辨率下进行全基因组DNA甲基化分析的技术。与RRBS相比,WGBS产生的高通量数据可以直接分析单个胞嘧啶甲基化比率,在不同的生物学背景下对基因组中的几乎所有胞嘧啶(不包括某些重复区域)进行绝对定量。WGBS和RRBS两种技术在NGS平台上测序之前都需要对基因组DNA进行亚硫酸盐转化。2008年Cokus等人首次使用Solexa测序技术在Illumina 1G基因组分析平台上通过WGBS生成拟南芥DNA甲基化模式图谱。从那时起,WGBS已发展成为DNA甲基化分析的全面和定量金标准,特别是关注差异甲基化CpGs(DMCs)和差异甲基化区域(DMRs)的生物学研究。

    WGBS文库制备的核心和最常使用的步骤主要包括基因组DNA片段化、(甲基化)接头连接、亚硫酸盐转化和PCR扩增。简言之,基因组DNA(50-100ng)首先被片段化至约200bp,然后将片段与Illumina HiSeq平台兼容的纯化和甲基化接头连接。经亚硫酸盐处理DNA文库后进行纯化,用qPCR优化PCR扩增循环数量后进行文库扩增和纯化。最后在测序平台上对构建的文库进行测序(图2)。Bismark用于控制原始数据质量,将质量过滤的数据比对到基因组获得DNA甲基化信息。DMC和DMR的检测是WGBS数据分析中的关键指标。现已开发多种统计方法和工具用于从WGBS数据中分析DMC和DMR。

    WGBS是全基因组DNA甲基化分析的金标准,可以分析多种类型的甲基化位点,包括感兴趣样品中的CpG、CHG和CHH序列。美国国家卫生研究院(NIH)建议在表观基因组学项目中的WGBS实验使用两个重复,以达到30X的总覆盖率。但WGBS价格偏贵,不适用于生物学重复的大规模项目。因此研究人员开发了一种称为DSS-single的统计方法用于从只有一个重复的WGBS数据中检测DMR。

    WGBS文库制备标准方案需要大量input DNA(最少200-500 ng,最多5μg),但许多甲基化研究只有有限数量的样本。因此开发了亚硫酸盐后接头标记(PBAT-WGBS)和标签WGBS(T-WGBS)的常用替代方法。常规WGBS步骤为亚硫酸盐处理DNA接头标记,导致大量DNA片段化和对input DNA量需求增加。PBAT-WGBS中,亚硫酸盐转化先于随机引物扩展的接头标记,进而从100 ng DNA中产生大量未扩增reads。T-WGBS使用高活性的Tn5转座酶来片段化基因组DNA并附加测序接头。这种改进可以使所需DNA量低于20ng。WGBS文库制备会受到BS不完全转化、BS诱导的DNA降解、PCR扩增和DNA修饰的影响,其中BS不完全转化是偏差的主要原因。

    (2)DNA甲基化限制性内切酶转化分析

    限制性修饰是一组序列特异性限制性内切酶,通常存在于细菌和古细菌中,可以保护宿主基因组免受基因组寄生虫的侵害。每个限制性内切酶都有相关的DNA甲基转移酶,可通过在位点上添加甲基来保护内源DNA免受限制性内切酶作用。由于5mC可以抑制某些限制性内切酶在其识别序列内酶切,这种酶切模式提供了DNA甲基化reads。因此限制性内切酶在分子生物学中的巨大潜力被广泛认可,特别是在感兴趣区域的DNA甲基化分析中。如Hpa II/Msp I(C_CGG)和Sma I/Xma I(CCC_CGG)是两种典型且普遍使用的限制性内切酶(MRE),通过限制性位点进行MRE转化然后凝胶电泳或PCR,是过去常使用的敏感技术,仍然适用于某些位点特异性研究。

    甲基化敏感的限制性内切酶测序

    MRE富集可以用于NGS平台,称之为MRE-seq。MRE-seq通过等位基因的特异性DNA甲基化扫描,能够同时覆盖比常规芯片杂交更广泛的基因组区域,如HpaII(C_CGG)、Hin6I(G_CGC)和AciI(C_CGC)。不同MRE可在基因组范围靶向不重叠的CpG岛,从而产生图谱。由于MREs仅识别鉴定和切割未甲基化CpG位点的DNA双链(图3),可以通过MREs目标位点的CpG甲基化与reads之间的关系预测DNA甲基化水平。MRE转化片段文库后进行大范围并行测序,可以得到几M的数据结果,根据酶切割位点的次数分析感兴趣区域的DNA甲基化水平。

    图3:MRE-seq、MeDIP-seq 和MBD-seq原理比较

    2010年,Maunakea等人首次使用MRE-seq研究基因内甲基化在调节基因体中替代启动子的作用。多种内切酶可以覆盖约30%基因组。MRE-seq中基因组DNA首先通过几个MRE(3~5)同步转化(例如,37°C /3小时,两次),将相同量的转化产物(如500ng)合并至一个管,通常切除并纯化100~300bp凝胶切片,在1%凝胶上进行大小电泳选择。单端接头进行文库构建,然后进行末端修复反应和单核苷酸接头连接。PCR后,在测序前对扩增产物进行清洁和质检,比对参考基因组时,未甲基化的CpG位点可进一步转化为甲基化水平。

    MRE-seq是一种单CpG分辨率的DNA甲基化分析方法。但MRE-seq太依赖不同限制性酶,基因组中酶识别位点的可用性限制了其覆盖范围,MRE的不完全转化可能会导致相当多的假阳性结果。转化产生的片段可能包含重要的甲基化信息,亚硫酸盐转化后的MRE处理的下一步(称为MREBS)将靶向MRE片段内CpG位点的甲基化状态,因此MREBS能检测约60%基因组的差异甲基化。甲基化DNA免疫沉淀(MeDIP-seq)是MRE-seq的良好补充技术。MeDIP-seq和MRE-seq靶向基因组的甲基化或未甲基化部分,其组合具有协同优势。

    (3)DNA甲基化富集分析

    MRE-seq分析的主要限制在于只能分析特定的限制性位点。如经常使用的Hpa II仅靶向人基因组中所有CpG的3.9%(非重复DNA),亚硫酸盐转化筛选大量样品并不容易。为突破限制,科学家们开发了蛋白质与甲基化DNA互作来靶向甲基化序列motif的分离/分级。蛋白质包括可以选择性结合甲基化DNA的MBD家族成员(MBD2和MBD3L1),甲基结合蛋白MECP2可用于甲基化DNA纯化,5mC特异性抗体(与转化DNA互作)也是重要选择。富集方法大多数可以与测序平台结合,提供基因组范围内的免疫沉淀DNA片段信息。重点介绍两种常用方法:MeDIP-seq和MBD-seq(或MBDCap-seq)。

    甲基化DNA免疫沉淀测序(MeDIP-seq)

    2005年,Weber团队首次开发并使用MeDIP-seq在正常和转化的人类细胞中高效富集甲基化DNA,产生沉淀甲基化DNA片段的5-甲基胞苷(5mC,包括mC和mCG)单克隆抗体。利用适合抗体,羟甲基胞嘧啶(hmC)(hMeDIP)和5-甲酰基胞嘧啶和5-羧基胞嘧啶也可以通过MeDIP检测。MeDIP使用的抗体对特定甲基化基因组具有相同的特异性,因此MeDIP可以提供无偏向和无假设的检测方法。将MeDIP与NGS结合的MeDIP-seq可以在基因组水平提供100-300bp的甲基化分辨率。与其他富集技术相比,MeDIP-seq具有成本效益。

    简言之,通过优化超声处理剪切基因组DNA产生随机片段(100–500 bp),然后对超声处理的DNA进行纯化、末端修复和接头连接。由于抗5mC抗体与单链DNA具有更高的富集作用,片段化的DNA在95℃下转化以破坏双链DNA,然后一抗孵育以富集DNA片段。用蛋白G偶联或磁珠覆盖免疫吸附的DNA片段多次洗涤,进行接头修饰PCR以制备文库,常规凝胶提取以选择最终文库大小。在文库质控后,采用两个独立的PCR反应(包括阳性和阴性对照),利用NGS测序平台获取数百万个(几M)原始reads。

    甲基-CpG结合域蛋白捕获测序(MED-seq)

    MBD-seq是一种仅针对基因组甲基化部分的富集DNA甲基化分析技术,比深度测序更经济可行。与MeDIP-seq相比,MBD-seq能进行全甲基化关联研究(MWAS),可以替代MeDIP-seq。

    MBD-seq,首先将0.2-1μg基因组DNA超声处理成随机片段。然后将与磁珠偶联的MBD蛋白用于捕获甲基化DNA(双链DNA)。捕获后采用逐步洗脱系列富集结合的甲基化DNA中不同CpG密度。文库制备后,在NGS平台上对富集的DNA片段进行高通量测序。

    MeDIP-seq与MED-seq的比较

    MeDIP-seq使用5mC特异性单克隆抗体沉淀甲基化CpG位点的单链DNA片段,而MBD-seq使用MBD蛋白捕获双链DNA的甲基化区域(图3)。MeDIP富集低CpG分布的甲基化片段,而MBD-seq可以通过调整所采用的盐分级来捕获不同的甲基化分布。MeDIP-seq和MBD-seq都对DMR敏感,且结果通常一致,但都无法做到单碱基分辨率(~150 bp)。

    MeDIP-seq与MED-seq都无法覆盖未甲基化CpG位点,对基因组CGI研究可能有限当然,MBD-seq可能更敏感一些,但MED-seq不能区分5mC和5hmC。另外MBD-seq可用MBD蛋白在MBD结构域和半甲基化DNA之间缺乏稳定结合,通常偏向高甲基化区域。相比之下,MeDIP-seq对特定DNA区域无偏向性,可以提供更好的全基因组覆盖。

    (4)基于芯片的DNA甲基化分析技术

    由于数据处理的高成本,在大规模队列的全基因组DNA甲基化研究中的最可行方法并不是WGBS。

    Infinium HumanMethylation 450平台(450K芯片)

    DNA甲基化芯片可以将亚硫酸盐处理的DNA探针杂交转化为感兴趣CpG位点富集的胞嘧啶(甲基化和未甲基化)。450K芯片对0.5-1μg基因组DNA进行亚硫酸盐转化,转化后的DNA与包含两种预先设计的甲基化特异性探针阵列杂交:甲基化和未甲基化。探针单碱基在3’CpG位点结合标记和荧光染色的核苷酸(ddNTP)。然后在Illumina iScan上扫描磁珠芯片,以检测荧光信号比率。每个CpG位点的DNA甲基化比例称为β值(β),计算为M/(M+U+100)。在这个公式中,M是甲基化信号的强度,U是未甲基化信号强度,100是用在甲基化和未甲基化胞嘧啶强度都较低时调节β值的常数偏移量。Β值中0表示0%甲基化,1表示目标CpG位点的100%甲基化。

    (5)其他DNA甲基化检测技术

    DNA样品的不同预处理与不同生物信息学分析方法结合,产生一系列新兴的DNA甲基化分析技术。如开发了一种升级版简化基因组亚硫酸盐测序(dRRBS/XRBS),包括文库制备、修改和下游数据处理。dRRBS/XRBS可以增加CpG位点覆盖率(~10%的基因组CpG位点)。2012年,安捷伦的SureSelect Methyl-Seq(SSMethylSeq)利用生物素化RNA单核苷酸,可覆盖人类基因组中3.7M生物相关CpG。2016年,Illumina 开发了TruSeq-Methyl capture EPIC(TruSeqEpic)作为EPIC BeadChip芯片的补充和扩展。TruSeqEpic包含一个DNA单核苷酸池,可覆盖3.3M生物相关的CpG。2014年罗氏发布NimbleGen SeqCap Epi-CpGiant(CpGiant)捕获平台,CpGiant平台可覆盖2.8M生物相关的CpG。这三个基于捕获的平台几乎覆盖了目标区域的所有CpG位点,且偏离目标比率较低。捕获文库可以对基因组中感兴趣的区域进行定制,测序成本相对较低。然而这些捕获方法需要较高(μg级)起始量,可能限制其在临床试验中的应用。

    三、不同DNA甲基化分析方法的相对优点

    不同DNA甲基化分析方法有其各自的竞争优劣势(表1),很难直接比较各种DNA甲基组分析技术。首先,研究的物种需要参考基因组。此外,不同的DNA甲基化分析方法选择还受样本数量、样本质量、分辨率和覆盖率、准确性、再现性和成本限制的影响。

    表1:不同DNA分析方法的潜在选择

    (1)样本质量和input

    DNA甲基化分析平台在样品数量和质量上的要求差异很大(图4)。MRE-seq要求基因组DNA高数量、纯度和完整性。MeDIP-seq和MBD-seq的富集技术对DNA纯度和完整性更具耐受性。Input DNA比例会影响特异性抗体的富集效率,因此在富集方法中对input的DNA使用量要仔细考虑。亚硫酸盐测序(BS-seq)分析在测序之前要进行DNA转化和纯化,因此可接受低质量的input DNA。MeDIP-seq和亚硫酸盐转化的应用主要在单链DNA,因此与先前转化的DNA样品相容。

    图4:不同DNA甲基化分析技术的基因组覆盖率和样本量

    (2)覆盖范围和分辨率

    MRE-seq只能靶向可未甲基化CpG位点的双链DNA,酶的方法通常可以接近全基因组中识别序列分布的覆盖率和分辨率,如Hpa II和Msp I技术可覆盖95%以上的CpG岛。而由于抗体结合特性,富集测序(如MBD-seq)的基因组覆盖率和分辨率依赖甲基结合蛋白的富集靶点,具有低碱基分辨率(~150bp)的特征。

    亚硫酸盐测序可以在全基因组(WGBS)中实现单个CpG的单碱基分辨率,即使相对困难的区域也能实现(RRBS)(图4),且NGS测序的碎片大小偏倚和基础组成可能会引入新的检测偏差和覆盖范围限制。

    (3)灵敏度和准确性

    DNA甲基化分析的灵敏度和准确性各不相同,可能受样本大小和质量、DNA样本预处理、目标序列中5mC密度以及测序平台的影响。基因组水平测序技术不太适合检测低丰度DNA甲基化水平,需要高深度测序,大大增加测序成本。如MRE-seq适用于低CpG密度区域,而富集方法适用于CpG富集区域。DNA片段的长度差异用于揭示酶技术中的DNA甲基化信息,但这种类型的DNA预处理后文库构建受到强烈影响,在测序时容易产生偏差。在酶和富集的甲基化检测技术中,与基因组特定区域唯一比对的short-reads拷贝数用于鉴定DNA甲基化模式。

    亚硫酸盐测序能直接获得DNA甲基化信息,因此亚硫酸盐测序往往更敏感、更准确和可重复性,非常适合于单碱基水平分析。非校对聚合酶诱导的亚硫酸盐转化不完全和PCR扩增退火是测序不准确的主要原因,不过这个缺点可以通过添加DNA对照标签在不同时间点监测亚硫酸盐转化完成情况来改善。

    四、未来展望

    在过去几十年中,全基因组DNA甲基化分析技术的不断发展提升了我们对健康和疾病中基因组DNA甲基化各个方面的理解。我们正在目睹大量测序表观遗传学数据(不仅DNA甲基化)。基于纳米孔的第三代测序平台为5mC单分子水平直接测序提供了巨大潜力,如今DNA甲基化发展的新挑战已经从大数据生成转移到数据分析,生物信息学是表观基因组数据库的重要特征。当人们希望从如此多样的DNA甲基化分析平台中做出选择时,应综合考虑生物学目的、可用样本量和质量、所需分辨率和准确性、时间和人力成本以及拨款预算。

    易基因科技提供全面的DNA甲基化研究整体解决方案,技术详情了解请致电易基因0755-28317900。

    参考文献:Li S, Tollefsbol TO. DNA methylation methods: Global DNA methylation and methylomic analyses. Methods. 2021 Mar;187:28-43.

    相关阅读:

    一文读懂:十大DNA甲基化研究核心问题

    微量样本DNA甲基化测序分析怎么做?25.617分文章告诉你

    手把手教你做全基因组DNA甲基化测序分析

    解析DNA甲基化临床科研 | 无论什么科室,一定要有project的经典视角

    http://www.egenetech.com

  • 相关阅读:
    国外众筹kickstarter需要准备的工作
    栅格区域人口分布数据获取及坐标系转换
    linux设备模型:pci驱动程序注册过程
    【C++笔记】第二十二篇 STL
    “蔚来杯”2022牛客暑假多校训练营部分题解 2
    Spring Security 前后端分离
    KubeCon热点报告:AIStation调度平台实现RoCE网络下大模型的高效稳定训练
    java毕业设计演出购票系统Mybatis+系统+数据库+调试部署
    C/C++语言100题练习计划 75——自然数拆分问题(DFS算法实现)
    CVPR 2022 | UniDet:通用的多数据集目标检测
  • 原文地址:https://blog.csdn.net/E_gene/article/details/126719182