• Macs处理ChIP_Seq数据


    随着测序技术的改进,染色质免疫沉淀和高通量测序(ChIP-Seq)在研究全基因组蛋白质-DNA相互作用方面越来越流行。为了解决芯片序列分析方法的不足,我们提出了基于模型的芯片序列分析(MACS),用于识别转录因子结合位点。MACS捕捉基因组复杂性的影响以评估富集芯片区域的重要性,并且MACS通过结合测序标签位置和方向的信息来提高结合位点的空间分辨率。MACS可以很容易地单独用于芯片序列数据,或用于增加特异性的对照样品。此外,作为一般的峰值调用者,MACS也可以应用于任何“DNA富集分析”,如果要问的问题很简单:我们可以在哪里找到比随机背景更重要的读取覆盖率

    MACS中有七个主要功能作为子命令。

    子命令描述
    callpeak主MACS2从对齐结果调用峰值的功能。
    bdgpeakcall从bedGraph输出调用峰值。
    bdgbroadcall从bedGraph输出调用宽峰。
    bdgcmp比较bedGraph格式的两个信号轨道。
    bdgopt操作bedGraph文件的得分列。
    cmbreps结合重复分数的BEDGraphs。
    bdgdiff基于成对的四个bedgraph文件的差分峰值检测。
    filterdup删除重复读取,然后以BED / BEDPE格式保存。
    predictd从对齐结果预测d或片段大小。
    pileup堆积对齐读取(单端)或片段(配对端)
    randsample随机选择总读数的数量/百分比。
    refinepeak采取原始读取对齐,细化峰值峰值。
    1. ### 1. conda 安装
    2. conda install macs2
    3. ### 2. 比对和统计
    4. bwa mem ref.fa test_read1.fq test_read2.fq > test_pe.sam # PE
    5. # bwa mem ref.fa test.fq.gz > test_pe.sam # SE
    6. samtools flagstat test_pe.sam
    7. # 保留只比对到一个位点的序列
    8. samtools view -bq test_pe.sam >test_unique.bam
    9. samtools flagstat test_unique.bam
    10. ###3. 去重
    11. macs2 filterdup -i test_unique.bam -g hs --keep-dup 1 -o test.bed
    12. # % redundancy in the .err file
    13. ### 3. Call peaks
    14. # without control
    15. macs2 call peaks -t test.bed -f AUTO -g hs -q <FDR cutoff> -fe-cutoff <fold change>
    16. --outdir path/to/save/your/output/dir -n output_prefix
    17. #-t/--treatment filename, -c/--control, -n/--output name, -f/--format of tag files
    18. #--outdir/--the folder where all the output files saved into, -n/--name of the output as NAME_peaks.bed
    19. #-g/--gsize The default hs -- 2.7e9 is recommended as for UCSC human hg18 assembly
    20. #-q/--qvalue (minimum FDR) cutoff to call significant regions. Default is 0.05.
    21. # with control
    22. macs2 call peaks -t treat.bed -c control.bed -f AUTO -g hs -q <FDR cutoff> -fe-cutoff <fold change>
    23. --outdir path/to/save/your/output/dir -n output_prefix

    参考:

    https://macs3-project.github.io/MACS/

  • 相关阅读:
    500~1000元价位有哪些新手入门吉他推荐?saga萨伽、VEAZEN费森和雅马哈这几个品牌怎么样?
    毕业季 新的开始
    Python Matplotlib legend函数:为每条折线添加图例
    git忽略文件配置 !
    (只需三步)虚拟机上vm的ubuntu不能联上网怎么办
    Ubuntu20.04 安装配置 Ros2
    数据结构——顺序表
    JVM 内存调优总结贴
    No141.精选前端面试题,享受每天的挑战和学习
    2022阿里云金秋上云双十一轻量服务器2核2G 2核4G
  • 原文地址:https://blog.csdn.net/qq_27390023/article/details/126884173