码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 生信软件26 - BWA-MEM比对算法性能好的bwa-mem2


    1. bwa-mem2简介

    工具bwa-mem2是bwa(李恒开发)bwa-mem算法的下一个版本, 由英特尔并行计算实验室的Vasimuddin Md和Sanchit Misra开发完成的,相比于bwa-mem速度快1.3-3.1倍,还极大降低了内存和存储使用量。

    目前bwa-mem比对算法广泛运用在在临床WES/WGS/CNV-seq/NIPT等项目中,用于将clean fastq比对到人类hg19/hg38参考基因组。

    bwa github: https://lh3.github.io/2018/04/02/minimap2-and-the-future-of-bwa

    bwa-mem2 github: https://github.com/bwa-mem2/bwa-mem2

    2. 测试数据集(bwa-mem VS bwa-mem2)

    比较了bwa-mem和bwa-mem2在D1-D4数据集上单端SE和双端PE数据的比对所消耗的时间,bwa-mem2速度均有一定比例的提升。

    PE数据表现

    SE数据表现

    3. bwa-mem2安装

    # 使用预编译的二进制版本(推荐)
    # 下载解压
    curl -L https://github.com/bwa-mem2/bwa-mem2/releases/download/v2.2.1/bwa-mem2-2.2.1_x64-linux.tar.bz2 | tar jxf -
    
    cd bwa-mem2-2.2.1_x64-linux 
    
    # 加入环境变量
    echo "export PATH=$(pwd):PATH" >> ~/.bashrc
    source ~/.bashrc
    
    # 查看帮助信息
    bwa-mem2
    
    Usage: bwa-mem2 <command> <arguments>
    Commands:
      index         create index
      mem           alignment
      version       print version number
    

    4. 基本用法

    使用方法与BWA MEM工具完全相同。

    # 构建参考序列索引
    bwa-mem2 index ref.fa
    samtools index ref.fa
    
    # 双端fastq比对
    bwa-mem2 mem -t 10 ref.fa read1.fq read2.fq > out.pe.sam
    
    # 单端fastq比对
    bwa-mem2 mem -t 10 ref.fa read1.fq > out.se.sam
    

    生信软件文章推荐

    生信软件1 - 测序下机文件比对结果可视化工具 visNano

    生信软件2 - 下游比对数据的统计工具 picard

    生信软件3 - mapping比对bam文件质量评估工具 qualimap

    生信软件4 - 拷贝数变异CNV分析软件 WisecondorX

    生信软件5 - RIdeogram包绘制染色体密度图

    生信软件6 - bcftools查找指定区域的变异位点信息

    生信软件7 - 多线程并行运行Linux效率工具Parallel

    生信软件8 - bedtools进行窗口划分、窗口GC含量、窗口测序深度和窗口SNP统计

    生信软件9 - 多公共数据库数据下载软件Kingfisher

    生信软件10 - DNA/RNA/蛋白多序列比对图R包ggmsa

    生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV

    生信软件12 - 基于Symbol和ENTREZID查询基因注释的R包(easyConvert )

    生信软件13 - 基于sambamba 窗口reads计数和平均覆盖度统计

    生信软件14 - bcftools提取和注释VCF文件关键信息

    生信软件15 - 生信NGS数据分析强大的工具集ngs-bits

    生信软件16 - 常规探针设计软件mrbait

    生信软件17 - 基于fasta文件的捕获探针设计工具catch

    生信软件18 - 基于docker部署Web版 Visual Studio Code

    生信软件19 - vcftools高级用法技巧合辑

    生信软件20 - seqkit+awk+sed+grep高级用法技巧合辑

    生信软件21 - 多线程拆分NCBI-SRA文件工具pfastq-dump

    生信软件22 - 测序数据5‘和3‘端reads修剪工具sickle

    生信软件23 - Samtools和GATK去除PCR重复方法汇总

    生信软件24 - 查询物种分类学信息和下载基因组TaxonKit和ncbi-genome-download

    生信软件25 - 三代测序数据灵敏比对工具ngmlr

    更多内容请关注公众号【生信与基因组学】,定期更新生信算法和编程、基因组学、统计学、分子生物学、临床检测和深度学习等内容。

  • 相关阅读:
    Unity中Shader的屏幕抓取 GrabPass
    javaweb高校实验室管理系统ssm
    Unity Metaverse(五)、Avatar数字人换装系统的实现方案
    Programming Differential Privacy第十一章The Sparse Vector Technique稀疏向量技术
    Langchain 介绍与入门
    LeetCode——判断回文数
    【接口】Java 接口是什么以及如何使用
    微信小程序第三天
    mysql中的undo log、redo log 、binlog大致概要
    关于RISC-V安全性的全面综述
  • 原文地址:https://blog.csdn.net/LittleComputerRobot/article/details/140400165
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号