Mutect2 call mutations 时需要用到一个af-only-gnomad.hg19.vcf.gz文件,如果使用hg38参考基因组,这个文件可以从gatk的resource of bundle上下载,但是对于hg19,并不提供这个文件。但是,我们可以找到gnomAD的完全版,使用bcftools来提取AF信息,并生成新的文件,过程如下:
- # 下载后的文件
- wget https://hgdownload.soe.ucsc.edu/gbdb/hg19/gnomAD/vcf/gnomad.exomes.r2.0.2.sites.vcf.gz
- wget https://hgdownload.soe.ucsc.edu/gbdb/hg19/gnomAD/vcf/gnomad.exomes.r2.0.2.sites.vcf.gz.tbi
-
- # 提取AF,压缩并索引
- bcftools annotate -x ^INFO/AF gnomad.exomes.r2.0.2.sites.vcf.gz > af-only-gnomad.hg19.vcf
-
- # 修改染色体名,和ref一样
- zcat af-only-gnomad.hg19.vcf.gz|grep "#" > af_19.head
- zcat af-only-gnomad.hg19.vcf.gz|grep -v "#" >af-only-gnomad.hg19.vcf.tmp
-
- sed -i "s/^/chr&/g" af-only-gnomad.hg19.vcf.tmp # -i 直接修改原文件
- cat af_19.head af-only-gnomad.hg19.vcf.tmp > af-only-gnomad.hg19.vcf
- # 修改
- #vim af-only-gnomad.hg19.vcf
- #插入chr 如 ##contig=<ID=Y> 改为 ##contig=<ID=chrY>
-
- # 压缩,建索引
- bgzip af-only-gnomad.hg19.vcf
- bcftools index -t af-only-gnomad.hg19.vcf.gz