0
点赞
收藏
分享

微信扫一扫

GATK4最佳实践-体细胞突变的检测与识别

欢迎关注"生信修炼手册"!

分析体细胞突变时,通常采用tumor_vs_nomal 的实验设计。在检测时,由于同时会检测出生殖细胞突变和体细胞突变,需要做的就是去除生殖细胞突变位点,那么剩下的就是体细胞突变位点了,GATK4 采用Mutect2 检测体细胞突变,分析流程如下:
GATK4最佳实践-体细胞突变的检测与识别_数据库

1. 根据normal 样本得到 panel of normal

首先对每个normal 样本,运行Mutect2

gatk Mutect2 \
-R reference.fa \
-I normal1.bam \
-tumor normal1_sample_name \
--germline-resource af-only-gnomad.vcf.gz \
-O normal1_for_pon.vcf.gz

然后使用​​CreateSomaticPanelOfNormals​​命令创建panel of normal

gatk CreateSomaticPanelOfNormals \
-vcfs normal1_for_pon_vcf.gz \
-vcfs normal2_for_pon_vcf.gz \
-vcfs normal3_for_pon_vcf.gz \
-O pon.vcf.gz

2. normal_vs_turmor 得到体细胞突变

命令如下:

gatk Mutect2 \
-R reference.fa \
-I tumor.bam \
-tumor tumor_sample_name \
-I normal.bam \
-normal normal_sample_name \
--germline-resource af-only-gnomad.vcf.gz \
--af-of-alleles-not-in-resource 0.00003125 \
--panel-of-normals pon.vcf.gz \
-O somatic.vcf.gz

mutect2检测时,是成对检测的,需要一个normal bam 和 turmor bam, ​​germline-resource​​​指定一个生殖细胞突变的vcf文件,这里选择的是​​gnomAD​​数据库 ,链接如下

​​http://gnomad.broadinstitute.org​​

这个数据库收集了大量外显子和全基因组测序的SNP calling结果。​​af-of-alleles-not-in-resource​​​指定​​germline-resource​​​ 变异位点的频率,低于该频率的位点认为是一个不可靠的生殖细胞突变位点。​​panel-of-normals​​指定第一步生成的pon.vcf.gz文件。

3. 过滤VCF文件

第一步,运行​​GetPileupSummaries​

gatk-launch GetPileupSummaries \
-I tumor.bam \
-V small_exac_common_3.vcf \
-O pileups.table

第二步,运行​​CalculateContamination​

gatk-launch  CalculateContamination \
-I pileups.table \
-O contamination.table

第三步,运行​​FilterMutectCalls​

gatk FilterMutectCalls \
-V somatic.vcf.gz \
-contamination-table contamination.table \
-O filtere

扫描关注微信号,更多精彩内容等着你!

GATK4最佳实践-体细胞突变的检测与识别_ls命令_02


举报

相关推荐

0 条评论