Analyse des séquences
Analyses effectuées sur les données du CQDG
Étude | WGS ou WES | Nombre de séquences disponibles dans l'étude | Nombre de séquences disponibles sur le portail | Données brutes soumises au portail | Pipeline Pre-processing / Alignement | Pipeline Calling | Pipeline Post-processing | Pipeline annotation | Fichiers disponibles sur le portail | Prochaines étapes |
---|---|---|---|---|---|---|---|---|---|---|
DEE | WGS | 588 | 588 | .gvcf / .cram / .cnv.vcf / .sv.vcf | Dragen | Dragen | Ferlab | Ferlab | Données brutes | Rendre les .vcf annotés disponibles dans le portail. |
Cartagene | WGS | 2184 | 2179 | .gvcf / .cram / .cnv.vcf / .sv.vcf | Dragen | Dragen | Ferlab | Ferlab | Données brutes | Compléter le jeu de données et rendre les .vcf annotés disponibles dans le portail. |
BACQ | WES | 386 | 386 | FastQ / .cram / .vcf (snv) | GenPipes DNAseq | GenPipes DNAseq | - | Ferlab | .cram / .vcf | Rouler le pipeline Ferlab en entier. |
NeuroDev | WGS | 382 | 67 | FastQ / .cram / .vcf (snv) | GenPipes DNAseq | GenPipes DNAseq | - | Ferlab | .cram / .vcf | Rouler le pipeline Ferlab en entier. |
PRAGMatiQ | WGS | 257 | 110 | FastQ / .cram / .vcf (snv) | GenPipes DNAseq | GenPipes DNAseq | - | Ferlab | .cram / .vcf | Rouler le pipeline Ferlab en entier. |
Description des pipelines bioinformatiques utilisés


Outils
GenPipes
GenPipes DNAseq Exome
Dragen
Filtre :
Hard filtering sur critère bas QUAL > 3, DP > 1
Ferlab
PreProcessing
Pour le PreProcessing nous utilisons le pipeline Sarek développé par la communauté nf-core.
Parmi les outils disponibles nous avons utilisé :
- des outils de contrôle de qualité
- FastQC
- FastP
- samtools
- un outil d'alignement
- BWA
- un outil afin de tagger les duplicatas de PCR
- markduplicates
- un outil pour la recalibration de la qualité des bases
- BQSR
Calling
Pour le calling nous avons choisi plusieurs outils parmi les outils proposés par Sarek
- Calling
- Haplotypecaller
- Deepvariant
PostProcessing
Dans l'étape de PostProcessing nous utilisons un pipeline que nous avons développé à l'interne à Ferlab.
- Exclusion des MNPs
- bcftools
- CombineGVCF par famille
- gatk
- GenotypeGVCFs calculate genotype
- gatk
- VQSR
- gatk vqsr
- splitMultiAllelics
- bcftools
Annotation
- VEP
- tabix
Version des logiciels
GenPipes
Process Name | Software | Version |
---|---|---|
- | GenPipes DNAseq Exome | 4.1.2 |
- | gatk | 3.8 |
Dragen
Ferlab
Sarek + Ferlab
Process Name | Software | Version |
---|---|---|
BCFTOOLS_MPILEUP | bcftools | '1.17' |
BCFTOOLS_SORT | bcftools | '1.17' |
BCFTOOLS_STATS | bcftools | '1.17' |
BWAMEM1_MEM | bwa | 0.7.17-r1188 |
BWAMEM1_MEM | samtools | 1.16.1 |
CNNSCOREVARIANTS | gatk4 | 4.4.0.0 |
CNVKIT_ANTITARGET | cnvkit | 0.9.10 |
CNVKIT_BATCH | samtools | '1.17' |
CNVKIT_GENEMETRICS | cnvkit | 0.9.10 |
CNVKIT_REFERENCE | cnvkit | 0.9.10 |
CREATE_INTERVALS_BED | gawk | 5.1.0 |
CUSTOM_DUMPSOFTWAREVERSIONS | python | 3.12.0 |
CUSTOM_DUMPSOFTWAREVERSIONS | yaml | 6.0.1 |
DEEPVARIANT | deepvariant | 1.5.0 |
FASTP | fastp | 0.23.4 |
FASTQC | fastqc | 0.12.1 |
FILTERVARIANTTRANCHES | gatk4 | 4.4.0.0 |
FREEBAYES | freebayes | 1.3.6 |
GATK4_APPLYBQSR | gatk4 | 4.4.0.0 |
GATK4_BASERECALIBRATOR | gatk4 | 4.4.0.0 |
GATK4_GATHERBQSRREPORTS | gatk4 | 4.4.0.0 |
GATK4_HAPLOTYPECALLER | gatk4 | 4.4.0.0 |
GATK4_MARKDUPLICATES | gatk4 | 4.4.0.0 |
GATK4_MARKDUPLICATES | samtools | '1.17' |
INDEX_CRAM | samtools | '1.17' |
MANTA_GERMLINE | manta | 1.6.0 |
MERGE_BCFTOOLS_MPILEUP | gatk4 | 4.4.0.0 |
MERGE_CRAM | samtools | '1.17' |
MERGE_DEEPVARIANT_GVCF | gatk4 | 4.4.0.0 |
MERGE_DEEPVARIANT_VCF | gatk4 | 4.4.0.0 |
MERGE_FREEBAYES | gatk4 | 4.4.0.0 |
MERGE_HAPLOTYPECALLER | gatk4 | 4.4.0.0 |
MERGE_STRELKA | gatk4 | 4.4.0.0 |
MERGE_STRELKA_GENOME | gatk4 | 4.4.0.0 |
MOSDEPTH | mosdepth | 0.3.3 |
SAMTOOLS_STATS | samtools | '1.17' |
SNPEFF_SNPEFF | snpeff | 5.1d |
STRELKA_SINGLE | strelka | 2.9.10 |
TABIX_BGZIPTABIX | tabix | '1.12' |
TABIX_BGZIPTABIX_INTERVAL_COMBINED | tabix | '1.12' |
TABIX_BGZIPTABIX_INTERVAL_SPLIT | tabix | '1.12' |
TABIX_BGZIP_TIDDIT_SV | tabix | '1.12' |
TABIX_TABIX | tabix | '1.12' |
TIDDIT_SV | tiddit | 3.6.1 |
VCFTOOLS_TSTV_COUNT | vcftools | 0.1.16 |
Workflow | Nextflow | 23.10.1 |
Workflow | nf-core/sarek | 3.4.0 |
ExcludeMnps | bcftools | 1.19 |
splitMultiAllelics | bcftools | 1.19 |
importGVCF | gatk | 4.5.0.0 |
genotypeGVCF | gatk | 4.5.0.0 |
vep | ensembl-vep | 111.0 |
tabix | htslib | 1.19 |
variantRecalibrator | gatk | 4.5.0.0 |
applyVQSRIndel | gatk | 4.5.0.0 |
Updated 3 months ago