Introduction au portail du CQDG

Bienvenue au centre de documentation du portail du CQDG !

Le portail propose plusieurs fonctionnalités destinées aux études qui souhaitent y héberger leurs données ainsi qu'aux chercheurs qui souhaitent y accéder pour leurs projets de recherche.

Liens rapides :

Créer un compte d'utilisateur

Comprendre la gouvernance des données

Comment soumettre vos données

Faire une demande d'accès

Partage et hébergement de données

Le CQDG offre aux chercheurs une plateforme idéale pour entreposer et diffuser les données génomiques générées par les études cliniques et de recherche.

Sécuritaire et confidentiel

Le CQDG dispose d'un cadre de gouvernance rigoureux développé en collaboration avec le Centre de génomique et politiques de l'Université McGill. Ce cadre assure que les jeux de données du CQDG ne soient accessibles qu’aux chercheurs ayant obtenus préalablement les autorisations requises par les comités d’éthiques qui les gouvernent. La plateforme du CQDG est hébergée sur la nouvelle infrastructure infonuagique Juno de Calcul Québec dans le cadre du projet Secure Data for Health, respectant ainsi les standards et les normes les plus stricts en matière de sécurité.

Partager vos données facilement

Une fois que vos données génomiques sont hébergées au CQDG, la diffusion de données se fait directement à partir de notre infrastructure infonuagique. Tous les aspects techniques reliés au partage des données seront gérés par la plateforme. Vous devrez simplement répondre aux demandes d'accès aux données des chercheurs et notre équipe assumera la gestion des accès selon vos critères.

Contrôle d'accès aux données sur mesure

Vous pouvez spécifier les conditions d'accès aux données de votre étude à l'aide de l'ontologie Data Use Ontology. Les utilisateurs du CQDG peuvent alors rapidement évaluer si l'usage de vos données génomiques est permissible et conforme à leurs besoins. Aucun accès aux données génomiques n'est accordé sans l'approbation du comité d'accès aux données de l'étude contributrice. Le CQDG permet donc aux chercheurs intéressés de facilement découvrir ces données génomiques tout en respectant le cadre de gouvernance de votre étude.

Harmonisation de données

Données cliniques harmonisées

Les données cliniques qui accompagnent les données génomiques hébergées au CQDG sont harmonisées. Ceci permet aux utilisateurs du portail d'effectuer des recherches et des comparaisons entre les données de plusieurs études contributrices simultanément. Les données sont harmonisées à l'aide des ontologies suivantes :

De plus, toutes les données sont conformes au format décrit dans le dictionnaire de données (voir la documentation).

Données génomiques harmonisées

Les données génomiques du CQDG sont harmonisées pour assurer que le même génome de référence est utilisé dans tous les jeux de données (hg38). Si une étude qui souhaite contribuer des alignements seuls au CQDG est incapable de les fournir avec cette référence, nous nous assurons de les réaligner avant de poursuivre avec les analyses de variants. Si une étude contribue déjà les variants (.vcf) mais que ceux-ci sont basés sur un différent génome de référence, nous faisons une opération "liftover" pour que les coordonnées des variants s'accordent avec notre génome de référence.

Pour plus de détails concernant notre méthodologie, consulter la page Pipelines bioinformatiques.

Création de cohorte virtuelle

Le portail du CQDG est conçu pour permettre aux chercheurs d'explorer les données génomiques et cliniques disponibles et d'assembler une cohorte virtuelle de participants selon les critères désirés.

Pour en savoir plus, consulter le guide d'utilisation.

Analyse de variants

Le portail du CQDG offre aux chercheurs un catalogue des variants génomiques annotés présents dans l'ensemble des jeux de données disponibles sur la plateforme.

Explorateur de variants

Les résultats de nos pipelines bioinformatiques sont mis à la disposition des usagers via l'explorateur de variants. Dans cet outil, vous pouvez filtrer les variants en utilisant divers critères de nature génétiques, reliés aux phénotypes, à la pathogénicité, etc. Par exemple, vous pouvez sélectionner les variants associés à un gène qui sont reliés à certains phénotypes en spécifiant leurs codes HPO. Plusieurs informations sont disponibles pour chaque variant, dont les conséquences fonctionnelles (issues de VEP), la pathogénicité (ClinVar), et la fréquence du variant dans gnomAD ainsi que dans le jeu de données complet du CQDG. Nous oeuvrons à rendre disponible le plus d'informations possible, notamment les mesures de qualité (read depth).

Pour en savoir plus, consulter le guide d'utilisation.

Accès aux données génomiques

Vous pouvez travailler directement avec les fichiers de données génomiques auxquels vous avez obtenu accès. Téléchargez-les à l'aide de notre outil ferload, ou analysez-les directement dans Cavatica.