2023-11-13 04:05:20 +00:00
---
author: François Pelletier
title: Les principes FAIR
date: 28 novembre 2023
2023-11-27 05:15:21 +00:00
fragments: false
2023-11-13 04:05:20 +00:00
---
2023-11-12 20:06:59 +00:00
2023-11-27 05:15:21 +00:00
## Les principes FAIR
2023-11-13 04:05:20 +00:00
## Objectif
Rendre les données de recherche réutilisables par les individus et les machines.
## Enjeux actuels avec les données
2023-11-27 05:15:21 +00:00
- Données massives
- Complexité des données
- Trouver ce qui existe déjà
- Déplacer et stocker les données
## Données massives
![donnees-massives.drawio.svg ](donnees-massives.drawio.svg ){ height=512px }\
## Données massives
2023-11-13 04:05:20 +00:00
- Volume
- Variété
- Vélocité
- Véracité
- Valeur
2023-11-27 05:15:21 +00:00
## Complexité des données
2023-11-13 04:05:20 +00:00
- Multidisciplinaires
- Méthodes et instruments complexes
- Logiciels et matériel requis
- Environnement légal et éthique
2023-11-27 05:15:21 +00:00
## Trouver ce qui existe déjà
- Trouver un article
- Bibliothèque: [Sofia ](https://www.bibl.ulaval.ca/ ) 🎯
- [Google Scholar ](https://scholar.google.ca/ )
- [arXiv ](https://arxiv.org/ )
- Télécharger l'article
- Bibliothèque 📚,
- Payer 💸
- 🐦⬛
2023-11-13 04:05:20 +00:00
2023-11-27 05:15:21 +00:00
## Trouver ce qui existe déjà
2023-11-13 04:05:20 +00:00
2023-11-27 05:15:21 +00:00
- Trouver les données qui vont avec:
- Pas évident 🧗
- Ouvrir les données:
- Surprise 🤡
## Déplacer et stocker les données
2023-11-13 04:05:20 +00:00
À l'Université Laval, nous avons:
2023-11-27 05:15:21 +00:00
- Médias physiques: Livres, Microfiches, VHS, Disques 🦣︎
- Enjeu de dégradation des supports
- Serveurs: Sites web, FTP, GLOBUS, S3, GitLab, Subversion 🖥︎
- Enjeux d'accès, permissions ...
- Logiciels partagés Microsoft 365: SharePoint, Teams, ... 🌩︎
- Enjeu de persistance et d'authenticité
## Que signifie FAIR ?
![Principes FAIR.drawio.svg ](Principes%20FAIR.drawio.svg ){ height=512px }\
2023-11-13 04:05:20 +00:00
## Que signifie FAIR ?
- **F**indable (découvrable)
- **A**ccessible (accessible)
- **I**nteroperable (interoperable)
- **R**eusable (réutilisable)
2023-11-27 05:15:21 +00:00
## Définitions formelles
2023-11-12 20:06:59 +00:00
2023-11-27 05:15:21 +00:00
- FAIR a été défini par [Wilkinson, M. D. et al. (2016) ](https://www.nature.com/articles/sdata201618 )
- Le concept d'Open Data est défini par l'Open Knowledge Foundation, via la [Définition du Savoir Libre ](https://opendefinition.org/od/1.1/fr/ ).
2023-11-12 20:06:59 +00:00
2023-11-27 05:15:21 +00:00
## Qu'est-ce qui est concerné par FAIR?
2023-11-12 20:06:59 +00:00
2023-11-13 04:05:20 +00:00
Tous les actifs numériques produits par des activités de recherche
2023-11-12 20:06:59 +00:00
2023-11-13 04:05:20 +00:00
- Données quantitatives et qualitatives
- Figures
- Multimédia
- Texte
- Code informatique
- Protocole de recherche
- Plans et instructions de fabrication
2023-11-12 20:06:59 +00:00
2023-11-27 05:15:21 +00:00
## Findable (découvrable)
2023-11-12 20:06:59 +00:00
2023-11-13 04:05:20 +00:00
- Identifiant unique
- DOI: Digital object identifier
- Pour des actifs numériques de recherche
- [DOI Handbook ](https://doi.org/10.1000/182 )
- URI: Uniform Resource Identifier:
- Pour tout ce qui est accessible sur le web
- Inclus tous les fichiers et pages web
- S'applique aussi à des concepts et des entités.
2023-11-27 05:15:21 +00:00
- Fondement du [web sémantique (web 3.0) ](https://www.w3.org/2001/sw/ )
## Findable (découvrable)
2023-11-13 04:05:20 +00:00
- Métadonnées
- Plus elles sont détaillées, plus elles renseignent les moteurs de recherche
- [Schema.org ](https://schema.org/ ): Guide de métadonnées et vocabulaires
- [Wikidata ](https://www.wikidata.org/ ): Un exemple de structure
2023-11-13 04:34:38 +00:00
- [DataCite ](https://schema.datacite.org/ )
2023-11-27 05:15:21 +00:00
## Findable (découvrable)
2023-11-13 04:05:20 +00:00
- Indexation
- Dépôts de données
- [Borealis ](https://borealisdata.ca/ )
- [Dataverse ](https://dataverse.org/ )
2023-11-13 18:53:02 +00:00
- [Zenodo ](https://zenodo.org/ )
- [CKAN ](https://ckan.org/ ) - À installer sur son propre serveur. Utilisé dans plusieurs gouvernements dont le Canada, le Québec et la Ville de Montréal.
2023-11-27 05:15:21 +00:00
## Findable (découvrable)
- Indexation
2023-11-13 04:05:20 +00:00
- Moteurs de recherche
- [Google Datasets ](https://datasetsearch.research.google.com/ )
2023-11-13 18:53:02 +00:00
- Plateformes grand public
- [Data World ](https://data.world/ ) - Dépôt de données commercial
- [Kaggle ](https://www.kaggle.com/ ) - Données de concours, la documentation et les métadonnées peuvent être limitées
2023-11-12 20:06:59 +00:00
2023-11-27 05:15:21 +00:00
## Accessible (accessible)
2023-11-12 20:06:59 +00:00
2023-11-13 04:05:20 +00:00
- Métadonnées
- Normalisées
- Identifiant unique
- Licence d'utilisation
- [Open Database License ](https://opendatacommons.org/licenses/odbl/ )
- [Creative Commons License ](https://creativecommons.org/share-your-work/cclicenses/ )
2023-11-27 05:15:21 +00:00
## Accessible (accessible)
- Protocole d'accès aux métadonnées
- Caractéristiques
- Libre: Aucune restriction d'usage
- Ouvert: Documenté
- Universel: Utilisable avec plusieurs médias
- Permission: Authentification et Autorisation
- Exemples: HTTPS, FTP, Courriel, Téléphone, Poste
## Accessible (accessible)
- Métadonnées indépendantes des données
2023-11-13 04:05:20 +00:00
- Si les données expirent ou on reçoit une demande de suppression
- Sensibilité des données (confidentiel)
2023-11-27 05:15:21 +00:00
## Interoperable (interoperable)
2023-11-13 04:05:20 +00:00
- Représentation des connaissances
- Formalisé
- Accessible
- Partagé
- Applicables à plusieurs contextes
2023-11-27 05:15:21 +00:00
## Interoperable (interoperable)
2023-11-13 04:05:20 +00:00
- Vocabulaire
2023-11-27 05:15:21 +00:00
- (vient de la biologie, utilisé dans d'autres sciences)
2023-11-13 04:05:20 +00:00
- Ontologies
2023-11-13 04:34:38 +00:00
- [BioPortal ](https://bioportal.bioontology.org/ontologies )
- [EU Semantic Interoperability Catalogue ](https://joinup.ec.europa.eu/collection/eu-semantic-interoperability-catalogue )
- [Logiciel Protégé ](https://protege.stanford.edu/ )
2023-11-27 05:15:21 +00:00
- FAIR aussi (récursivité)
## Interoperable (interoperable)
![langfr-800px-Taxonomic_hierarchy.svg.png ](langfr-800px-Taxonomic_hierarchy.svg.png ){ height=512px }\
## Interoperable (interoperable)
2023-11-13 04:05:20 +00:00
- Références
- Identifiants uniques
- Toile de données
2023-11-13 04:34:38 +00:00
- Linked Data < https: // www . w3 . org / DesignIssues / LinkedData . html >
2023-11-13 04:05:20 +00:00
- Concerne les données et les métadonnées
2023-11-27 05:15:21 +00:00
## Reusable (réutilisable)
2023-11-13 04:05:20 +00:00
- Description riche
2023-11-27 05:15:21 +00:00
- Pourquoi les données ont été collectées
- Enjeux et limitations des données
- Dates, conditions, personnel, paramètres de collecte
- Données brutes ou traitées
- Expliquer les noms des variables (si pas dans un vocabulaire contrôlé)
- Version des données
## Reusable (réutilisable)
- Licence d'utilisation claire et accessible (interopérabilité légale)
2023-11-13 04:05:20 +00:00
- Source
- Références
2023-11-13 04:34:38 +00:00
- Lignage (qui, quand, comment, avec quoi)
2023-11-27 05:15:21 +00:00
- Code informatique de traitement
- Encodage (ISO-8859-1, UTF-8 ...)
## Reusable (réutilisable)
2023-11-13 04:05:20 +00:00
- Normes de pratique du domaine
2023-11-13 04:34:38 +00:00
- Schémas de métadonnées
2023-11-27 05:15:21 +00:00
- Mentionner quel standard suivent les données
2023-11-13 04:05:20 +00:00
## Pourquoi appliquer les principes FAIR
2023-11-27 05:15:21 +00:00
- Qualité des données
- Revalorisation
- Pérennité
- Méta-analyses
- Cycle de vie
- Transparence
## Qualité des données
2023-11-13 04:05:20 +00:00
- Augmenter la qualité des données de recherche
2023-11-13 04:07:38 +00:00
- Données complètes
- Intégrité des données
- Sources vérifiables
- Éliminer la duplication
- Validité (domaines de valeurs)
- Temporalité (âge des données)
2023-11-13 04:05:20 +00:00
2023-11-27 05:15:21 +00:00
## Revalorisation
2023-11-13 04:05:20 +00:00
- Créer des collections de données de recherche
2023-11-27 05:15:21 +00:00
## Pérennité
2023-11-13 04:05:20 +00:00
- Assurer la pérennité des résultats de recherche et des publications.
- Reproductibilité
- Autonomie dans l'usage de données de recherche
2023-11-27 05:15:21 +00:00
## Méta-analyses
2023-11-13 04:05:20 +00:00
- L'interopérabilité permet de faire des méta-analyses sans devoir convertir les données dans d'autres formats ou trouver des équivalences de vocabulaire
2023-11-27 05:15:21 +00:00
## Cycle de vie
![Cycle de vie des données.drawio.svg ](Cycle%20de%20vie%20des%20donn%C3%A9es.drawio.svg ){ height=512px }\
## Cycle de vie
- Génération
- Collecte
- Traitement
- Entreposage
- Gestion
- Analyse
- Visualisation
- Interprétation
## Cycle de vie
2023-11-13 04:05:20 +00:00
- Aider les chercheur.es à organiser leurs données tout au long du cycle de vie
- Gestion des consentements
- Facilite l'élaboration de plan de gestion de données
- Mise à jour des résultats
2023-11-27 05:15:21 +00:00
## Transparence
2023-11-13 04:05:20 +00:00
- Favoriser la reddition de compte et la demande de financement public
- Augmenter la valeur et l'impact à long terme de la recherche
- Réduire les rétractations
- Opinion publique
## Références
2023-11-13 04:34:38 +00:00
- Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: < https: // dx . doi . org / 10 . 1038 / sdata . 2016 . 18 > (2016).
- Open Knowledge Foundation. Définition du Savoir Libre. Version: 1.1 < https: // opendefinition . org / od / 1 . 1 / fr />
2023-11-27 05:15:21 +00:00
## Références
2023-11-13 04:05:20 +00:00
- Go FAIR. FAIR Principles
2023-11-13 04:34:38 +00:00
< https: / / www . go-fair . org / fair-principles / >
- OpenAIRE. How to make your data FAIR. < https: // www . openaire . eu / how-to-make-your-data-fair >
## Licence
Les principes FAIR (c) par François Pelletier
2023-11-27 05:15:21 +00:00
Les principes FAIR est disponible sous la licence Creative Commons Attribution 4.0 International License. Vous devriez avoir reçu une copie de la licence avec cette oeuvre. Sinon, voir < https: / / creativecommons . org / licenses / by / 4 . 0 / > .