ulaval-ppr-principes-fair/README.md

273 lines
8.8 KiB
Markdown
Raw Normal View History

2023-11-13 04:05:20 +00:00
---
author: François Pelletier
title: Les principes FAIR
date: 28 novembre 2023
fragments: false
2023-11-27 23:51:05 +00:00
parallaxBackgroundImage: bg-slide.jpg
parallaxBackgroundSize: contain
title-slide-attributes:
data-background-image: bg-cover.jpg
data-background-size: contain
2023-11-13 04:05:20 +00:00
---
2023-11-12 20:06:59 +00:00
## Les principes FAIR
2023-11-13 04:05:20 +00:00
## Objectif
Rendre les données de recherche réutilisables par les individus et les machines.
## Enjeux actuels avec les données
- Données massives
- Complexité des données
- Trouver ce qui existe déjà
- Déplacer et stocker les données
## Données massives
2023-11-27 23:51:05 +00:00
![- Volume - Variété - Vélocité - Véracité - Valeur](donnees-massives.drawio.svg "Les 5 V des données massives"){ height=512px }\
2023-11-13 04:05:20 +00:00
## Complexité des données
2023-11-13 04:05:20 +00:00
- Multidisciplinaires
- Méthodes et instruments complexes
- Logiciels et matériel requis
- Environnement légal et éthique
## Trouver ce qui existe déjà
- Trouver un article
- Bibliothèque: [Sofia](https://www.bibl.ulaval.ca/) 🎯
- [Google Scholar](https://scholar.google.ca/)
- [arXiv](https://arxiv.org/)
- Télécharger l'article
- Bibliothèque 📚,
- Payer 💸
- 🐦‍⬛
2023-11-13 04:05:20 +00:00
## Trouver ce qui existe déjà
2023-11-13 04:05:20 +00:00
- Trouver les données qui vont avec:
- Pas évident 🧗
- Ouvrir les données:
- Surprise 🤡
## Déplacer et stocker les données
2023-11-13 04:05:20 +00:00
- Médias physiques: Livres, Microfiches, VHS, Disques 🦣︎
- Enjeu de dégradation des supports
- Logiciels partagés Microsoft 365: SharePoint, Teams, ... 🌩︎
2023-11-27 23:51:05 +00:00
- Enjeu de pérennité et d'authenticité
- Risque de fouillis
2023-11-27 23:51:05 +00:00
## Déplacer et stocker les données
2023-11-27 23:51:05 +00:00
- Serveurs: VALERIA, Alliance (Calcul Canada), SFTP, GLOBUS, S3, GitLab, Pixel/Subversion 🖥︎
- Enjeux d'accès, permissions, complexité ... ça s'apprend, mais c'est moins intuitif !
- En savoir plus après aujourd'hui !
2023-11-13 04:05:20 +00:00
## Que signifie FAIR ?
2023-11-27 23:51:05 +00:00
![Findable, Accessible, Interoperable, Reusable dans un diagramme de Venn. L'intersection est FAIR](Principes%20FAIR.drawio.svg){ height=512px }\
2023-11-13 04:05:20 +00:00
## Définitions formelles
2023-11-12 20:06:59 +00:00
- FAIR a été défini par [Wilkinson, M. D. et al. (2016)](https://www.nature.com/articles/sdata201618)
2023-11-27 23:51:05 +00:00
- [Définition du Savoir Libre](https://opendefinition.org/od/1.1/fr/) qui a inspiré FAIR, par l'Open Knowledge Foundation.
2023-11-12 20:06:59 +00:00
## Qu'est-ce qui est concerné par FAIR?
2023-11-12 20:06:59 +00:00
2023-11-13 04:05:20 +00:00
Tous les actifs numériques produits par des activités de recherche
2023-11-12 20:06:59 +00:00
2023-11-13 04:05:20 +00:00
- Données quantitatives et qualitatives
- Figures
- Multimédia
- Texte
- Code informatique
- Protocole de recherche
- Plans et instructions de fabrication
2023-11-12 20:06:59 +00:00
## Findable (découvrable)
2023-11-12 20:06:59 +00:00
2023-11-13 04:05:20 +00:00
- Identifiant unique
- DOI: Digital object identifier
- Pour des actifs numériques de recherche
- [DOI Handbook](https://doi.org/10.1000/182)
- URI: Uniform Resource Identifier:
- Pour tout ce qui est accessible sur le web
- Inclus tous les fichiers et pages web
- S'applique aussi à des concepts et des entités.
- Fondement du [web sémantique (web 3.0)](https://www.w3.org/2001/sw/)
## Findable (découvrable)
2023-11-13 04:05:20 +00:00
- Métadonnées
- Plus elles sont détaillées, plus elles renseignent les moteurs de recherche
- [Schema.org](https://schema.org/): Guide de métadonnées et vocabulaires
- [Wikidata](https://www.wikidata.org/): Un exemple de structure
2023-11-13 04:34:38 +00:00
- [DataCite](https://schema.datacite.org/)
## Findable (découvrable)
2023-11-13 04:05:20 +00:00
- Indexation
- Dépôts de données
- [Borealis](https://borealisdata.ca/)
- [Dataverse](https://dataverse.org/)
2023-11-13 18:53:02 +00:00
- [Zenodo](https://zenodo.org/)
- [CKAN](https://ckan.org/) - À installer sur son propre serveur. Utilisé dans plusieurs gouvernements dont le Canada, le Québec et la Ville de Montréal.
## Findable (découvrable)
- Indexation
2023-11-13 04:05:20 +00:00
- Moteurs de recherche
- [Google Datasets](https://datasetsearch.research.google.com/)
2023-11-13 18:53:02 +00:00
- Plateformes grand public
- [Data World](https://data.world/) - Dépôt de données commercial
- [Kaggle](https://www.kaggle.com/) - Données de concours, la documentation et les métadonnées peuvent être limitées
2023-11-12 20:06:59 +00:00
2023-11-27 23:51:05 +00:00
## Accessible
2023-11-12 20:06:59 +00:00
2023-11-13 04:05:20 +00:00
- Métadonnées
2023-11-27 23:51:05 +00:00
- **Normalisées** (j'y reviens)
- Identifiant **unique** (URI, mentionné ci-haut)
- **Licence** d'utilisation
2023-11-13 04:05:20 +00:00
- [Open Database License](https://opendatacommons.org/licenses/odbl/)
- [Creative Commons License](https://creativecommons.org/share-your-work/cclicenses/)
2023-11-27 23:51:05 +00:00
## Accessible
- Protocole d'accès aux métadonnées
- Caractéristiques
2023-11-27 23:51:05 +00:00
- **Libre**: Aucune restriction d'usage
- **Ouvert**: Documenté
- **Universel**: Utilisable avec plusieurs médias
- Permission: Authentification et Autorisation
- Exemples: HTTPS, FTP, Courriel, Téléphone, Poste
2023-11-27 23:51:05 +00:00
## Accessible
- Métadonnées indépendantes des données
2023-11-27 23:51:05 +00:00
- Si les données expirent ou on reçoit une demande de suppression, les métadonnées gardent trace
- Publiques (si les données sont confidentielles)
2023-11-13 04:05:20 +00:00
2023-11-27 23:51:05 +00:00
## Interoperable
2023-11-13 04:05:20 +00:00
- Représentation des connaissances
- Formalisé
- Accessible
- Partagé
- Applicables à plusieurs contextes
2023-11-27 23:51:05 +00:00
## Interoperable
![crayola-excel.png](crayola-excel.png)
## Interoperable
- Formats de données ouverts
- [Référentiel général d'interopérabilité (France)](https://www.numerique.gouv.fr/publications/interoperabilite/)
- CSV, JSON, XML, formats spécialisés (DICOM en médecine)
- Dites non aux fichiers Excel "Crayola" [Junk Charts](https://junkcharts.typepad.com/junk_charts/)
## Interoperable
![langfr-800px-Taxonomic_hierarchy.svg.png](langfr-800px-Taxonomic_hierarchy.svg.png){ height=512px }\
## Interoperable
2023-11-13 04:05:20 +00:00
- Vocabulaire
2023-11-27 23:51:05 +00:00
- Taxonomie (vient de la biologie, utilisé dans d'autres sciences)
2023-11-13 04:05:20 +00:00
- Ontologies
2023-11-13 04:34:38 +00:00
- [BioPortal](https://bioportal.bioontology.org/ontologies)
- [EU Semantic Interoperability Catalogue](https://joinup.ec.europa.eu/collection/eu-semantic-interoperability-catalogue)
- [Logiciel Protégé](https://protege.stanford.edu/)
- FAIR aussi (récursivité)
2023-11-27 23:51:05 +00:00
- Enjeu souvent rencontré, le papier existe, l'ontologie n'a jamais été publiée 😭
2023-11-13 04:05:20 +00:00
## Reusable (réutilisable)
2023-11-13 04:05:20 +00:00
- Description riche
2023-11-27 23:51:05 +00:00
- **Pourquoi** les données ont été collectées
- **Enjeux et limitations** des données
- **Dates, conditions, personnel, paramètres** de collecte
- Données **brutes ou traitées**
- **Expliquer les noms des variables** (si pas dans un vocabulaire contrôlé)
- Version
## Reusable (réutilisable)
- Licence d'utilisation claire et accessible (interopérabilité légale)
2023-11-13 04:05:20 +00:00
- Source
- Références
2023-11-13 04:34:38 +00:00
- Lignage (qui, quand, comment, avec quoi)
- Code informatique de traitement
- Encodage (ISO-8859-1, UTF-8 ...)
## Reusable (réutilisable)
2023-11-13 04:05:20 +00:00
- Normes de pratique du domaine
2023-11-13 04:34:38 +00:00
- Schémas de métadonnées
- Mentionner quel standard suivent les données
2023-11-13 04:05:20 +00:00
## Pourquoi appliquer les principes FAIR
- Qualité des données
- Revalorisation
- Pérennité
- Méta-analyses
- Cycle de vie
- Transparence
## Qualité des données
2023-11-13 04:05:20 +00:00
- Augmenter la qualité des données de recherche
2023-11-27 23:51:05 +00:00
- Données complètes et intègres
2023-11-13 04:07:38 +00:00
- Sources vérifiables
- Validité (domaines de valeurs)
2023-11-27 23:51:05 +00:00
- Temporalité (cycle de vie, on y revient)
2023-11-13 04:05:20 +00:00
## Revalorisation
2023-11-13 04:05:20 +00:00
- Créer des collections de données de recherche
## Pérennité
2023-11-13 04:05:20 +00:00
- Assurer la pérennité des résultats de recherche et des publications.
- Reproductibilité
- Autonomie dans l'usage de données de recherche
## Méta-analyses
2023-11-13 04:05:20 +00:00
- L'interopérabilité permet de faire des méta-analyses sans devoir convertir les données dans d'autres formats ou trouver des équivalences de vocabulaire
## Cycle de vie
2023-11-27 23:51:05 +00:00
![Génération, Collecte, Traitement, Entreposage, Gestion, Analyse, Visualisation, Interprétation](Cycle%20de%20vie%20des%20donn%C3%A9es.drawio.svg "Cycle de vie des données"){ height=512px }\
## Cycle de vie
2023-11-27 23:51:05 +00:00
- Gestion de projet
- Gestion des consentements (gouvernance)
2023-11-13 04:05:20 +00:00
- Facilite l'élaboration de plan de gestion de données
2023-11-27 23:51:05 +00:00
- Facilite la mise à jour des résultats (automatisation)
2023-11-13 04:05:20 +00:00
## Transparence
2023-11-13 04:05:20 +00:00
- Favoriser la reddition de compte et la demande de financement public
- Augmenter la valeur et l'impact à long terme de la recherche
- Réduire les rétractations
2023-11-27 23:51:05 +00:00
- Améliorer l'opinion publique et l'acceptabilité sociale (surtout avec les données médicales, ex: Cancer)
2023-11-13 04:05:20 +00:00
## Références
2023-11-13 04:34:38 +00:00
- Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: <https://dx.doi.org/10.1038/sdata.2016.18> (2016).
- Open Knowledge Foundation. Définition du Savoir Libre. Version: 1.1 <https://opendefinition.org/od/1.1/fr/>
2023-11-13 04:05:20 +00:00
- Go FAIR. FAIR Principles
2023-11-13 04:34:38 +00:00
<https://www.go-fair.org/fair-principles/>
- OpenAIRE. How to make your data FAIR. <https://www.openaire.eu/how-to-make-your-data-fair>
## Licence
Les principes FAIR (c) par François Pelletier
Les principes FAIR est disponible sous la licence Creative Commons Attribution 4.0 International License. Vous devriez avoir reçu une copie de la licence avec cette oeuvre. Sinon, voir <https://creativecommons.org/licenses/by/4.0/>.