diff --git a/README.md b/README.md index 2ef7f73..cabacf3 100644 --- a/README.md +++ b/README.md @@ -3,6 +3,11 @@ author: François Pelletier title: Les principes FAIR date: 28 novembre 2023 fragments: false +parallaxBackgroundImage: bg-slide.jpg +parallaxBackgroundSize: contain +title-slide-attributes: + data-background-image: bg-cover.jpg + data-background-size: contain --- ## Les principes FAIR @@ -20,15 +25,7 @@ Rendre les données de recherche réutilisables par les individus et les machine ## Données massives -![donnees-massives.drawio.svg](donnees-massives.drawio.svg){ height=512px }\ - -## Données massives - -- Volume -- Variété -- Vélocité -- Véracité -- Valeur +![- Volume - Variété - Vélocité - Véracité - Valeur](donnees-massives.drawio.svg "Les 5 V des données massives"){ height=512px }\ ## Complexité des données @@ -57,30 +54,26 @@ Rendre les données de recherche réutilisables par les individus et les machine ## Déplacer et stocker les données -À l'Université Laval, nous avons: - - Médias physiques: Livres, Microfiches, VHS, Disques 🦣︎ - Enjeu de dégradation des supports -- Serveurs: Sites web, FTP, GLOBUS, S3, GitLab, Subversion 🖥︎ - - Enjeux d'accès, permissions ... - Logiciels partagés Microsoft 365: SharePoint, Teams, ... 🌩︎ - - Enjeu de persistance et d'authenticité + - Enjeu de pérennité et d'authenticité + - Risque de fouillis + +## Déplacer et stocker les données + +- Serveurs: VALERIA, Alliance (Calcul Canada), SFTP, GLOBUS, S3, GitLab, Pixel/Subversion 🖥︎ + - Enjeux d'accès, permissions, complexité ... ça s'apprend, mais c'est moins intuitif ! + - En savoir plus après aujourd'hui ! ## Que signifie FAIR ? -![Principes FAIR.drawio.svg](Principes%20FAIR.drawio.svg){ height=512px }\ - -## Que signifie FAIR ? - -- **F**indable (découvrable) -- **A**ccessible (accessible) -- **I**nteroperable (interoperable) -- **R**eusable (réutilisable) +![Findable, Accessible, Interoperable, Reusable dans un diagramme de Venn. L'intersection est FAIR](Principes%20FAIR.drawio.svg){ height=512px }\ ## Définitions formelles - FAIR a été défini par [Wilkinson, M. D. et al. (2016)](https://www.nature.com/articles/sdata201618) -- Le concept d'Open Data est défini par l'Open Knowledge Foundation, via la [Définition du Savoir Libre](https://opendefinition.org/od/1.1/fr/). +- [Définition du Savoir Libre](https://opendefinition.org/od/1.1/fr/) qui a inspiré FAIR, par l'Open Knowledge Foundation. ## Qu'est-ce qui est concerné par FAIR? @@ -132,32 +125,32 @@ Tous les actifs numériques produits par des activités de recherche - [Data World](https://data.world/) - Dépôt de données commercial - [Kaggle](https://www.kaggle.com/) - Données de concours, la documentation et les métadonnées peuvent être limitées -## Accessible (accessible) +## Accessible - Métadonnées - - Normalisées - - Identifiant unique - - Licence d'utilisation + - **Normalisées** (j'y reviens) + - Identifiant **unique** (URI, mentionné ci-haut) + - **Licence** d'utilisation - [Open Database License](https://opendatacommons.org/licenses/odbl/) - [Creative Commons License](https://creativecommons.org/share-your-work/cclicenses/) -## Accessible (accessible) +## Accessible - Protocole d'accès aux métadonnées - Caractéristiques - - Libre: Aucune restriction d'usage - - Ouvert: Documenté - - Universel: Utilisable avec plusieurs médias + - **Libre**: Aucune restriction d'usage + - **Ouvert**: Documenté + - **Universel**: Utilisable avec plusieurs médias - Permission: Authentification et Autorisation - Exemples: HTTPS, FTP, Courriel, Téléphone, Poste -## Accessible (accessible) +## Accessible - Métadonnées indépendantes des données - - Si les données expirent ou on reçoit une demande de suppression - - Sensibilité des données (confidentiel) + - Si les données expirent ou on reçoit une demande de suppression, les métadonnées gardent trace + - Publiques (si les données sont confidentielles) -## Interoperable (interoperable) +## Interoperable - Représentation des connaissances - Formalisé @@ -165,37 +158,41 @@ Tous les actifs numériques produits par des activités de recherche - Partagé - Applicables à plusieurs contextes -## Interoperable (interoperable) +## Interoperable + +![crayola-excel.png](crayola-excel.png) + +## Interoperable + +- Formats de données ouverts + - [Référentiel général d'interopérabilité (France)](https://www.numerique.gouv.fr/publications/interoperabilite/) + - CSV, JSON, XML, formats spécialisés (DICOM en médecine) + - Dites non aux fichiers Excel "Crayola" [Junk Charts](https://junkcharts.typepad.com/junk_charts/) + +## Interoperable + +![langfr-800px-Taxonomic_hierarchy.svg.png](langfr-800px-Taxonomic_hierarchy.svg.png){ height=512px }\ + +## Interoperable - Vocabulaire - - (vient de la biologie, utilisé dans d'autres sciences) + - Taxonomie (vient de la biologie, utilisé dans d'autres sciences) - Ontologies - [BioPortal](https://bioportal.bioontology.org/ontologies) - [EU Semantic Interoperability Catalogue](https://joinup.ec.europa.eu/collection/eu-semantic-interoperability-catalogue) - [Logiciel Protégé](https://protege.stanford.edu/) - FAIR aussi (récursivité) - -## Interoperable (interoperable) - -![langfr-800px-Taxonomic_hierarchy.svg.png](langfr-800px-Taxonomic_hierarchy.svg.png){ height=512px }\ - -## Interoperable (interoperable) - -- Références - - Identifiants uniques -- Toile de données - - Linked Data -- Concerne les données et les métadonnées + - Enjeu souvent rencontré, le papier existe, l'ontologie n'a jamais été publiée 😭 ## Reusable (réutilisable) - Description riche - - Pourquoi les données ont été collectées - - Enjeux et limitations des données - - Dates, conditions, personnel, paramètres de collecte - - Données brutes ou traitées - - Expliquer les noms des variables (si pas dans un vocabulaire contrôlé) - - Version des données + - **Pourquoi** les données ont été collectées + - **Enjeux et limitations** des données + - **Dates, conditions, personnel, paramètres** de collecte + - Données **brutes ou traitées** + - **Expliquer les noms des variables** (si pas dans un vocabulaire contrôlé) + - Version ## Reusable (réutilisable) @@ -224,12 +221,10 @@ Tous les actifs numériques produits par des activités de recherche ## Qualité des données - Augmenter la qualité des données de recherche - - Données complètes - - Intégrité des données + - Données complètes et intègres - Sources vérifiables - - Éliminer la duplication - Validité (domaines de valeurs) - - Temporalité (âge des données) + - Temporalité (cycle de vie, on y revient) ## Revalorisation @@ -247,40 +242,26 @@ Tous les actifs numériques produits par des activités de recherche ## Cycle de vie -![Cycle de vie des données.drawio.svg](Cycle%20de%20vie%20des%20donn%C3%A9es.drawio.svg){ height=512px }\ +![Génération, Collecte, Traitement, Entreposage, Gestion, Analyse, Visualisation, Interprétation](Cycle%20de%20vie%20des%20donn%C3%A9es.drawio.svg "Cycle de vie des données"){ height=512px }\ ## Cycle de vie -- Génération -- Collecte -- Traitement -- Entreposage -- Gestion -- Analyse -- Visualisation -- Interprétation - -## Cycle de vie - -- Aider les chercheur.es à organiser leurs données tout au long du cycle de vie -- Gestion des consentements +- Gestion de projet +- Gestion des consentements (gouvernance) - Facilite l'élaboration de plan de gestion de données -- Mise à jour des résultats +- Facilite la mise à jour des résultats (automatisation) ## Transparence - Favoriser la reddition de compte et la demande de financement public - Augmenter la valeur et l'impact à long terme de la recherche - Réduire les rétractations - - Opinion publique + - Améliorer l'opinion publique et l'acceptabilité sociale (surtout avec les données médicales, ex: Cancer) ## Références - Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: (2016). - Open Knowledge Foundation. Définition du Savoir Libre. Version: 1.1 - -## Références - - Go FAIR. FAIR Principles - OpenAIRE. How to make your data FAIR. diff --git a/bg-cover.jpg b/bg-cover.jpg new file mode 100644 index 0000000..2c71767 Binary files /dev/null and b/bg-cover.jpg differ diff --git a/bg-slide.jpg b/bg-slide.jpg new file mode 100644 index 0000000..6c7dfe6 Binary files /dev/null and b/bg-slide.jpg differ diff --git a/crayola-excel.png b/crayola-excel.png new file mode 100644 index 0000000..9716757 Binary files /dev/null and b/crayola-excel.png differ diff --git a/ulaval-ppr-principes-fair.html b/ulaval-ppr-principes-fair.html index 423e826..ecdc359 100644 --- a/ulaval-ppr-principes-fair.html +++ b/ulaval-ppr-principes-fair.html @@ -36,7 +36,7 @@
-
+

Les principes FAIR

François Pelletier

28 novembre 2023

@@ -61,18 +61,10 @@ les machines.

Données massives

-

 

-
-
-

Données massives

-
    -
  • Volume
  • -
  • Variété
  • -
  • Vélocité
  • -
  • Véracité
  • -
  • Valeur
  • -
+


+

Complexité des données

@@ -117,38 +109,36 @@ Scholar

Déplacer et stocker les données

-

À l’Université Laval, nous avons:

  • Médias physiques: Livres, Microfiches, VHS, Disques 🦣︎
    • Enjeu de dégradation des supports
  • -
  • Serveurs: Sites web, FTP, GLOBUS, S3, GitLab, -Subversion 🖥︎ -
      -
    • Enjeux d’accès, permissions …
    • -
  • Logiciels partagés Microsoft 365: SharePoint, Teams, … 🌩︎
      -
    • Enjeu de persistance et d’authenticité
    • +
    • Enjeu de pérennité et d’authenticité
    • +
    • Risque de fouillis
    • +
  • +
+
+
+

Déplacer et stocker les données

+
    +
  • Serveurs: VALERIA, Alliance (Calcul Canada), SFTP, +GLOBUS, S3, GitLab, Pixel/Subversion 🖥︎ +
      +
    • Enjeux d’accès, permissions, complexité … ça +s’apprend, mais c’est moins intuitif !
    • +
    • En savoir plus après aujourd’hui !

Que signifie FAIR ?

 

-
-
-

Que signifie FAIR ?

-
    -
  • Findable (découvrable)
  • -
  • Accessible (accessible)
  • -
  • Interoperable (interoperable)
  • -
  • Reusable (réutilisable)
  • -
+alt="Findable, Accessible, Interoperable, Reusable dans un diagramme de Venn. L’intersection est FAIR" /> 

Définitions formelles

@@ -156,10 +146,9 @@ alt="Principes FAIR.drawio.svg" /> 

  • FAIR a été défini par Wilkinson, M. D. et al. (2016)
  • -
  • Le concept d’Open Data est défini par l’Open -Knowledge Foundation, via la Définition du Savoir -Libre.
  • +Libre qui a inspiré FAIR, par l’Open Knowledge Foundation.
    @@ -262,9 +251,10 @@ limitées
    • Métadonnées
        -
      • Normalisées
      • -
      • Identifiant unique
      • -
      • Licence d’utilisation +
      • Normalisées (j’y reviens)
      • +
      • Identifiant unique (URI, mentionné +ci-haut)
      • +
      • Licence d’utilisation
        • Open Database @@ -283,9 +273,11 @@ Commons License
          • Caractéristiques
              -
            • Libre: Aucune restriction d’usage
            • -
            • Ouvert: Documenté
            • -
            • Universel: Utilisable avec plusieurs médias
            • +
            • Libre: Aucune restriction +d’usage
            • +
            • Ouvert: Documenté
            • +
            • Universel: Utilisable avec +plusieurs médias
          • Permission: Authentification et Autorisation
          • Exemples: HTTPS, FTP, Courriel, Téléphone, @@ -299,8 +291,9 @@ Poste
          • Métadonnées indépendantes des données
            • Si les données expirent ou on reçoit une demande de -suppression
            • -
            • Sensibilité des données (confidentiel)
            • +suppression, les métadonnées gardent trace +
            • Publiques (si les données sont +confidentielles)
    @@ -318,11 +311,39 @@ suppression

    Interoperable (interoperable)

    +
    +crayola-excel.png + +
    +
    +
    +

    Interoperable (interoperable)

    + +
    +
    +

    Interoperable (interoperable)

    +


    +

    +
    +
    +

    Interoperable (interoperable)

    • Vocabulaire
        -
      • (vient de la biologie, utilisé dans d’autres -sciences)
      • +
      • Taxonomie (vient de la biologie, utilisé dans +d’autres sciences)
      • Ontologies
      • -
      • FAIR aussi (récursivité)
      • -
    • -
    -
    -
    -

    Interoperable (interoperable)

    -

     

    -
    -
    -

    Interoperable (interoperable)

    +
  • FAIR aussi (récursivité)
      -
    • Références -
        -
      • Identifiants uniques
      • +
      • Enjeu souvent rencontré, le papier existe, +l’ontologie n’a jamais été publiée 😭
    • -
    • Toile de données -
    • -
    • Concerne les données et les métadonnées
  • @@ -363,14 +367,16 @@ class="uri">https://www.w3.org/DesignIssues/LinkedData.html
    • Description riche
        -
      • Pourquoi les données ont été collectées
      • -
      • Enjeux et limitations des données
      • -
      • Dates, conditions, personnel, paramètres de -collecte
      • -
      • Données brutes ou traitées
      • -
      • Expliquer les noms des variables (si pas dans un -vocabulaire contrôlé)
      • -
      • Version des données
      • +
      • Pourquoi les données ont été +collectées
      • +
      • Enjeux et limitations des +données
      • +
      • Dates, conditions, personnel, +paramètres de collecte
      • +
      • Données brutes ou traitées
      • +
      • Expliquer les noms des variables +(si pas dans un vocabulaire contrôlé)
      • +
      • Version
    @@ -417,12 +423,10 @@ class="slide level2">
    • Augmenter la qualité des données de recherche
        -
      • Données complètes
      • -
      • Intégrité des données
      • +
      • Données complètes et intègres
      • Sources vérifiables
      • -
      • Éliminer la duplication
      • Validité (domaines de valeurs)
      • -
      • Temporalité (âge des données)
      • +
      • Temporalité (cycle de vie, on y revient)
    @@ -452,30 +456,18 @@ trouver des équivalences de vocabulaire

    Cycle de vie

    Cycle de vie des données.drawio.svg 

    +title="Cycle de vie des données" height="512" +alt="Génération, Collecte, Traitement, Entreposage, Gestion, Analyse, Visualisation, Interprétation" /> 

    Cycle de vie

      -
    • Génération
    • -
    • Collecte
    • -
    • Traitement
    • -
    • Entreposage
    • -
    • Gestion
    • -
    • Analyse
    • -
    • Visualisation
    • -
    • Interprétation
    • -
    -
    -
    -

    Cycle de vie

    -
      -
    • Aider les chercheur.es à organiser leurs données -tout au long du cycle de vie
    • -
    • Gestion des consentements
    • +
    • Gestion de projet
    • +
    • Gestion des consentements (gouvernance)
    • Facilite l’élaboration de plan de gestion de données
    • -
    • Mise à jour des résultats
    • +
    • Facilite la mise à jour des résultats +(automatisation)
    @@ -487,7 +479,8 @@ financement public recherche
    • Réduire les rétractations
    • -
    • Opinion publique
    • +
    • Améliorer l’opinion publique et l’acceptabilité +sociale (surtout avec les données médicales, ex: Cancer)
    @@ -501,11 +494,6 @@ class="uri">https://dx.doi.org/10.1038/sdata.2016.18 (2016).
  • Open Knowledge Foundation. Définition du Savoir Libre. Version: 1.1 https://opendefinition.org/od/1.1/fr/
  • - - -
    -

    Références

    -
    • Go FAIR. FAIR Principles https://www.go-fair.org/fair-principles/
    • @@ -678,6 +666,12 @@ class="uri">https://creativecommons.org/licenses/by/4.0/.

      // viewDistance in order to save resources. mobileViewDistance: 2, + // Parallax background image + parallaxBackgroundImage: 'bg-slide.jpg', // e.g. "'https://s3.amazonaws.com/hakim-static/reveal-js/reveal-parallax-1.jpg'" + + // Parallax background size + parallaxBackgroundSize: 'contain', // CSS syntax, e.g. "2100px 900px" + // reveal.js plugins plugins: [ RevealNotes,