« FAQ » : différence entre les versions

De Cat OPIDoR
Ligne 53 : Ligne 53 :
'''Entrepôt de données''' : Il s’agit d’une plateforme numérique garantissant la conservation et l’accès permanents à des jeux de données issus de la recherche ou destinés à des fins de recherche. On peut y déposer et y rechercher un jeu de données.
'''Entrepôt de données''' : Il s’agit d’une plateforme numérique garantissant la conservation et l’accès permanents à des jeux de données issus de la recherche ou destinés à des fins de recherche. On peut y déposer et y rechercher un jeu de données.


'''Annuaire de données''' : Un annuaire de données est un catalogue en ligne de données scientifiques. Il donne une description structurée et uniforme de chaque jeu de données.
'''Plateforme d'accès''' : Site web permettant la recherche, la consultation, la visualisation ou le téléchargement de données ou métadonnées scientifiques.


'''Plateforme d'archivage''' : Une plateforme d’archivage accueille des données de recherche au format numérique, dans le but de les conserver sur le long terme (au-delà de 30 ans), tout en préservant la lisibilité et l’intelligibilité des fichiers dans le temps.
'''Plateforme d'archivage''' : Une plateforme d’archivage accueille des données de recherche au format numérique, dans le but de les conserver sur le long terme (au-delà de 30 ans), tout en préservant la lisibilité et l’intelligibilité des fichiers dans le temps.

Version du 5 février 2019 à 14:08

Cat OPIDoR a été lancé le 28 septembre 2017. Ses administrateurs continuent de travailler à son perfectionnement. Certains affichages et supports explicatifs pourront donc être amenés à évoluer au cours des prochains mois.


Définitions[modifier]

Qu'est-ce qu'une donnée de recherche ?[modifier]

Il n’existe pas de définition juridique des données de recherche.

Pour délimiter le périmètre de Cat OPIDoR, nous nous sommes appuyés sur la définition proposée par l’OCDE, à savoir : « Les données de recherche sont enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche ». Organisation de Coopération et de Développement Économiques, Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics. Paris, 2007, p.18, [1]

Qu’est-ce qu’un service ?[modifier]

Un service dédié aux données de recherche est un service intervenant au cours du cycle de vie des données et/ou permettant une bonne gestion des données. Il peut être un entrepôt de données, une plateforme de calcul, une offre de formation à la gestion des données, etc. On le distingue de la structure d’appartenance, qui est l’infrastructure, l’unité ou le département opérant le service.

Qu’est-ce qu’une structure d’appartenance ?[modifier]

Nous utilisons le terme « structure d’appartenance » pour désigner l’infrastructure ou le département qui opère ou héberge un ou plusieurs services.

Qu’est-ce que le cycle de vie des données ?[modifier]

Le cycle de vie des données de recherche schématise l’ensemble des étapes de gestion, de conservation, de diffusion et de réutilisation des données scientifiques liées à un projet de recherche.

Quelles sont les différentes phases du cycle de vie ?[modifier]

Planification : étape d’anticipation, de réflexion, de formation si besoin et d'organisation, en amont du projet de recherche (c’est à cette étape notamment qu’est rédigée la première version du plan de gestion de données).

Collecte : étape au cours de laquelle le chercheur acquiert/génère/rassemble des données à des fins d’analyse.

Analyse : étape d’analyse des données, pouvant requérir un traitement informatique spécifique (logiciel scientifique, calcul intensif…).

Documentation : étape de description des données à l’aide de métadonnées et d'informations complémentaires si nécessaire.

Stockage : étape consistant à sauvegarder les données et leurs métadonnées sur un support de stockage (disque dur, cloud…) jusqu’au terme du projet de recherche.

Conservation : étape au cours de laquelle le chercheur confie à une infrastructure dédiée l’archivage d’une sélection de données qu’il souhaite conserver sur le long terme.

Exposition : étape de diffusion des données (le chercheur peut les déposer dans un entrepôt et/ou les décrire dans un data paper…)

Réutilisation : étape au cours de laquelle un chercheur souhaite collecter des données pour les exploiter, les intégrer à d'autres données. Cette étape sera d'autant facilitée que les données seront faciles à trouver, accessibles, intelligibles et exploitables par des machines.

Quels sont les différents types de service ?[modifier]

Service d'information : Un service d’information est un site web agrégeant des informations et des actualités sur le thème des données de recherche.

Service de formation : Il s’agit d’un service de formation voire d’auto-formation, en présentiel ou à distance, portant sur un ou plusieurs aspects de la gestion des données de recherche.

Service d'accompagnement : Un service d’accompagnement a pour vocation d’offrir aux personnels de recherche une aide personnalisée dans la gestion des données scientifiques (accompagnement dans la rédaction d’un plan de gestion de données, aide au dépôt des données ou à la création d’une base de données…). Il s’agit généralement d’une équipe, dont les membres disposent d’une expertise informatique, documentaire, archivistique et/ou juridique.

Outil de gestion de données : Il s’agit d’outils permettant de planifier et de mettre en œuvre la gestion ou la réutilisation de données de recherche (aide à la rédaction de plans de gestion de données, éditorialisation de données, attribution d'identifiants pérennes...).

Plateforme d'acquisition : On définit comme plateforme d’acquisition toute infrastructure mettant à la disposition des équipes de recherche des moyens techniques et humains pour la collecte de données.

Plateforme de calcul : Une plateforme de calcul est une infrastructure mettant à la disposition des équipes de recherche des moyens informatiques et humains pour le calcul intensif, à des fins de simulation, de modélisation et/ou d’analyse numériques.

Entrepôt de données : Il s’agit d’une plateforme numérique garantissant la conservation et l’accès permanents à des jeux de données issus de la recherche ou destinés à des fins de recherche. On peut y déposer et y rechercher un jeu de données.

Plateforme d'accès : Site web permettant la recherche, la consultation, la visualisation ou le téléchargement de données ou métadonnées scientifiques.

Plateforme d'archivage : Une plateforme d’archivage accueille des données de recherche au format numérique, dans le but de les conserver sur le long terme (au-delà de 30 ans), tout en préservant la lisibilité et l’intelligibilité des fichiers dans le temps.

Comment naviguer dans Cat OPIDoR ?[modifier]

Par type de service[modifier]

Cat OPIDoR propose également une classification des services, selon la principale fonction qu’ils remplissent. Neuf types de services ont été définis : les services d’information, de formation, d’accompagnement, les outils de gestion des données, les plateformes d'acquisition, les plateformes de calcul, les entrepôts de données, les annuaires de données et les plateformes d'archivage.

Par exemple, si vous souhaitez réaliser des simulations numériques, vous pouvez consulter la page Plateforme de calcul puis affiner votre recherche.

Par stade du cycle de vie[modifier]

Lors du montage de votre projet de recherche ou de thèse ou lors de l’élaboration de votre plan de gestion de données, vous pouvez être amenés à vous interroger sur la disponibilité de services français ou locaux, vous permettant de réaliser l’une ou l’autre des étapes du processus de recherche.

Cat OPIDoR vous propose une classification des services selon le stade du cycle de vie des données : planification, collecte, analyse, documentation, stockage, conservation, exposition, réutilisation.

Si, par exemple, vous souhaitez exposer des données de recherche, vous pouvez visualiser la liste des services contribuant à cette étape, en vous rendant sur la page Exposition. Vous pouvez ensuite affiner votre recherche en filtrant par le type de service dont vous avez spécifiquement besoin.

Par domaine scientifique[modifier]

Les services sont également catégorisés en fonction du domaine scientifique.

Cat OPIDoR propose une classification qui reprend les deux premiers niveaux de la classification du European Research Council. Celle-ci s’articule en trois grands domaines : Sciences Humaines & Sociales ; Sciences & Technologies ; Vie & Santé. Chaque grand domaine se déploie en 6 à 10 sous-domaines (vous pouvez visualiser les intitulés exacts sur la page d’accueil, lorsque vous « développez » un des trois grands domaines).

Les types de données, thématiques et/ou mots-clés enregistrés en texte libre permettent de décrire plus finement les services et vous aident dans une recherche plein texte avec le moteur de recherche.

Sur la page Sciences & Technologies, par exemple, on peut donc retrouver la liste de tous les services répertoriés dans ce domaine. Si l’on s’intéresse au sous-domaine Sciences de la Terre, on peut également visualiser la liste des services affiliés depuis la page Sciences de la Terre.

NB : Un service peut relever d’un à plusieurs domaines (s’il est multidisciplinaire, il relève des trois domaines).

Comment contribuer à Cat OPIDoR ?[modifier]

Respect du thème[modifier]

Ce wiki accepte les entrées concernant les services et structures d'appartenance dédiés aux données de la recherche en France.

Contributeurs[modifier]

Ce wiki est ouvert. Vous pouvez y contribuer en signalant un service que vous fournissez ou utilisez, ou en enrichissant les descriptions existantes.

Pour toute contribution, vous certifiez être l'auteur du contenu ajouté ou avoir copié celui-ci d’une source provenant du domaine public ou d’une ressource libre. N’UTILISEZ PAS DE TRAVAUX SOUS DROIT D’AUTEUR SANS AUTORISATION EXPRESSE !

Toutes les contributions à Cat OPIDoR peuvent être modifiées ou supprimées par d’autres utilisateurs. Si vous ne désirez pas que vos écrits soient modifiés et distribués à volonté, merci de ne pas les soumettre ici.

L'Inist-CNRS assure la modération de ce site et se réserve le droit de supprimer un contenu non pertinent ou de bloquer un utilisateur ou une adresse IP.

Nous vous encourageons à créer un compte, afin de faciliter les échanges avec l'Inist-CNRS dans le cadre d'éventuelles corrections et mises à jour.

Ajouter un service[modifier]

Pour ajouter un service, utilisez obligatoirement le formulaire suivant : Formulaire:Service.

Afin d'éviter les doublons, veuillez vérifier que le service n'est pas déjà décrit en consultant la page Tous les services.

Nommer un service[modifier]

Pour nommer le service, utilisez son nom usuel. Le nom du service sera le titre de la page.

S'il est identique à celui de la structure d'appartenance, alors construisez-le selon la règle suivante : Structure d'appartenance:Type du service

Exemple: CINES:Plateforme d'archivage

Évitez si possible de modifier les titres de page, car d'autres articles y font peut-être référence.

Décrire un service[modifier]

Lorsque vous remplissez ou enrichissez le champ "Description" d'un service, veillez à proposer une description détaillée. Les questions et exemples suivants pourront vous aider à compléter ce champ :

  • Quelle est sa finalité/qu'offre-t-il à ses utilisateurs ?
  • Quel est son mode de fonctionnement ?
  • Quelles sont ses spécificités ?
  • Quelles sont ses garanties de qualité (identifiants pérennes, stockage sécurisé, etc.) ?
Exemples de description  : 
-D'un service d'information : Cirad : Information
-D'un service de formation : DoRANum
-D'un service d'accompagnement : BBEES : Accompagnement
-D'un outil de gestion de données : DMP OPIDoR
-D'une plateforme d'acquisition : Constances
-D'une plateforme de calcul : CC-IN2P3
-D'un annuaire de données : BBEES : Annuaire de données
-D'un entrepôt de données : ArkeoGIS
-D'une plateforme d'archivage : CINES : Plateforme d'archivage

Ajouter une structure d'appartenance[modifier]

Pour ajouter une structure, utilisez le formulaire suivant : Formulaire:Structure.

Afin d'éviter les doublons, veuillez vérifier que la structure n'est pas déjà décrite en consultant la page Toutes les structures.

Pourquoi le service ou la structure nouvellement créé n'apparaît pas dans les autres pages de Cat OPIDoR ?[modifier]

Les nouvelles pages créées dans le wiki apparaissent dans les pages « résultats » comme la liste "toutes les structures", "tous les services", ou la liste des entrepôts de données avec un temps de latence. En étant connecté, sur une page de « résultats », si vous cliquez en haut à droite sur le bouton « Plus », vous avez la possibilité d’ « actualiser » et mettre à jour la page plus rapidement.