« CoCoON » : différence entre les versions

De Cat OPIDoR
Aucun résumé des modifications
Aucun résumé des modifications
 
(20 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 3 : Ligne 3 :
|NomService=CoCoON
|NomService=CoCoON
|TypeService=Entrepôt de données
|TypeService=Entrepôt de données
|TypeEntrepot=Disciplinaire
|TypeRestriction=Soumis à la création d'un compte
|HebergementDonnees=France
|AttributionIdentifiant=Oui
|TypeIdentifiantAttribue=DOI
|FormatsFichiers=Pour les documents audio: WAV et FLAC;
Pour les documents vidéo: MPEG-4 et MKV;
Pour les documents d'annotations:
un document XML encodé en UTF-8, utilisant de préférence des standards (TEI, TalkBank...) ou des schémas ou DTD manipulés par des outils répandus (ELAN, transcriber) ;
un document Text seul encodé en UTF-8, de préférence utilisant des conventions connues (comme par exemple le format CHAT du projet CHILDES, utilisé dans l'outil CLAN) ;
un document PDF, utilisé comme un format conteneur pour des images numérisées d'originaux sur des supports papier.
Pour les électroglottogrammes (EGG), le format WAV/PCM.(Source https://cocoon.huma-num.fr/exist/crdo/formats.htm)
|SchemaMetadonnees=Dublin Core qualifié
|ConditionAccesDonnees=Ouvert, Embargo, Restreint
|Curation=Une première étape de modération consiste à vérifier que le déposant fait bien partie de la communauté. La publication de toute donnée passe par une phase de contrôle où un administrateur de la plateforme va vérifier la bonne formation des données et métadonnées, le degré de complétude et de précision de la description, normalisera si besoin la forme des données et métadonnées et enrichira la description par l'alignement sur des référentiels. Enfin pour les données publiées, toute modification des données ou métadonnées passent également par ce même type de contrôle. Dans tous les cas (publication ou modification) un échange pourra intervenir pour demander des compléments d'information.
|Volumetrie=En fonction des formats : WAV (entre 2 et 4Go), FLAC pour les fichiers plus volumineux, mais pas formellement précisé
|ConservationDonnees=Les données (dans leur format de conservation) sont automatiquement versées dans le système d'archivage du CINES
|Interoperabilite=OAI-PMH, SPARQL
|Versioning=Oui
|StatutService=En production
|StatutService=En production
|NomAlternatif=Collections de Corpus Oraux Numériques - anciennement Centre de Ressources pour la Description de l'Oral (CRDO) - Groupe Gestion documentaire et réservoir de données
|NomAlternatif=Collections de Corpus Oraux Numériques - anciennement Centre de Ressources pour la Description de l'Oral (CRDO) - Groupe Gestion documentaire et réservoir de données
Ligne 9 : Ligne 28 :
|Localisation=Paris
|Localisation=Paris
|StructureAppartenance=Lacito, LLL
|StructureAppartenance=Lacito, LLL
|IdentifiantService=
|Tutelle=Université Sorbonne Nouvelle Paris 3, CNRS, INALCO, Université de Tours, Université d'Orléans
|IdentifiantAlternatif=http://doi.org/10.17616/R3QD3K;re3data
|IDre3data=10.17616/R3QD3K
|PhaseCycleVie=Documentation, Stockage, Conservation, Exposition, Réutilisation
|PhaseCycleVie=Documentation, Stockage, Conservation, Exposition, Réutilisation
|PossibiliteDepot=Ouvert
}}
{{Coordonnées GPS
|CoordonneeGeographique=48.85014, 2.32698
|CoordonneeGeographique=48.85014, 2.32698
}}
}}
Ligne 19 : Ligne 41 :
<div style="text-indent: 0px;">L'entrepôt CoCoON est régulièrement moissonné par des fournisseurs de services tels que :</div>
<div style="text-indent: 0px;">L'entrepôt CoCoON est régulièrement moissonné par des fournisseurs de services tels que :</div>
* la plateforme [http://www.rechercheisidore.fr/ Isidore] ;
* la plateforme [http://www.rechercheisidore.fr/ Isidore] ;
* le [http://search.language-archives.org/ Language Resource Catalog] de l'organisation OLAC ;
* le [http://www.language-archives.org/ Language Resource Catalog] de l'organisation OLAC ;
* le [https://vlo.clarin.eu/ Virtual Language Observatory] de l’infrastructure européenne CLARIN.
* le [https://vlo.clarin.eu/ Virtual Language Observatory] de l’infrastructure européenne CLARIN.
|Discipline=Sciences Humaines & Sociales
|Discipline=Sciences Humaines & Sociales
|SousDisciplineSciencesHumaines&Sociales=L'esprit humain et sa complexité
|SousDisciplineSciencesHumaines&Sociales=SH4 L'esprit humain et sa complexité
|Thematique=Linguistique, Métadonnées, Dublin Core, Identifiants pérennes, Handle, ARK, Web de données, RDF
|Thematique=Linguistique, Métadonnées, Dublin Core, Identifiants pérennes, Handle, ARK, Web de données, RDF
|TypeDonnee=Données audiovisuelles, Données textuelles
|TypeDonnee=Ressources orales : enregistrements sonores (audio ou vidéo),accompagnés éventuellement d'annotations, métadonnées descriptives
|Communaute=Communauté de recherche en sciences humaines et sociales
|Communaute=Communauté de recherche en sciences humaines et sociales de l'Enseignement Supérieur Recherche en France quelles que soient leurs disciplines (Linguistique, Anthropologie, Ethnomusicologie, Histoire...)
|Beneficiaire=Tout public
|Beneficiaire=Tout public
|ConditionUsage=Dépôt de données : tout contributeur doit, au préalable, demander la création d'un compte utilisateur en écrivant à l'adresse cocoon_web@huma-num.fr.<br/>Consultation des données : elle est libre et gratuite ; toutefois, certaines ressources jugées sensibles ne sont rendues accessibles qu'après une période d'embargo prédéfinie.
|ConditionUsage=Dépôt de données : tout contributeur doit, au préalable, demander la création d'un compte utilisateur en écrivant à l'adresse cocoon_web@huma-num.fr.<br/>Consultation des données : elle est libre et gratuite ; toutefois, certaines ressources jugées sensibles ne sont rendues accessibles qu'après une période d'embargo prédéfinie.
|ModeleEconomique=Financé par l'État
|ModeleEconomique=Financé par l'État
|Certification=
|Certification=CoSO;https://www.ouvrirlascience.fr/wp-content/uploads/2024/04/ListedesEntrepotsdeConfiance_v1_202403.xlsx
|Cgu=https://cocoon.huma-num.fr/exist/crdo/credits.htm
|Cgu=https://cocoon.huma-num.fr/exist/crdo/credits.htm
|Relation=Huma-Num
}}
}}
[[Catégorie:Annuaire CNRS]] [[Catégorie:Annuaire CNRS-INSHS]]
[[Catégorie:Catalogue CNRS Sciences humaines & sociales]]

Dernière version du 29 mai 2024 à 09:02

CoCoON
Type de service Entrepôt de données
Caractéristiques de l'entrepôt
Type d’entrepôt Disciplinaire
Type de restriction Soumis à la création d'un compte
Hébergement des données France
Identifiant pérenne
Type d'identifiant fourni DOI
Type d'identifiant auteur utilisé
Formats de fichiers acceptés Pour les documents audio: WAV et FLAC;

Pour les documents vidéo: MPEG-4 et MKV; Pour les documents d'annotations: un document XML encodé en UTF-8, utilisant de préférence des standards (TEI, TalkBank...) ou des schémas ou DTD manipulés par des outils répandus (ELAN, transcriber) ; un document Text seul encodé en UTF-8, de préférence utilisant des conventions connues (comme par exemple le format CHAT du projet CHILDES, utilisé dans l'outil CLAN) ; un document PDF, utilisé comme un format conteneur pour des images numérisées d'originaux sur des supports papier. Pour les électroglottogrammes (EGG), le format WAV/PCM.(Source https://cocoon.huma-num.fr/exist/crdo/formats.htm)

Schéma de métadonnées Dublin Core qualifié
Licence des jeux de données
Conditions d'accès aux données Ouvert, Embargo, Restreint
Modération / Curation Une première étape de modération consiste à vérifier que le déposant fait bien partie de la communauté. La publication de toute donnée passe par une phase de contrôle où un administrateur de la plateforme va vérifier la bonne formation des données et métadonnées, le degré de complétude et de précision de la description, normalisera si besoin la forme des données et métadonnées et enrichira la description par l'alignement sur des référentiels. Enfin pour les données publiées, toute modification des données ou métadonnées passent également par ce même type de contrôle. Dans tous les cas (publication ou modification) un échange pourra intervenir pour demander des compléments d'information.
Volumétrie maximale définie En fonction des formats : WAV (entre 2 et 4Go), FLAC pour les fichiers plus volumineux, mais pas formellement précisé
Politique de conservation des données Les données (dans leur format de conservation) sont automatiquement versées dans le système d'archivage du CINES
Interopérabilité machine OAI-PMH, SPARQL
Versioning
Statut En production
Autres noms Collections de Corpus Oraux Numériques - anciennement Centre de Ressources pour la Description de l'Oral (CRDO) - Groupe Gestion documentaire et réservoir de données
URL https://cocoon.huma-num.fr/
Contact cocoon_web@huma-num.fr
Localisation Paris
Structure d'appartenance Lacito, LLL
Tutelles Université Sorbonne Nouvelle Paris 3, CNRS, INALCO, Université de Tours, Université d'Orléans
Identifiants
re3data 10.17616/R3QD3K


Cycle de vie des données

Ce service intervient au cours des stades du cycle de vie suivants :


Chargement de la carte...




CoCoON pour « Collections de Corpus Oraux Numériques » est une plateforme technique qui accompagne les producteurs de ressources orales à créer, structurer, partager et archiver leurs corpus (i.e. des enregistrements audio ou vidéo, éventuellement accompagnés d’annotations textuelles). La plateforme est hébergée par Huma-Num et gérée conjointement par le Laboratoire de Langues et Civilisations à Tradition Orale (UMR7107 LACITO) et le Laboratoire Ligérien de Linguistique (UMR7270 LLL).
Le rôle d’accompagnement de CoCoON couvre : une mission de conseil en amont d'un projet de collecte ; l'aide à la modélisation et à la mise en forme des ressources ; des services de gestion des données entreposées (stockage sécurisé, enrichissement des descriptions, partage, référencement, archivage). Les ressources déposées sont en effet, dans un premier temps, cataloguées et stockées dans CoCoON, puis, dans un second temps, archivées de manière pérenne dans le cadre du partenariat entre le CINES et Huma-Num. L'auteur et son institution restent responsables des documents déposés et peuvent bénéficier d'un accès restreint et sécurisé à leurs données, pendant une période d’embargo définie, si le contenu de l'information est considéré sensible.
L'entrepôt CoCoON est régulièrement moissonné par des fournisseurs de services tels que :


Domaines scientifiques :Sciences Humaines & Sociales

SH4 L'esprit humain et sa complexité


Thématique et/ou mots clés :

  • Linguistique
  • Métadonnées
  • Dublin Core
  • Identifiants pérennes
  • Handle
  • ARK
  • Web de données
  • RDF

Type de données :Ressources orales : enregistrements sonores (audio ou vidéo),accompagnés éventuellement d'annotations, métadonnées descriptives

Communauté d'utilisateurs : Communauté de recherche en sciences humaines et sociales de l'Enseignement Supérieur Recherche en France quelles que soient leurs disciplines (Linguistique, Anthropologie, Ethnomusicologie, Histoire...) Usagers et bénéficiaires :Tout public


Conditions d'usage : Dépôt de données : tout contributeur doit, au préalable, demander la création d'un compte utilisateur en écrivant à l'adresse cocoon_web@huma-num.fr.
Consultation des données : elle est libre et gratuite ; toutefois, certaines ressources jugées sensibles ne sont rendues accessibles qu'après une période d'embargo prédéfinie.

Conditions tarifaires : Financé par l'État

Certification/Label :CoSO (https://www.ouvrirlascience.fr/wp-content/uploads/2024/04/ListedesEntrepotsdeConfiance v1 202403.xlsx)

Conditions générales d'utilisation : https://cocoon.huma-num.fr/exist/crdo/credits.htm

CoCoON est en lien avec les services et structures

Huma-Num



Services proposés par la structure d'appartenance
StructureServices proposés
LACITOCoCoON
Pangloss
LLLCoCoON