Pangloss
Type de service Entrepôt de données
Collection CoCoON
Caractéristiques de l'entrepôt
Type d’entrepôt Disciplinaire
Type de restriction Soumis à la création d'un compte, Soumis à étude et validation
Hébergement des données France
Identifiant pérenne
Identifiants fournis DOI
Identifiants utilisés
Formats de fichiers acceptés Pour les documents audio: WAV et FLAC;

Pour les documents vidéo: MPEG-4 et MKV; Pour les documents d'annotations : Pangloss XML

Schéma de métadonnées Dublin Core, DataCite Metadata Schema
Licence des jeux de données Creative Commons
Conditions d'accès aux données Ouvert, Embargo, Restreint
Modération / Curation La publication de toute donnée passe par une phase de contrôle où un administrateur de la plateforme va vérifier la bonne formation des données et métadonnées, le degré de complétude et de précision de la description, normalisera si besoin la forme des données et métadonnées et enrichira la description par l'alignement sur des référentiels. Enfin pour les données publiées, toute modification des données ou métadonnées passent également par ce même type de contrôle. Dans tous les cas (publication ou modification) un échange pourra intervenir pour demander des compléments d'information.
Volumétrie maximale définie En fonction des formats : WAV (entre 2 et 4Go), FLAC pour les fichiers plus volumineux, mais pas formellement précisé.
Politique de conservation des données Les données (dans leur format de conservation) sont automatiquement versées dans le système d'archivage du CINES.
Interopérabilité machine OAI-PMH
Versioning
Statut En production
Autres noms Collection Pangloss
URL https://pangloss.cnrs.fr/
Contact lacito@cnrs.fr
Localisation Villejuif
Structure d'appartenance Lacito
Tutelles CNRS


Cycle de vie des données

Ce service intervient au cours des stades du cycle de vie suivants :


Chargement de la carte...




La Collection Pangloss est une archive ouverte multimedia de langues rares. Pangloss offre, en libre accès, des documents linguistiques sonores, avec une spécialité de langues "rares" ou peu documentées. Les fonctions premières de Pangloss sont d'archiver ces enregistrements avec leurs métadonnées (consultables sous le titre de chaque ressource) et de les rendre accessibles en ligne.

Son but est de contribuer à la documentation et à l'étude du patrimoine humain que représentent les langues du monde.

Les documents présentés contiennent en majeure partie de la parole spontanée, enregistrée dans son contexte social et transcrit en consultation avec les locuteurs. On y trouve aussi des séances d'enquête et des listes de mots. Ces documents ont été enregistrés et annotés par des chercheurs d'horizons très variés, la gestion de la collection est assurée par une équipe du Lacito. En plus de ces corpus audio annotés, la Collection Pangloss accueille une collection de dictionnaires en ligne.

Des pages d'aide et de conseils pour la constitution d'un corpus ainsi que les différentes étapes pour déposer un corpus sont disponibles à la rubrique Déposer un corpus.


Domaines scientifiques :Sciences Humaines & Sociales

SH4 L'esprit humain et sa complexité


Thématique et/ou mots clés :

  • Linguistique
  • Langues rares

Type de données :Ressources multimédia, enregistrements audio, transcription

Communauté d'utilisateurs : Communauté de la recherche scientifique en linguistique Usagers et bénéficiaires :Chercheur, enseignant-chercheur


Conditions d'usage : les corpus sont en accès libre. Pour le dépôt de corpus il est nécessaire de prendre contact avec l'équipe Pangloss

Conditions tarifaires :

Certification/Label :

Conditions générales d'utilisation :

Pangloss est en lien avec les services et structures

CoCoON, Huma-Num



Services proposés par la structure d'appartenance
StructureServices proposés
LACITOCoCoON
Pangloss