Hyphe

De Cat OPIDoR
Hyphe
Type de service Outils de gestion des données
Statut En production
URL https://hyphe.medialab.sciences-po.fr
Contact benjamin.ooghe@sciencespo.fr
Localisation Paris
Structure d'appartenance Médialab
Tutelles Sciences Po


Cycle de vie des données

Ce service intervient au cours des stades du cycle de vie suivants :


Chargement de la carte...




Hyphe est un logiciel libre de collecte de données sur le web permettant aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique. C’est un crawler, soit un outil de collecte automatique qui permet d’extraire des données numériques sur le web.

Il permet de fouiller systématiquement tous les contenus textuels et les hyperliens liés à l’adresse URL renseignée au départ. Il simule l’ensemble des interactions entre un poste client et le serveur, et produit un corpus de pages web, sur un sujet donné, en se nourrissant de la première liste que les utilisateurs lui ont fourni.

Hyphe permet aux chercheurs de choisir et de catégoriser manuellement les acteurs qu'ils souhaitent ajouter à leur corpus. À ce titre, il doit être considéré comme un outil quali-quantitatif.


Domaines scientifiques :Sciences Humaines & Sociales, Sciences & Technologies


PE6 Sciences informatiques et informatique

Thématique et/ou mots clés :

  • Logiciel
  • Crawler

Type de données :Corpus

Communauté d'utilisateurs : Communautés scientifiques en Sciences Humaines et Sociales Usagers et bénéficiaires :Chercheurs, Enseignants-Chercheurs, Doctorants


Conditions d'usage : Hyphe est un logiciel libre sous licences LGPL & CECILL-C. Son code source et sa documentation sont disponibles sur GitHub : github.com/medialab/hyphe

Conditions tarifaires : Gratuit

Certification/Label :

Conditions générales d'utilisation :



Services proposés par la structure d'appartenance
StructureServices proposés
MédialabHyphe