« Hyphe » : différence entre les versions

De Cat OPIDoR
Aucun résumé des modifications
Aucun résumé des modifications
Ligne 8 : Ligne 8 :
|PhaseCycleVie=Collecte, Documentation
|PhaseCycleVie=Collecte, Documentation
}}
}}
[[Aide à la gestion:: logiciel| ]]
{{Service
{{Service
|Description='''Hyphe''' est un logiciel libre de collecte de données sur le web permettant aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique. C’est un crawler, soit un outil de collecte automatique qui permet d’extraire des données numériques sur le web. Il permet de fouiller systématiquement tous les contenus textuels et les hyperliens liés à l’adresse URL renseignée au départ. Le crawler Hyphe fonctionne en effet à partir d’une consigne, sous la forme d’une liste d’adresses URL à consulter, pour réaliser la fouille systématique. Il simule l’ensemble des interactions entre un poste client et le serveur, et produit un corpus de pages web, sur un sujet donné, en se nourrissant de la première liste que les utilisateur.trice.s lui ont fourni.
|Description='''Hyphe''' est un logiciel libre de collecte de données sur le web permettant aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique. C’est un crawler, soit un outil de collecte automatique qui permet d’extraire des données numériques sur le web. Il permet de fouiller systématiquement tous les contenus textuels et les hyperliens liés à l’adresse URL renseignée au départ. Le crawler Hyphe fonctionne en effet à partir d’une consigne, sous la forme d’une liste d’adresses URL à consulter, pour réaliser la fouille systématique. Il simule l’ensemble des interactions entre un poste client et le serveur, et produit un corpus de pages web, sur un sujet donné, en se nourrissant de la première liste que les utilisateur.trice.s lui ont fourni.

Version du 3 avril 2024 à 13:50

Hyphe
Type de service Outils de gestion des données
Statut En production
URL https://hyphe.medialab.sciences-po.fr
Contact benjamin.ooghe@sciencespo.fr
Localisation
Structure d'appartenance
Tutelles


Cycle de vie des données

Ce service intervient au cours des stades du cycle de vie suivants :


Chargement de la carte...



Page en construction


Hyphe est un logiciel libre de collecte de données sur le web permettant aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique. C’est un crawler, soit un outil de collecte automatique qui permet d’extraire des données numériques sur le web. Il permet de fouiller systématiquement tous les contenus textuels et les hyperliens liés à l’adresse URL renseignée au départ. Le crawler Hyphe fonctionne en effet à partir d’une consigne, sous la forme d’une liste d’adresses URL à consulter, pour réaliser la fouille systématique. Il simule l’ensemble des interactions entre un poste client et le serveur, et produit un corpus de pages web, sur un sujet donné, en se nourrissant de la première liste que les utilisateur.trice.s lui ont fourni.


En les crawlant, Hyphe permet de construire itérativement et de visualiser un réseau des relations entre ces acteurs à travers les hyperliens reliant ces webentités.

De nouvelles webentités sont automatiquement suggérées en explorant les hyperliens de chaque entité présente dans le corpus. Les chercheurs peuvent ensuite les examiner dans un processus itératif et qualitatif.


Domaines scientifiques :Sciences Humaines & Sociales



Thématique et/ou mots clés :

  • Logiciel
  • Crawler

Type de données :Corpus

Communauté d'utilisateurs : Usagers et bénéficiaires :


Conditions d'usage :

Conditions tarifaires :

Certification/Label :

Conditions générales d'utilisation :



Services proposés par la structure d'appartenance
StructureServices proposés
MédialabHyphe