« Hyphe » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 8 : | Ligne 8 : | ||
|PhaseCycleVie=Collecte, Documentation | |PhaseCycleVie=Collecte, Documentation | ||
}} | }} | ||
[[Aide à la gestion:: logiciel| ]] | |||
{{Service | {{Service | ||
|Description='''Hyphe''' est un logiciel libre de collecte de données sur le web permettant aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique. C’est un crawler, soit un outil de collecte automatique qui permet d’extraire des données numériques sur le web. Il permet de fouiller systématiquement tous les contenus textuels et les hyperliens liés à l’adresse URL renseignée au départ. Le crawler Hyphe fonctionne en effet à partir d’une consigne, sous la forme d’une liste d’adresses URL à consulter, pour réaliser la fouille systématique. Il simule l’ensemble des interactions entre un poste client et le serveur, et produit un corpus de pages web, sur un sujet donné, en se nourrissant de la première liste que les utilisateur.trice.s lui ont fourni. | |Description='''Hyphe''' est un logiciel libre de collecte de données sur le web permettant aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique. C’est un crawler, soit un outil de collecte automatique qui permet d’extraire des données numériques sur le web. Il permet de fouiller systématiquement tous les contenus textuels et les hyperliens liés à l’adresse URL renseignée au départ. Le crawler Hyphe fonctionne en effet à partir d’une consigne, sous la forme d’une liste d’adresses URL à consulter, pour réaliser la fouille systématique. Il simule l’ensemble des interactions entre un poste client et le serveur, et produit un corpus de pages web, sur un sujet donné, en se nourrissant de la première liste que les utilisateur.trice.s lui ont fourni. |
Version du 3 avril 2024 à 12:50
Type de service | Outils de gestion des données |
---|---|
Statut | En production |
URL | https://hyphe.medialab.sciences-po.fr |
Contact | benjamin.ooghe@sciencespo.fr |
Localisation | |
Structure d'appartenance | |
Tutelles | |
Cycle de vie des données
Ce service intervient au cours des stades du cycle de vie suivants :
Page en construction
Hyphe est un logiciel libre de collecte de données sur le web permettant aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique. C’est un crawler, soit un outil de collecte automatique qui permet d’extraire des données numériques sur le web. Il permet de fouiller systématiquement tous les contenus textuels et les hyperliens liés à l’adresse URL renseignée au départ. Le crawler Hyphe fonctionne en effet à partir d’une consigne, sous la forme d’une liste d’adresses URL à consulter, pour réaliser la fouille systématique. Il simule l’ensemble des interactions entre un poste client et le serveur, et produit un corpus de pages web, sur un sujet donné, en se nourrissant de la première liste que les utilisateur.trice.s lui ont fourni.
En les crawlant, Hyphe permet de construire itérativement et de visualiser un réseau des relations entre ces acteurs à travers les hyperliens reliant ces webentités.
De nouvelles webentités sont automatiquement suggérées en explorant les hyperliens de chaque entité présente dans le corpus. Les chercheurs peuvent ensuite les examiner dans un processus itératif et qualitatif.
Domaines scientifiques :Sciences Humaines & Sociales
Thématique et/ou mots clés :
- Logiciel
- Crawler
Type de données :Corpus
Communauté d'utilisateurs : Usagers et bénéficiaires :
Conditions d'usage :
Conditions tarifaires :
Certification/Label :
Conditions générales d'utilisation :
Structure | Services proposés |
---|---|
Médialab | Hyphe |