« Hyphe » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
| Ligne 18 : | Ligne 18 : | ||
|Description='''Hyphe''' est un logiciel libre de collecte de données sur le web permettant aux chercheurs de '''créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique'''. C’est un crawler, soit un outil de collecte automatique qui permet d’'''extraire des données numériques sur le web'''. | |Description='''Hyphe''' est un logiciel libre de collecte de données sur le web permettant aux chercheurs de '''créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique'''. C’est un crawler, soit un outil de collecte automatique qui permet d’'''extraire des données numériques sur le web'''. | ||
Il permet de fouiller systématiquement tous les contenus textuels et les hyperliens liés à l’adresse URL renseignée au départ. Il '''simule l’ensemble des interactions entre un poste client et le serveur, et produit un corpus de pages web''', sur un sujet donné, en se nourrissant de la première liste que les utilisateurs lui ont fourni. | |||
En effet, les pages web sont sélectionnées par les chercheurs et peuvent être regroupées en « webentités ». En les crawlant, Hyphe permet de '''construire itérativement et de visualiser un réseau des relations entre ces acteurs à travers les hyperliens reliant ces webentités'''. De nouvelles sont automatiquement suggérées en explorant les hyperliens de chaque entité présente dans le corpus. | |||
Hyphe permet aux chercheurs de '''choisir et de catégoriser manuellement les acteurs''' qu'ils souhaitent ajouter à leur corpus. À ce titre, il doit être considéré comme un '''outil quali-quantitatif'''. | Hyphe permet aux chercheurs de '''choisir et de catégoriser manuellement les acteurs''' qu'ils souhaitent ajouter à leur corpus. À ce titre, il doit être considéré comme un '''outil quali-quantitatif'''. | ||
Dernière version du 8 avril 2025 à 09:42
| Type de service | Outils de gestion des données |
|---|---|
| Statut | En production |
| Autres noms | |
| URL | https://hyphe.medialab.sciences-po.fr |
| Contact | benjamin.ooghe@sciencespo.fr |
| Localisation | Paris |
| Structure d'appartenance | Médialab |
| Tutelles | Sciences Po |
Cycle de vie des données
Ce service intervient au cours des stades du cycle de vie suivants :
Il permet de fouiller systématiquement tous les contenus textuels et les hyperliens liés à l’adresse URL renseignée au départ. Il simule l’ensemble des interactions entre un poste client et le serveur, et produit un corpus de pages web, sur un sujet donné, en se nourrissant de la première liste que les utilisateurs lui ont fourni.
En effet, les pages web sont sélectionnées par les chercheurs et peuvent être regroupées en « webentités ». En les crawlant, Hyphe permet de construire itérativement et de visualiser un réseau des relations entre ces acteurs à travers les hyperliens reliant ces webentités. De nouvelles sont automatiquement suggérées en explorant les hyperliens de chaque entité présente dans le corpus.
Hyphe permet aux chercheurs de choisir et de catégoriser manuellement les acteurs qu'ils souhaitent ajouter à leur corpus. À ce titre, il doit être considéré comme un outil quali-quantitatif.
Domaines scientifiques :Sciences Humaines & Sociales, Sciences & Technologies
PE6 Sciences informatiques et informatique
Thématique et/ou mots clés :
- Logiciel
- Crawler
Type de données :Corpus
Communauté d'utilisateurs : Communautés scientifiques en Sciences Humaines et Sociales Usagers et bénéficiaires :Chercheurs, Enseignants-Chercheurs, Doctorants
Conditions d'usage : Hyphe est un logiciel libre sous licences LGPL & CECILL-C. Son code source et sa documentation sont disponibles sur GitHub : github.com/medialab/hyphe
Conditions tarifaires : Gratuit
Certification/Label :
Conditions générales d'utilisation :
| Structure | Services proposés |
|---|---|
| Médialab | Hyphe |