"Traiter et analyser ses données en SHS"
Les journées data-shs : traiter et analyser ses données en sciences humaines et sociales proposent un choix d'ateliers d'initiation aux méthodes de traitement et d'analyse de données numériques en sciences humaines et sociales. Plus particulièrement, les ateliers ont deux objectifs :
- faire acquérir aux participants des notions théoriques sur des méthodes d'analyse et de représentation de données numériques en sciences humaines et sociales afin que ceux-xi puissent les adapter à leurs propres travaux;
- initier les participants via des travaux pratiques au traitement, à la structuration et à l'analyse de données.
Les ateliers sont ouverts aux étudiants (niveau Master 2 et doctorat), aux jeunes chercheurs, aux enseignants-chercheurs et ingénieurs des laboratoires affiliés à la MESHS. La participation est libre mais se fait sur inscription, dans la limite de 15 places par atelier. Les ateliers sont basés sur des logiciels libres et de prise en main accessible.
Les ateliers se déroulent du 11 au 15 décembre 2017 à la MESHS. Ils sont organisés par l'axe Humanités numériques et la Plateforme universitaire de données de Lille. Cette action de formation bénéficie du soutien financier du Conseil régional des Hauts-de-France dans le cadre du contrat de plan État-Région ISI-MESHS.
Programme
Lundi 11 décembre: préparer et préserver ses données de recherche
Lundi 11 décembre : analyse statistique de données textuelles avec TXM
Mardi 12 décembre: préparer et préserver ses données de recherche
Mercredi 13 décembre : cartographie avec Magrit
Jeudi 14 décembre : analyse de réseaux en sciences humaines et sociales
Vendredi 15 décembre : cartographie du web avec Hyphe
Lundi 11 décembre et mardi 12 décembre : préparer et préserver ses données de recherche
Cet atelier est consacré au travail préalable permettant d’analyser ses données dans de bonnes conditions. Il s’organise autour de trois interventions complémentaires. L'atelier dure une journée et il est proposé lundi 11 et mardi 12 décembre.
| Matin
Comment organiser ses fichiers de recherche, les nommer, les structurer ?
Intervenante : Sofia Papastamkou (CNRS, MESHS)
Liens utiles: tutoriel Preserving your Research Data
Comment préparer ses données avant le traitement et l’analyse ?
Intervenant : Pierre Mounier
Atelier basé sur le logiciel Openrefine
OpenRefine (anciennement Google Refine) est un outil puissant pour manipuler de grandes quantités de données, permettant des opérations de nettoyage en masse, l’exploration rapide de jeux de données, la conversion d’un format à l’autre, l’application de transformations cellulaires de base et avancées, le filtrage et le partitionnement des données avec des expressions régulières, l’extraction d’entités nommées sur des champs de texte intégral. Son usage, en tant qu’outil libre et gratuit, s’impose donc rapidement et cet atelier offrira un aperçu large de ses possibilités à l’appui de cas concrets.
Liens utiles: OpenRefine Tutoriel; tutoriel OpenRefine sur WIki: Traitements documentaires de l'INRA.
| Après-midi
Introduction pratique aux obligations déontologiques et juridiques en matière de collecte et de traitement de données en sciences humaines et sociales
Intervenant : Thomas Soubiran (CERAPS, Université Lille 2)
Comment intégrer les contraintes de la loi relative à l’informatique, aux fichiers et aux libertés (lil) dans un projet de recherche en sciences humaines et sociales ? Cet atelier rappellera les notions clefs et les grands principes d’application de la loi. Il en développera ensuite les implications pratiques à partir d’exemples concrets correspondant aux différentes étapes de la recherche (collecte, analyse, conservation).
Lundi 11 décembre : analyse statistique de données textuelles avec TXM
Intervenant : Serge Heiden (ENS, Lyon)
Il s'agit d'apprendre à utiliser TXM dans ses principales fonctions d'analyse textométrique. Cela comprend une familiarisation avec l'organisation générale et le fonctionnement de l'interface, ainsi qu'avec l'approche textométrique. On se focalise sur les fonctionnalités les plus utilisées (Lexique, Index, Concordance, Spécificités, Cooccurrence), avec une présentation à la fois technique et méthodologique : à quoi sert cette fonctionnalité, comment préparer et paramétrer le calcul, comment interpréter les résultats, comment récupérer les tableaux et graphiques pour publication. L'atelier est finalement très complet et peut intéresser à la fois des “vrais” débutants comme des débutants “avancés” et même des autodidactes débrouillés, d'autant que son contenu peut s'adapter aux participants présents en fonction des informations qu'ils nous auront transmises au moment de l'inscription.
Liens utiles: site web du projet Textométrie
Mercredi 13 décembre : cartographie avec Magrit
Intervenants : Matthieu Viry et Nicolas Lambert (RIATE, Paris)
Magrit est une application de cartographie en ligne. Magrit propose la réalisation de représentations cartographiques usuelles telles que les cartes choroplèthes ou les cartes en symboles proportionnels. D’autres types de cartes sont aussi proposés: lissages, carroyages, discontinuités, anamorphoses, etc.
Magrit entend couvrir dans un même environnement logiciel, l’ensemble de la chaîne de traitement, de la donnée géographique à la carte d’édition.
Liens utiles: Magrit
Support de formation
Jeudi 14 décembre : analyse de réseaux en shs
| Matin
Introduction à la théorie de l’analyse de réseaux et à la théorie des graphes
Intervenant : Fabien Eloire (CLERSE, Université Lille 1)
| Après-midi
Atelier basé sur Cytoscape, logiciel pour l'analyse et visualisation de réseaux.
Intervenant : Guillaume Brysbaert (UGSF, Université Lille 1)
L'atelier permettra aux participants de découvrir et pratiquer les fonctionnalités du logiciel Cytoscape. Les participants auront l'occasion de travailler sur l'import et le filtrage des données, la visualisation et l'analyse de réseaux (mesures de centralité etc), l’export de données. L'atelier sera conclu par une discussion autour des données des participants.
Liens utiles: tutoriel Cytoscape (en français); tutoriels Cytoscape (en anglais).
Vendredi 15 décembre : cartographie du web avec Hyphe
Intervenants : Benjamin Ooghe-Tabanou et Maxime Crépel (médialab, Sciences Po)
Publié sous la forme d’un logiciel libre, Hyphe a été conçu pour offrir aux chercheurs et étudiants un outil de création et nettoyage de corpus web reposant sur un crawler orienté pour la recherche. Les utilisateurs sont accompagnés par une méthodologie pour construire leur corpus web de manière à la fois granulaire et flexible avec des principes de curation simples.
La séance proposera tout d'abord une présentation générale de la méthode et de l'outil, ainsi qu'un cas d'usage de Hyphe. Le cas présenté sera la création d'un "datascape" dans le cadre d'un projet réalisé au médialab entre 2015 et 2017 ayant consisté en la réalisation d'une interface d'exploration d'un corpus Hyphe pour l'analyse quali-quanti de controverses autour des enjeux de data privacy.
Dans un second temps il sera proposé aux participants d'essayer Hyphe concrètement lors d'un atelier pratique. Les participants sont invités à venir équipés d'un ordinateur portable pour pouvoir prendre en main le logiciel durant cet atelier.
Modalités d'inscription
Les inscriptions aux ateliers se font à travers ce formulaire. Les inscriptions sont closes.
Les inscriptions seront confirmées par email. En cas de forte demande pour un atelier, les demandes seront placées en liste d'attente et retenues en fonction de désistements éventuels.
URI/Permalink: