Les journées dataSHS : traiter et analyser ses données en Sciences Humaines et Sociales proposent un choix d'ateliers d'initiation aux méthodes de traitement et d'analyse de données en sciences humaines et sociales.
Ces ateliers ont un double objectif d'initiation : aux fondements théoriques des méthodes d'analyse et de représentation de données en sciences humaines et sociales et à leur mise en œuvre pratique. Le but est de permettre aux participants d'adapter ces méthodes à leurs propres travaux, de façon la plus autonome possible.
Ouverts aux étudiants (niveau Master 2), aux doctorants, chercheurs, enseignants-chercheurs et ingénieurs des laboratoires affiliés à la MESHS, les ateliers sont basés sur des logiciels libres et de prise en main accessible.
Les journées dataSHS sont organisées par l'axe Humanités numériques et la Plateforme universitaire de données de Lille. Cette action de formation bénéficie du soutien financier du Conseil régional des Hauts-de-France dans le cadre du contrat de plan État-Région ISI-MESHS.
Horaires des journées-ateliers :
9h : café d'accueil
9h30-12h30 : atelier
12h30-14h : pause déjeuner - buffet froid offert par la MESHS et la PUDL
14h-17h : atelier
Une pause café est également prévue dans l'après-midi.
Lundi 10 décembre : atelier nettoyage et harmonisation des bases de données
Mardi 11 décembre : atelier cadre juridique et gestion de données de la recherche
Mercredi 12 décembre : atelier analyse de données textuelles (transcription d'entretiens) avec Sonal
Jeudi 13 décembre : atelier analyse de réseaux en sciences humaines et sociales
Vendredi 14 décembre : atelier cartographie avec Magrit
Participation libre dans la limite de 15 places par atelier.
Lundi 10 décembre : Nettoyage et harmonisation de bases de données
Intervenant : Julien Boelaert, MCF en science politique, CERAPS
Description : L'une des premières difficultés que peuvent présenter les bases de données, en particulier en présence de données texte (noms, phrases, ...), sont les petites scories qu'elles contiennent : fautes d'orthographe, conventions de notations différentes... Avant tout traitement statistique, il faut alors nettoyer ou harmoniser la base. L'objectif de cette journée est précisément de familiariser les participants aux outils de nettoyage de données. Nous traiterons d'une part les expressions régulières (regex), un langage de requêtes qui permet de faire des recherches complexes, d'extraire des informations et de nettoyer des données de texte. Nous passerons pour cela par des fonctions R, mais les regex sont un langage commun à beaucoup d'autres programmes de traitement de données. D'autre part, nous emploierons le logiciel OpenRefine, qui permet d'harmoniser de façon efficace des données texte.
Mardi 11 décembre : Cadre juridique et gestion de données de la recherche
| Matin : La réglementation relative aux données à caractère personnel en sciences sociales
Intervenant : Thomas Soubiran, Ingénieur d'études en analyse de données, CERAPS
Description : Comment mettre en conformité un projet de recherche en sciences humaines et sociales au regard de la réglementation applicable aux données personnelles ? Cet atelier rappellera les notions clefs et les grands principes de la réglementation. Il en développera ensuite les implications pratiques à partir d’exemples concrets correspondant aux différentes étapes de la recherche (collecte, analyse, conservation).
| Après-midi : Principes et enjeux de la gestion des données de la recherche
Intervenante : Marie Puren, Chercheuse post-doctorale, LARHRA
Description : L'atelier vise à présenter les principes et les enjeux de la gestion des données de la recherche pour ensuite permettre aux participant(e)s de prendre en main les problématiques liées à la création d’un plan de gestion des données à l'aide de l'outil DMPOpidor. Des jeux de données leur seront fournis, mais les participant(e)s qui le souhaitent sont vivement incité(e)s à travailler sur leurs propres jeux de données.
Mercredi 12 décembre : Analyse de données textuelles (transcriptions d'entretiens) avec Sonal
Intervenant : Alex Alber, MCF en sociologie, Université de Tours
Description : L'atelier visera à familiariser les participants avec le maniement des corpus audio-textuels dans le logiciel Sonal et présentera divers outils d'analyse, notamment lexicométriques. La matinée sera consacrée à l'organisation des données (importation des fichiers texte/son/vidéo, ajout de méta-données, retranscription, thématisation). L'après-midi proposera différents exercices d'extraction et d'analyse à partir des matériaux.
Jeudi 13 décembre : Analyse de réseaux en sciences humaines et sociales
| Matin: Introduction à la théorie de l’analyse de réseaux et à la théorie des graphes
Intervenant : Fabien Eloire, MCF en sociologie, CLERSE, Université de Lille
| Après-midi : Atelier basé sur Cytoscape, logiciel pour l'analyse et la visualisation de réseaux
Intervenant : Guillaume Brysbaert, Ingénieur de recherches en bioinformatique, UGSF, Université de Lille
Description : L'atelier permettra aux participants de découvrir et pratiquer les fonctionnalités du logiciel Cytoscape. Les participants auront l'occasion de travailler sur l'import et le filtrage des données, la visualisation et l'analyse de réseaux (mesures de centralité etc), l’export de données. L'atelier sera conclu par une discussion autour des données des participants.
Liens utiles : tutoriel Cytoscape en français ; tutoriel Cytoscape en anglais.
Vendredi 14 décembre : Cartographie avec Magrit
Intervenants : Nicolas Lambert, Ingénieur en cartographie thématique et développement web, RIATE ; Ronan Ysebaert, Ingénieur en traitement et analyse de bases de données, RIATE
Description : Magrit est une application de cartographie en ligne qui permet réalisation de représentations cartographiques usuelles telles que les cartes choroplèthes ou les cartes en symboles proportionnels. D’autres types de cartes sont aussi proposés : lissages, carroyages, discontinuités, anamorphoses, etc. Magrit entend couvrir dans un même environnement logiciel, l’ensemble de la chaîne de traitement, de la donnée géographique à la carte d’édition.
Des jeux de données seront fournis par les formateurs, toutefois, les participant.e.s peuvent venir avec leurs propres données et travailler dessus.
URI/Permalien: