Journées dataSHS 2018
Traiter et analyser ses données en SHS
Les journées dataSHS proposent un choix d'ateliers d'initiation aux méthodes de traitement et d'analyse de données en sciences humaines et sociales.
Ces ateliers ont un double objectif d'initiation : aux fondements théoriques des méthodes d'analyse et de représentation de données en sciences humaines et sociales et à leur mise en œuvre pratique. Le but est de permettre aux participants d'adapter ces méthodes à leurs propres travaux, de façon la plus autonome possible.
Ouverts aux étudiants (niveau Master 2), aux doctorants, chercheurs, enseignants-chercheurs et ingénieurs des laboratoires affiliés à la MESHS, les ateliers sont basés sur des logiciels libres et de prise en main accessible.
Les journées dataSHS sont organisées par l'axe Humanités numériques et la Plateforme universitaire de données de Lille. Cette action de formation bénéficie du soutien financier du Conseil régional des Hauts-de-France dans le cadre du contrat de plan État-Région ISI-MESHS.
Programme
Nettoyage et harmonisation de bases de données
Julien Boelaert, MCF en science politique (CERAPS)
L'une des premières difficultés que peuvent présenter les bases de données, en particulier en présence de données texte (noms, phrases, ...), sont les petites scories qu'elles contiennent : fautes d'orthographe, conventions de notations différentes... Avant tout traitement statistique, il faut alors nettoyer ou harmoniser la base. L'objectif de cette journée est précisément de familiariser les participants aux outils de nettoyage de données. Nous traiterons d'une part les expressions régulières (regex), un langage de requêtes qui permet de faire des recherches complexes, d'extraire des informations et de nettoyer des données de texte. Nous passerons pour cela par des fonctions R, mais les regex sont un langage commun à beaucoup d'autres programmes de traitement de données. D'autre part, nous emploierons le logiciel OpenRefine, qui permet d'harmoniser de façon efficace des données texte.
Cadre juridique et gestion de données de la recherche
La réglementation relative aux données à caractère personnel en sciences sociales
Thomas Soubiran, Ingénieur d'études en analyse de données, CERAPS
Comment mettre en conformité un projet de recherche en sciences humaines et sociales au regard de la réglementation applicable aux données personnelles ? Cet atelier rappellera les notions clefs et les grands principes de la réglementation. Il en développera ensuite les implications pratiques à partir d’exemples concrets correspondant aux différentes étapes de la recherche (collecte, analyse, conservation).
Principes et enjeux de la gestion des données de la recherche
Marie Puren, Chercheuse post-doctorale, LARHRA
L'atelier vise à présenter les principes et les enjeux de la gestion des données de la recherche pour ensuite permettre aux participant(e)s de prendre en main les problématiques liées à la création d’un plan de gestion des données à l'aide de l'outil DMPOpidor. Des jeux de données leur seront fournis, mais les participant(e)s qui le souhaitent sont vivement incité(e)s à travailler sur leurs propres jeux de données.
Analyse de données textuelles (transcriptions d'entretiens) avec Sonal
Alex Alber, MCF en sociologie (Université de Tours)
L'atelier visera à familiariser les participants avec le maniement des corpus audio-textuels dans le logiciel Sonal et présentera divers outils d'analyse, notamment lexicométriques. La matinée sera consacrée à l'organisation des données (importation des fichiers texte/son/vidéo, ajout de méta-données, retranscription, thématisation). L'après-midi proposera différents exercices d'extraction et d'analyse à partir des matériaux.
Analyse de réseaux en sciences humaines et sociales
Introduction à la théorie de l’analyse de réseaux et à la théorie des graphes
Fabien Eloire, MCF en sociologie, CLERSE (Université de Lille)
Cytoscape : logiciel pour l'analyse et la visualisation de réseaux
Guillaume Brysbaert, Ingénieur de recherches en bioinformatique (UGSF, Université de Lille)
L'atelier permettra aux participants de découvrir et pratiquer les fonctionnalités du logiciel Cytoscape. Les participants auront l'occasion de travailler sur l'import et le filtrage des données, la visualisation et l'analyse de réseaux (mesures de centralité etc), l’export de données. L'atelier sera conclu par une discussion autour des données des participants.
Cartographie avec Magrit
Nicolas Lambert, Ingénieur en cartographie thématique et développement web (RIATE)
Ronan Ysebaert, Ingénieur en traitement et analyse de bases de données (RIATE)
Magrit est une application de cartographie en ligne qui permet réalisation de représentations cartographiques usuelles telles que les cartes choroplèthes ou les cartes en symboles proportionnels. D’autres types de cartes sont aussi proposés : lissages, carroyages, discontinuités, anamorphoses, etc. Magrit entend couvrir dans un même environnement logiciel, l’ensemble de la chaîne de traitement, de la donnée géographique à la carte d’édition.
Des jeux de données seront fournis par les formateurs, toutefois, les participant.e.s peuvent venir avec leurs propres données et travailler dessus.
Informations
Du 10 au 14 décembre 2018, de 9h à 17h
MESHS Lille Nord de France
(2 rue des Canonniers, Lille)
PUDL
- Mathilde Guergoat-Larivière, responsable scientifique
- Ada-Marlen Chmilevschi, ingénieure d'études
Partenaire
Crédits
Services de la MESHS