Semaine dataSHS 2024
Créer, mettre en relation, analyser et visualiser ses données en SHS
La Semaine dataSHS propose un choix d'ateliers d'initiation aux méthodes de production et de traitement de données en sciences humaines et sociales, à suivre ensemble ou séparément.
Ces ateliers ont un double objectif d'initiation : aux fondements théoriques de la production et de l'analyse de données en sciences humaines et sociales et à leur mise en œuvre pratique. Le but est de permettre aux participants d'adapter ces méthodes à leur propres travaux, de façon la plus autonome possible.
Comme depuis 2019, toutes les plateformes universitaires de données de France, coordonnées par l'IR* PROGEDO, organisent des formations, conférences, ateliers lors de cette même semaine.
À la PUD de Lille, qui est à l'origine de ce concept, la Semaine dataSHS consiste en cinq jours de formation en présentiel que vous pouvez suivre indépendamment l'un de l'autre. La matinée est généralement consacrée à des questions plus théoriques pour passer à des ateliers d'application dans l'après-midi. Pour la formation en méthodes de classification avec R, il est nécessaire d'avoir des connaissances de base pour la prise en main du logiciel.
Programme
PROGEDO, Humanum, Heurist pour les données en SHS
En France, les sciences humaines et sociales bénéficient de deux infrastructures de recherche nationale : PROGEDO et Humanum. Ces infrastructures mettent à disposition des entrepôts pour l'archivage, la mise en relation et la diffusion des données de différents types : données d'enquêtes pour PROGEDO, données numériques pour Huma-Num.
La matinée sera l'occasion de présenter les services de ces deux infrastructures, comment ils peuvent être utlisés, par Nicolas Sauger, directeur de l'IR* PROGEDO, et Olivier Beaud, dicteur de l'IR* Huma-Num. Cette présentation sera suivie d'une discussion libre avec les participants, permettant de répondre à vos questionnements sur l'utilisation de différents services, avec Ada Chmilevschi, l'ingénieure d'études de la PUDL, et Valentin de Craene, l'ingénieur d'études en humanités numériques de la MESHS.
L'après-midi donnera lieu à une formation à l'utilisation de l'outil en ligne Heurist, qui permet de construire des bases de données relationnelles avec des données de différents types (textes, images, lieux, documents...) et les mettre à disposition via un site internet. Cette formation sera assurée par Valentin de Craene, l'ingénieure en humanités numériques de la MESHS.
Initiation à R
Cécile Rodrigues, Clersé
L'objectif de ce module est l'apprentissage des bases du langage R et du vocabulaire d'usage (package, types de variable, etc.). Il sera question d'importer, nettoyer, mettre en forme et analyser à l'aide de fonctions simples des données de natures diverses (numériques, chaînes de caractère, etc.).
Conception d'un questionnaire avec LimeSurvey
Ada Chmilevschi, PUDL
Durant la matinée, nous aborderons quelques bases de la conception d'un questionnaire : étapes, modes de passation, types de questions, types de biais... L'après-midi sera dédié à un atelier de création d'un questionnaire à l'aide du logiciel en ligne LimeSurvey.
Python pour les SHS
Emilien Schultz, ENSAE
Cette formation propose une initiation à la programmation scientifique en langage Python pour les acteurs de la recherche en sciences sociales.
Python est un langage de programmation de haut niveau, libre, multi-plateforme, pédagogique, bénéficiant d'une communauté d'utilisateurs et utilisatrices croissante tant dans le domaine scientifique que le secteur privé, notamment sur les usages d'apprentissage autonomatique et de science de la donnée. C’est à la fois un bon langage pour débuter en programmation et pour faire l’interface avec les autres outils existant – par exemple récemment les modèles de langage (LLM).
Cette formation abordera les bases du langage Python et certains de ses principaux outils dans une perspective utile aux sciences sociales. Son objectif est à la fois de faire un point sur les possibilités ouvertes par la programmation et de poser les bases pour un apprentissage autonome. Aucun prérequis n’est demandé. Il s’agit aussi d’un espace pour échanger sur les usages possibles.
La journée sera consacrée à une présentation générale de l’usage de Python en sciences sociales, les notions de bases du langage et de l’environnement des notebooks computationnels, et la manipulation de données (collecte de données non structurées et analyse de données tabulaires).
Analyse de réseaux en SHS avec Pajek
Fabien Eloire, Clersé
- Matin : Introduction à la théorie de l’analyse de réseaux et à la théorie des graphes
- Après-midi : Atelier basé sur Cytoscape, logiciel pour l'analyse et la visualisation de réseaux
L'atelier permettra aux participants de découvrir et pratiquer les fonctionnalités du logiciel Cytoscape. Les participants auront l'occasion de travailler sur l'import et le filtrage des données, la visualisation et l'analyse de réseaux (mesures de centralité etc), l’export de données. L'atelier sera conclu par une discussion autour des données des participants.
Informations
PUDL
- Mathilde Guergoat-Larivière, responsable scientifique
- Ada-Marlen Chmilevschi, ingénieure d'études
Partenaire
Crédits
Services de la MESHS