Semaine dataSHS 2024

Créer, mettre en relation, analyser et visualiser ses données en SHS

La Semaine dataSHS propose un choix d'ateliers d'initiation aux méthodes de production et de traitement de données en sciences humaines et sociales, à suivre ensemble ou séparément.

Ces ateliers ont un double objectif d'initiation : aux fondements théoriques de la production et de l'analyse de données en sciences humaines et sociales et à leur mise en œuvre pratique. Le but est de permettre aux participants d'adapter ces méthodes à leur propres travaux, de façon la plus autonome possible.

Comme depuis 2019, toutes les plateformes universitaires de données de France, coordonnées par l'IR* PROGEDO, organisent des formations, conférences, ateliers lors de cette même semaine.

À la PUD de Lille, qui est à l'origine de ce concept, la Semaine dataSHS consiste en cinq jours de formation en présentiel que vous pouvez suivre indépendamment l'un de l'autre. La matinée est généralement consacrée à des questions plus théoriques pour passer à des ateliers d'application dans l'après-midi. Pour la formation en méthodes de classification avec R, il est nécessaire d'avoir des connaissances de base pour la prise en main du logiciel.

Programme

PROGEDO, Humanum, Heurist pour les données en SHS

En France, les sciences humaines et sociales bénéficient de deux infrastructures de recherche nationale : PROGEDO et Humanum. Ces infrastructures mettent à disposition des entrepôts pour l'archivage, la mise en relation et la diffusion des données de différents types : données d'enquêtes pour PROGEDO, données numériques pour Huma-Num.

La matinée sera l'occasion de présenter les services de ces deux infrastructures, comment ils peuvent être utlisés, par Nicolas Sauger, directeur de l'IR* PROGEDO, et Olivier Beaud, dicteur de l'IR* Huma-Num. Cette présentation sera suivie d'une discussion libre avec les participants, permettant de répondre à vos questionnements sur l'utilisation de différents services, avec Ada Chmilevschi, l'ingénieure d'études de la PUDL, et Valentin de Craene, l'ingénieur d'études en humanités numériques de la MESHS.

L'après-midi donnera lieu à une formation à l'utilisation de l'outil en ligne Heurist, qui permet de construire des bases de données relationnelles avec des données de différents types (textes, images, lieux, documents...) et les mettre à disposition via un site internet. Cette formation sera assurée par Valentin de Craene, l'ingénieure en humanités numériques de la MESHS.

Initiation à R

Cécile Rodrigues, Clersé

L'objectif de ce module est l'apprentissage des bases du langage R et du vocabulaire d'usage (package, types de variable, etc.). Il sera question d'importer, nettoyer, mettre en forme et analyser à l'aide de fonctions simples des données de natures diverses (numériques, chaînes de caractère, etc.).

Conception d'un questionnaire avec LimeSurvey

Ada Chmilevschi, PUDL

Durant la matinée, nous aborderons quelques bases de la conception d'un questionnaire : étapes, modes de passation, types de questions, types de biais... L'après-midi sera dédié à un atelier de création d'un questionnaire à l'aide du logiciel en ligne LimeSurvey.

Python pour les SHS

Emilien Schultz, ENSAE

Cette formation propose une initiation à la programmation scientifique en langage Python pour les acteurs de la recherche en sciences sociales.

Python est un langage de programmation de haut niveau, libre, multi-plateforme, pédagogique, bénéficiant d'une communauté d'utilisateurs et utilisatrices croissante tant dans le domaine scientifique que le secteur privé, notamment sur les usages d'apprentissage autonomatique et de science de la donnée. C’est à la fois un bon langage pour débuter en programmation et pour faire l’interface avec les autres outils existant – par exemple récemment les modèles de langage (LLM).

Cette formation abordera les bases du langage Python et certains de ses principaux outils dans une perspective utile aux sciences sociales. Son objectif est à la fois de faire un point sur les possibilités ouvertes par la programmation et de poser les bases pour un apprentissage autonome. Aucun prérequis n’est demandé. Il s’agit aussi d’un espace pour échanger sur les usages possibles.

La journée sera consacrée à une présentation générale de l’usage de Python en sciences sociales, les notions de bases du langage et de l’environnement des notebooks computationnels, et la manipulation de données (collecte de données non structurées et analyse de données tabulaires).

Analyse de réseaux en SHS avec Pajek

Fabien Eloire, Clersé

  • Matin : Introduction à la théorie de l’analyse de réseaux et à la théorie des graphes
  • Après-midi : Atelier basé sur Cytoscape, logiciel pour l'analyse et la visualisation de réseaux

L'atelier permettra aux participants de découvrir et pratiquer les fonctionnalités du logiciel Cytoscape. Les participants auront l'occasion de travailler sur l'import et le filtrage des données, la visualisation et l'analyse de réseaux (mesures de centralité etc), l’export de données. L'atelier sera conclu par une discussion autour des données des participants.

Informations

Du 9 au 13 décembre 2024, de 9h à 17h

Campus Flers Château, Université de Lille
(365 rue Jules Guesde, Villeneuve d'Ascq)

PUDL

  • Mathilde Guergoat-Larivière, responsable scientifique
  • Ada-Marlen Chmilevschi, ingénieure d'études

Partenaire

IR* PROGEDO

Crédits

Services de la MESHS