Semaine dataSHS 2023

Produire, nettoyer, analyser ses données en SHS

La Semaine dataSHS propose un choix d'ateliers d'initiation aux méthodes de production et de traitement de données en sciences humaines et sociales, à suivre ensemble ou séparément.

Ces ateliers ont un double objectif d'initiation : aux fondements théoriques de la production et de l'analyse de données en sciences humaines et sociales et à leur mise en œuvre pratique. Le but est de permettre aux participants d'adapter ces méthodes à leur propres travaux, de façon la plus autonome possible.

Comme depuis 2019, toutes les plateformes universitaires de données de France, coordonnées par l'IR* PROGEDO, organisent des formations, conférences, ateliers lors de cette même semaine.

À la PUD de Lille, qui est à l'origine de ce concept, la Semaine dataSHS consiste en cinq jours de formation en présentiel que vous pouvez suivre indépendamment l'un de l'autre. La matinée est généralement consacrée à des questions plus théoriques pour passer à des ateliers d'application dans l'après-midi. Pour la formation en méthodes de classification avec R, il est nécessaire d'avoir des connaissances de base pour la prise en main du logiciel.

Programme

Conception d'un questionnaire : théorie et pratique avec LimeSurvey

Ada Chmilevschi, PUDL

Durant la matinée, nous aborderons quelques bases de la conception d'un questionnaire : étapes, modes de passation, types de questions, types de biais... L'après-midi sera dédié à un atelier de création d'un questionnaire à l'aide du logiciel en ligne LimeSurvey.

Création et mise en forme d’une base de données avec Excel

Lisa Triplet, Clersé

L'objectif de cette formation est de familiariser les participants avec la structure type d'une base de données, tout en leur fournissant des méthodes d'analyse simples sous Excel. Il sera donc question des formes qu'une base de données peut prendre selon son origine, mais également du nettoyage et de la mise en forme de ces données afin de permettre leur analyse.

Intiation à R

Lisa Triplet, Clersé

La participation à l'atelier de la veille sur Excel est obligatoire pour les participants n'ayant pas l'habitude de travailler avec des données quantitatives.

L'objectif de ce module est l'apprentissage des bases du langage R et du vocabulaire d'usage (package, types de variable, etc.). Il sera question d'importer, nettoyer, mettre en forme et analyser à l'aide de fonctions simples des données de natures diverses (numériques, chaînes de caractère, etc.).

Analyse de données textuelles avec TXM

Serge Heiden et Matthieu Decorde, ENS Lyon

Seront abordés :

  • les fondamentaux de l'analyse textométrique par la mise en pratique des outils de TXM sur un corpus exemple (outils de base qualitatifs et quantitatifs)
  • les aspects philologiques amonts (établissement des textes pour l'analyse assistée par ordinateur) par la mise en oeuvre de l'importation d'un corpus dans TXM (texte brut – texte XML – texte XML-TEI)
  • les aspects herméneutiques par la présentation des possibilités d'annotation interne à TXM
  • les aspects de diffusion et d'accès en ligne à des éditions de texte et des corpus pour la lecture et l'analyse par la présentation de portails TXM

Méthodes de classification avec R

Yoann Demoli, Clersé

Pour suivre cette formation, une maîtrise au moins débutante de R est requise. 

La journée de formation a pour objectif l'apprentissage des méthodes de classification ainsi que leur mise en œuvre sous R.

La première partie de la formation traitera, d'un point de vue formel, des différentes méthodes de classification (objectifs, domaines d'application, principes, choix du nombre de classes, ...). La seconde partie, à partir de plusieurs jeux de données, mettra en application sous R les éléments théoriques, en insistant sur la présentation (notamment graphique) des résultats issus des méthodes de classification. 

Informations

Du 11 au 15 décembre 2023, de 9h à 17h

Campus Flers Château, Université de Lille
(365 rue Jules Guesde, Villeneuve d'Ascq)

PUDL

  • Mathilde Guergoat-Larivière, responsable scientifique
  • Ada-Marlen Chmilevschi, ingénieure d'études

Partenaire

IR* PROGEDO

Crédits

Services de la MESHS