Administrer la preuve statistique en sciences sociales

Présentation

À l’heure où les sciences expérimentales s’interrogent sur les limites des pratiques et des normes de la statistique classique et du paradigme fréquentiste, ce débat est encore peu présent dans les sciences sociales, en particulier françaises. Or la preuve statistique dans ces disciplines se caractérise par certaines particularités (données non expérimentales, données personnelles, coûts de collectes élevés, etc.) qui rendent difficiles les solutions habituellement préconisées (pre-registration, publication des résultats nuls, réplication, méta-analyses, etc.). Le séminaire vise à faire le point sur l’état des réflexions et sur leurs conséquences pour les pratiques de la recherche quantitative dans les sciences sociales.

Lors de la première année du séminaire, en 2019-2020, les séances ont essentiellement porté sur la présentation du mouvement en faveur de la reproductibilité, des controverses scientifiques récentes et des enjeux pratiques liés à la reproductibilité, et de la critique des tests d’hypothèse et du modèle fréquentiste.

En 2020-2021, nous souhaitons poursuivre les activités du séminaire, en examinant collectivement les méthodes d’analyse alternatives (statistique bayésienne, machine learning, méthodes dites "narratives") et leurs articulations à des méthodes d’analyse plus "classiques" (réseaux et analyses géométriques).

Le séminaire est ouvert à des étudiant·e·s avancé·e·s, maîtrisant les bases du raisonnement quantitatif en sciences sociales, ainsi qu’à des doctorant·e·s et à des enseignant·e·s-chercheur·e·s souhaitant approfondir leur réflexion et leur formation en matière de quantification.

Les séances ont lieu le mardi de 17h à 19h (lieu à définir).

Elles se déroulent le troisième mardi du mois de novembre 2020 à juin 2021 : 17/11 (salle R1-08) ; 15/12 ; 19/01 ; 16/02 ; 16/03 ; 20/04 ; 18/05 ; 15/06.

Programme

17 novembre 2020 – Le genre des sources : identifier, catégoriser, quantifier le genre dans une source historique, Anton Perdoncin

15 décembre 2020 – Self-Organizing Maps et analyse géométrique de données, Julien Bolaert (U. Lille, Ceraps) Etienne Ollion (CNRS, CREST-ENSAE)

19 janvier 2021 – Recommandation et diversité sur un service de streaming musical. Analyse de données d’usages par un modèle multi-niveau, Samuel Coavoux

16 février 2021 – Modéliser des observations dépendantes : analyse de réseaux et modèles ERGM, François Briatte (ESPOL, U. catholique Lille)

16 mars 2021 – Peut-on identifier l’effet causal d’une mesure pénale sur les comportements de récidive ? Données australiennes, LATE et disparités dans le recours au traitement, Anaïs Henneguelle (U. Rennes 2, LiRIS)

20 avril 2021 – Eléments de philosophie bayesienne, Gabriel Alcaras, Pierre Blavier et Samuel Coavoux

18 mai 2021 – Refuser l’inaccessible ? Quantifier l’ajustement des aspirations aux possibles objectifs de potentiels candidats à l’enseignement supérieur suédois, Yann Renisio et Emil Bertilsson (Uppsala University)

15/06 – Présentation des travaux des participant·e·s

Validation

Le séminaire peut être validé par les étudiant.e.s des parcours PDI et Quantifier en sciences sociales du Master de Sciences sociales (PSL, ENS, EHESS), ainsi que par les élèves et étudiant.e.s normalien.ne.s dans le cadre du DENS. Validation par assiduité et sur travaux.

Organisateurs

Gabriel Alcaras, doctorant au CMH, EHESS, ENS.

Pierre Blavier, chargé de recherche au Clersé, CNRS, U. Lille.

Samuel Coavoux, chercheur à Orange Labs.

Anton Perdoncin, post-doctorant, EHESS, CNRS.