Module 6 Paramètres et estimateurs
Les expériences aléatoires génèrent de bonnes suppositions sur le résultat moyen sous traitement et le résultat moyen sous contrôle. Cela nous permet d’avoir des estimateurs sans biais de l’effet moyen du traitement. Nous pouvons également utiliser la randomisation pour décrire comment les estimations générées par un estimateur peuvent varier d’une expérience à l’autre en utilisant l’erreur type et les intervalles de confiance.
Dans ce module, nous introduisons plusieurs types de paramètres. Le choix du paramètre est une décision scientifique et politique – sur quelle quantité aimerions-nous en savoir plus ? De plus, nous voulons sélectionner un estimateur approprié pour ce paramètre dans le cadre de la conception de recherche. Nous discutons de la façon dont les estimateurs sont appliqués aux données pour générer un paramètre et comment caractériser sa variabilité.
6.1 Contenu
Un effet causal, \(\tau_i\), est une comparaison des résultats potentiels non observés pour chaque unité \(i\). Par exemple, cela peut être une différence ou un ratio entre résultats potentiels non observés.
Pour en savoir plus sur \(\tau_{i}\), on peut traiter \(\tau_{i}\) comme un paramètre ou une quantité cible à estimer (voir ce module) ou comme une quantité cible sur laquelle émettre une hypothèse (voir le module des tests d’hypothèses).
Beaucoup de gens se concentrent sur l’effet moyen du traitement (Average Treatment Effect / ATE), \(\bar{\tau}=\sum_{i=1}^n \tau_{i}\), en partie parce qu’il permet d’estimer facilement.
Un estimateur est une recette pour calculer une supposition sur la valeur d’un paramètre. Par exemple, la différence entre la moyenne des résultats observés pour \(m\) unités traitées et la moyenne des résultats observés pour \(N-m\) unités non traitées est un estimateur de \(\bar{\tau}\).
Différentes randomisations produiront différentes valeurs du même estimateur ciblant le même paramètre. L’erreur type résume cette variabilité au sein d’un estimateur.
Un intervalle de confiance de \(100(1-\alpha)\)% est un ensemble d’hypothèses qui ne peuvent être rejetées au niveau \(\alpha\). Nous avons tendance à rapporter des intervalles de confiance contenant des hypothèses sur les valeurs de notre paramètre et à utiliser notre estimateur comme statistique de test.
Les estimateurs devraient (1) éviter les erreurs systématiques dans leur estimation du paramètre (être sans biais) ; (2) peu varier dans leurs suppositions d’une expérience à l’autre (être précis ou efficace) ; et peut-être idéalement (3) converger vers le paramètre quand ils utilisent de plus en plus d’informations (être cohérent).
Analyser en randomisant dans le contexte de l’estimation signifie que (1) nos erreurs types devraient mesurer la variabilité de la randomisation et (2) nos estimateurs devraient cibler des paramètres définis en termes de résultats potentiels.
Nous ne contrôlons pas les covariables lorsque nous analysons les données d’expériences aléatoires. Pourtant les covariables peuvent rendre notre estimation plus précise. C’est ce qu’on appelle l’ajustement de covariance. L’ajustement de covariance dans les expériences aléatoires diffère du contrôle des variables dans les études d’observation.
Une intervention politique (comme une lettre qui incite à l’exercice) peut avoir l’intention de changer un comportement par une dose active (exercice réel). Nous pouvons étudier l’effet causal de l’intention en envoyent les lettres de façon aléatoire. C’est ce qu’on appele l’effet d’intention de traiter (intent to treat effect, ITT).
Nous pouvons étudier l’effet causal de l’exercice réel en utilisant l’assignation aléatoire de lettres comme instrument de la dose active (l’exercice lui-même) afin d’apprendre davantage sur l’effet causal de l’exercice chez ceux qui changeraient leur comportement après avoir reçu la lettre. Cette version de l’effet causal moyen est souvent connue sous le nom d’effet moyen local du traitement ou d’effet causal moyen pour ceux qui se conforment au traitement (complier average causal effect, CACE).
6.2 Slides
Vous trouverez ci-dessous des slides avec le contenu de base pour cette section.
Vous pouvez aussi lire les slides des précédentes journées d’apprentissage du réseau EGAP:
Vous pouvez également voir les problèmes d’estimation de l’effet de la dose active d’un traitement dans ces slides (ainsi que les problèmes causés par les données manquantes dans les résultats pour l’estimation de l’effet causal moyen) :
6.3 Ressources
6.3.1 Guide des méthodes EGAP
Guide des méthodes EGAP Les 10 types d’effets de traitement à connaître
Guide des méthodes EGAP 10 choses à savoir sur l’ajustement de covariable
Guide des méthodes EGAP 10 choses à savoir sur les données manquantes (en anglais)
Guide des méthodes EGAP 10 choses à savoir sur l’effet moyen local du traitement (en anglais)
Guide des méthodes EGAP 10 choses à savoir sur les effets de contamination (en anglais)
6.3.2 Livres, chapitres et articles
Gerber and Green, Field Experiments. Chapitre 2.7 sur l’exclusion et la non-interférence, Chapitre 3, Chapitre 5 sur la non-conformité unilatérale, Chapitre 6 sur la non-conformité bilatérale, Chapitre 7 sur l’attrition, Chapitre 8 sur l’interférence entre les unités expérimentales.
Jake Bowers and Thomas Leavitt, “Causality & Design-Based Inference,” in The Sage Handbook of Research Methods in Political Science and International Relations, ed. Luigi Curini and Robert Franzese (Sage Publications Ltd, 2020).