Causal Inference | Inférence causale

Alyssa, Macartan, Vin, Yannick

2026-06-12

 

Table of contents
Table des matières

Causal effects

Causal effects
Un effet causal

What do we mean by “\(X\) causes \(Y\)”?

What do we mean by “\(X\) causes \(Y\)”?
Comment interpréter “X cause Y”?
  • We take a counterfactual approach.

  • \(X\) causes \(Y\)” is a claim about what didn’t happen.

    • “If \(X\) had not occurred, then \(Y\) would not have occurred.”

    • “With \(X\), the probability of \(Y\) is higher than would be without \(X\).”

    • \(X\) causes \(Y\)” does not mean some other thing, \(W\), does not cause \(Y\).

  • Nous prenons une approche contrefactuelle.

  • \(X\) cause \(Y\)” est une affirmation sur ce qui n’a pas eu lieu.

    • “Si \(X\) n’avait pas eu lieu, il n’y aurait pas de \(Y\).”

    • “Avec \(X\), la probabilité de \(Y\) est plus élevée qu’elle ne le serait sans \(X\).”

    • \(X\) cause \(Y\)” n’implique pas nécessairement que \(W\) ne cause pas \(Y\).

Treatments

Treatments
Traitements
  • We must define what having \(X\) and not having \(X\) mean to define a causal effect.

  • You have to define what you mean by control:

    • Absence of any intervention.

    • Placebo.

  • Nous devons définir ce que signifie le fait d’avoir \(X\) et de ne pas avoir \(X\) pour définir un effet causal.

  • Vous devez définir votre condition de contrôle :

    • Absence d’intervention.

    • Placebo.

Learning about the average causal effect from an experiment

Learning about the average causal effect from an experiment
Comment apprendre l’effet causal moyen d’une expérience aléatoire

Research question

Research question
La question de recherche
  • What is the effect of drinking coffee at breakfast on energy levels right now for everyone at Learning Days?
  • Quel est l’effet de la consommation du café au petit-déjeuner sur les niveaux d’énergie actuels des participants et instructeurs de Learning Days?

The ATE is the average of individual treatment effects

The ATE is the average of individual treatment effects
L’ATE est la moyenne des effets de traitement individuels
  • Before defining an average treatment effect, we define a treatment effect for an individual \(i\).
  • Avant de définir l’effet moyen de traitement, il faut définir l’effet de traitement pour un individu \(i\).

We use a model of potential outcomes

We use a model of potential outcomes
Nous utilisons un modèle de résultats potentiels

For a unit \(i\), we assume that there are two potential outcomes: \(Y_i(1)\) and \(Y_i(0)\).

  • \(Y_i(1)\) is the outcome that we would obtain if the unit were to receive the treatment (\(X_i=1\)).

  • \(Y_i(0)\) is the outcome that we would obtain if the unit were to receive the control (\(X_i=0\)).

Pour une unité \(i\), nous supposons qu’il y a deux résultats potentiels : \(Y_i(1)\) et \(Y_i(0)\).

  • \(Y_i(1)\) est le résultat qu’on obtiendrait si l’unité recevait le traitement (\(X_i=1\)).

  • \(Y_i(0)\) est le résultat qu’on obtiendrait si l’unité recevait le contrôle (\(X_i=0\)).

We have 12 units

We have 12 units
Nous avons 12 unités

Each unit has both \(Y_i(1)\) and \(Y_i(0)\)

Each unit has both \(Y_i(1)\) and \(Y_i(0)\)
Chaque unité a à la fois \(Y_i(1)\) et \(Y_i(0)\)

Each unit has both \(Y_i(1)\) and \(Y_i(0)\)

Each unit has both \(Y_i(1)\) and \(Y_i(0)\)
Chaque unité a à la fois \(Y_i(1)\) et \(Y_i(0)\)

The treatment effect for \(i\) is defined as \(\tau_i \equiv Y_i(1) - Y_i(0)\)

The treatment effect for \(i\) is defined as \(\tau_i \equiv Y_i(1) - Y_i(0)\)
L’effet de traitement pour individu \(i\) est défini comme \(\tau_i \equiv Y_i(1) - Y_i(0)\)

Average Treatment Effect \(\overline{\tau_i}= \overline{Y_i(1)-Y_i(0)}\)

Average Treatment Effect \(\overline{\tau_i}= \overline{Y_i(1)-Y_i(0)}\)
L’effet moyen du traitement (ATE) \(\overline{\tau_i}= \overline{Y_i(1)-Y_i(0)}\)

Fundamental problem of causal inference

Fundamental problem of causal inference
Le problème fondamental de l’inférence causale
  • We can’t measure the individual-level causal effect, because we can’t observe both \(Y_i(1)\) and \(Y_i(0)\) at the same time.

  • But we can still estimate the average treatment effect with a randomized experiment.

  • Nous ne pouvons pas mesurer l’effet causal au niveau individuel, car nous ne pouvons pas observer à la fois \(Y_i(1)\) et \(Y_i(0)\) pour un même individu.

  • Mais nous pouvons estimer l’effet moyen du traitement avec une expérience aléatoire.

Connecting observed outcomes to potential outcomes

Connecting observed outcomes to potential outcomes
Relier les résultats observés aux résultats potentiels

What we actually see is a combination of potential outcomes, coming from different samples: the sample of those assigned to treatment and the sample of those assigned to control.

Ce que nous observons réellement, c’est une combinaison de résultats potentiels, provenant de différents échantillons : l’échantillon des unités assignées au traitement et l’échantillon des unités assignées au contrôle.

A random assignment

A random assignment
Une assignation aléatoire

We learn the outcomes and produce an estimate

We learn the outcomes and produce an estimate
Nous apprenons les résultats et produisons une estimation

We estimate an effect by taking two samples of potential outcomes

Nous estimons un effet en prenant deux échantillons de résultats potentiels

Potential outcomes: why randomization works

Potential outcomes: why randomization works
Résultats potentiels : pourquoi la randomisation fonctionne

Potential outcomes: A bad selection procedure

Potential outcomes: A bad selection procedure
Résultats potentiels : une mauvaise procedure

Randomization works in expectation

Randomization works in expectation
La randomisation fonctionne en moyenne

Important!: A different random assignment would have produced another estimate (maybe different)

Important!: A different random assignment would have produced another estimate (maybe different)
Notez! Une assignation aléatoire différente aurait produit une autre estimation (peut-être differente)

Randomization works in expectation

Randomization works in expectation
La randomisation fonctionne en moyenne

Randomization works in expectation

Randomization works in expectation
La randomisation fonctionne en moyenne
  • A particular random assignment will probably not give us the true average treatment effect.

  • But the average of the estimates produced by all possible randomizations will be the true average treatment effect!

  • Une assignation aléatoire particulière ne nous donnera probablement pas la vraie valeur de l’effet causal moyen de traitement.

  • Mais la moyenne de toutes les estimations possibles est la vraie valeur.

Why?

Why?
Pourquoi?

Randomization works in expectation

Randomization works in expectation
La randomisation fonctionne en moyenne

\[\mathbb E_R[\overline{Y_i}|X_i=1]=\overline{Y_i(1)}\] \[\mathbb E_R[\overline{Y_i}|X_i=0]=\overline{Y_i(0)}\]

Because the units were randomly assigned to treatment, the average of the \(Y_i\) for the treated units is a good estimate of the average of \(Y_i(1)\) for all the units.

The same logic applies to the units randomly assigned to control.

Parce que les unités ont été assignées de manière aléatoire au traitement, la moyenne de \(Y_i\) pour les unités traitées est une bonne estimation de la moyenne de \(Y_i(1)\) pour toutes nos unités.

La même logique s’applique pour les unités assignées aléatoirement au contrôle.

Remember! We can take a random sample of these \(Y_i(1)\)

Remember! We can take a random sample of these \(Y_i(1)\)
Rappel ! Sélectionnons un échantillon aléatoire de \(Y_i(1)\)

We can take another random sample of these \(Y_i(1)\)

We can take another random sample of these \(Y_i(1)\)
Sélectionnons un autre échantillon aléatoire de \(Y_i(1)\)

And another!

And another!
Et un autre!

Average of sample averages

Average of sample averages
La moyenne des moyennes de l’échantillon

Average of sample averages

Average of sample averages
La moyenne des moyennes de l’échantillon
  • A particular sample average will not be the true population average.

  • But the average of all the sample averages will be the true population average!

  • Un échantillon particulier ne nous donnera probablement pas la vraie valeur.

  • Mais la moyenne de toutes les moyennes possibles est la vraie valeur!

Randomization works in expectation

Randomization works in expectation
La randomisation fonctionne en moyenne

\[ \begin{aligned} ATE = \overline{\tau_i} &= \overline{Y_i(1)-Y_i(0)} \\ &= \overline{Y_i(1)}-\overline{Y_i(0)} \end{aligned} \]

And we can estimate these components!

Et nous pouvons estimer ces composantes !

\[\text{✓ }\mathbb E_R[\overline{Y_i}|X_i=1]=\overline{Y_i(1)}\]

\[\text{✓ }\mathbb E_R[\overline{Y_i}|X_i=0]=\overline{Y_i(0)}\]

Quiz

Quiz

Quiz
Quiz
Unit Y(0) Y(1) \(\tau_i\)
1 4 3
2 2 3
3 1 3
4 1 3
5 2 3

Questions for us: What are the unit level treatment effects? What is the average treatment effect?

Questions pour nous : Quels sont les effets de traitement au niveau de l’unité ? Quel est l’effet moyen du traitement ?

Quiz

Quiz
Quiz
Z Y(0) Y(1)
2
X 3
X 1
3
X 2

Fill in the blanks, assuming…

  • a constant treatment effect of \(+1\)
  • a constant treatment effect of \(-1\)
  • an average treatment effect of \(0\)

What is the actual treatment effect?

Complétez les cases vides, en supposant…

  • un effet de traitement constant de \(+1\)
  • un effet de traitement constant de \(-1\)
  • un effet de traitement moyen de \(0\)

Quel est l’effet de traitement réel ?

Core assumptions

Core assumptions
Hypothèses clés

Core assumptions

Core assumptions
Hypothèses clés
  1. Random assignment of treatment.

  2. SUTVA (Stable unit treatment value assumption).

  3. Excludability.

  1. L’assignation aléatoire du traitement.

  2. L’hypothèse SUTVA (Hypothèse stable de la valeur de traitement d’une unité).

  3. La restriction d’exclusion.

Core assumption 1: Random assignment of treatment

Core assumption 1: Random assignment of treatment
Hypothèse clé 1 : L’assignation aléatoire du traitement
  • Random assignment means that each observation has a known probability of assignment to experimental conditions between 0 and 1.

  • No unit in the experimental sample is assigned to treatment with certainty (probability = 1) or to control with certainty (probability = 0).

  • It doesn’t mean haphazard or uncontrolled!

  • L’assignation aléatoire signifie que chaque observation a une probabilité connue d’assignation au traitement comprise entre 0 et 1.

  • Aucune unité de l’échantillon expérimental n’est assignée au traitement (probabilité = 1) ou au contrôle avec certitude (probabilité = 0).

  • Cela ne signifie ni désordonné ni incontrôlé!

Core assumption 1: Random assignment of treatment

Core assumption 1: Random assignment of treatment
Hypothèse clé 1 : L’assignation aléatoire du traitement
  • Careful: Treatment assignment may be randomized, but treatment condition received may not be the same and hence not randomized.
  • Attention ! L’assignation du traitement peut être randomisée, mais la condition du traitement reçu peut ne pas être la même que la condition assignée (donc ne pas être randomisée).

Core assumption 2: SUTVA, part 1

Core assumption 2: SUTVA, part 1
Hypothèse clé 2: SUTVA, partie 1

2.1 No interference – A subject’s potential outcome reflects only whether that subject receives the treatment himself/herself. It is not affected by how treatments happen to be allocated to other subjects.

  • A classic violation is the case of vaccines and their spillover effects.

2.1 L’absence de contamination – Le résultat potentiel d’un sujet reflète uniquement la réception du traitement par ce sujet. Il n’est pas affecté par le statut de traitement des autres sujets.

  • Une violation classique est le cas des vaccins et de leurs effets de contamination.

Core assumption 2: SUTVA, part 2

Core assumption 2: SUTVA, part 2
Hypothèse clé 2 : SUTVA, partie 2

2.2 No hidden variations of the treatment

  • Say treatment is taking a vaccine, but there are two kinds of vaccines and they have different ingredients.

2.2 Pas de variations cachées du traitement

  • Disons que le traitement consiste à prendre un vaccin, mais il existe deux types de vaccins et ils ont des compositions différentes.

Core assumption 3: Excludability

Core assumption 3: Excludability
Hypothèse clé 3: La restriction d’exclusion
  1. Treatment assignment has no effect on outcomes except through its effect on whether treatment was received.
  • Treatment and control groups should be treated the same, except for the actual treatment.
  1. L’assignation au traitement n’a aucun effet sur les résultats, sauf à travers l’effet de recevoir ou non le traitement.
  • Important de maintenir la symétrie entre les groupes de traitement et de contrôle, excepté le statut du traitement.

These assumptions are our responsibility

These assumptions are our responsibility
Ces hypothèses sont notre réponsibilité
  • If the assumptions are not valid, the conclusions may not be trustworthy.

  • We should design and execute our research in ways that ensure these assumptions are valid. Check for problems when you can.

  • Si les hypothèses ne tiennent pas, les conclusions risquent de ne pas être fiables.

  • Nous devons concevoir et faire nos recherches de manière à assurer la validité de ces hypothèses. Vérifiez les problèmes lorsque vous le pouvez.

Randomized experiments vs observational studies

Randomized experiments vs observational studies
Études randomisées vs. études observationnelles

Randomized studies

Randomized studies
Études randomisées
  • Randomize treatment, then measure outcomes.

  • Randomization creates two groups that we expect to be similar. Differences before receiving treatment are only due to chance.

  • We create the difference with the treatment. Therefore, we can attribute differences in outcomes to the treatment (plus chance) instead of other factors.

  • Randomiser le traitement, puis mesurer les résultats.

  • La randomisation crée deux groupes qui devraient être similaires. Les différences avant le traitement ne sont dues qu’au hasard.

  • Nous créons ensuite la différence avec le traitement. Nous pouvons donc attribuer les différences de résultats au traitement (plus le hasard) plutôt qu’à d’autres facteurs.

Internal validity

Internal validity
La validité interne
  • Randomization generally gives us internal validity — confidence in our estimate of the causal effect of \(X\) on \(Y\) for our study.
  • Observational studies generally need other strong assumptions to try to deal with selection bias.
  • La randomisation nous donne généralement une validité interne : confiance dans notre estimation de l’effet causal de \(X\) sur \(Y\) pour notre étude.
  • Les études observationnelles ont besoin d’autres hypothèses fortes pour traiter le biais de sélection.

External validity (generalizability)

External validity (generalizability)
La validité externe (généralisabilité)
  • The units in your study might or might not be representative of a larger population.
  • The conclusions from one study may not apply to other settings (i.e., may lack external validity).
  • This is a general concern for both observational and randomized studies.
  • Les unités de votre étude peuvent ou non être représentatives d’une population plus large.
  • Les conclusions d’une étude peuvent ne pas s’appliquer à d’autres contextes (c.-à-d. manque de validité externe).
  • C’est une préoccupation générale, tant pour les études observationnelles que pour les études randomisées.