2026-06-12
We take a counterfactual approach.
“\(X\) causes \(Y\)” is a claim about what didn’t happen.
“If \(X\) had not occurred, then \(Y\) would not have occurred.”
“With \(X\), the probability of \(Y\) is higher than would be without \(X\).”
“\(X\) causes \(Y\)” does not mean some other thing, \(W\), does not cause \(Y\).
Nous prenons une approche contrefactuelle.
“\(X\) cause \(Y\)” est une affirmation sur ce qui n’a pas eu lieu.
“Si \(X\) n’avait pas eu lieu, il n’y aurait pas de \(Y\).”
“Avec \(X\), la probabilité de \(Y\) est plus élevée qu’elle ne le serait sans \(X\).”
“\(X\) cause \(Y\)” n’implique pas nécessairement que \(W\) ne cause pas \(Y\).
We must define what having \(X\) and not having \(X\) mean to define a causal effect.
You have to define what you mean by control:
Absence of any intervention.
Placebo.
Nous devons définir ce que signifie le fait d’avoir \(X\) et de ne pas avoir \(X\) pour définir un effet causal.
Vous devez définir votre condition de contrôle :
Absence d’intervention.
Placebo.
For a unit \(i\), we assume that there are two potential outcomes: \(Y_i(1)\) and \(Y_i(0)\).
\(Y_i(1)\) is the outcome that we would obtain if the unit were to receive the treatment (\(X_i=1\)).
\(Y_i(0)\) is the outcome that we would obtain if the unit were to receive the control (\(X_i=0\)).
Pour une unité \(i\), nous supposons qu’il y a deux résultats potentiels : \(Y_i(1)\) et \(Y_i(0)\).
\(Y_i(1)\) est le résultat qu’on obtiendrait si l’unité recevait le traitement (\(X_i=1\)).
\(Y_i(0)\) est le résultat qu’on obtiendrait si l’unité recevait le contrôle (\(X_i=0\)).
We can’t measure the individual-level causal effect, because we can’t observe both \(Y_i(1)\) and \(Y_i(0)\) at the same time.
But we can still estimate the average treatment effect with a randomized experiment.
Nous ne pouvons pas mesurer l’effet causal au niveau individuel, car nous ne pouvons pas observer à la fois \(Y_i(1)\) et \(Y_i(0)\) pour un même individu.
Mais nous pouvons estimer l’effet moyen du traitement avec une expérience aléatoire.
What we actually see is a combination of potential outcomes, coming from different samples: the sample of those assigned to treatment and the sample of those assigned to control.
Ce que nous observons réellement, c’est une combinaison de résultats potentiels, provenant de différents échantillons : l’échantillon des unités assignées au traitement et l’échantillon des unités assignées au contrôle.
We estimate an effect by taking two samples of potential outcomes
Nous estimons un effet en prenant deux échantillons de résultats potentiels
A particular random assignment will probably not give us the true average treatment effect.
But the average of the estimates produced by all possible randomizations will be the true average treatment effect!
Une assignation aléatoire particulière ne nous donnera probablement pas la vraie valeur de l’effet causal moyen de traitement.
Mais la moyenne de toutes les estimations possibles est la vraie valeur.
\[\mathbb E_R[\overline{Y_i}|X_i=1]=\overline{Y_i(1)}\] \[\mathbb E_R[\overline{Y_i}|X_i=0]=\overline{Y_i(0)}\]
Because the units were randomly assigned to treatment, the average of the \(Y_i\) for the treated units is a good estimate of the average of \(Y_i(1)\) for all the units.
The same logic applies to the units randomly assigned to control.
Parce que les unités ont été assignées de manière aléatoire au traitement, la moyenne de \(Y_i\) pour les unités traitées est une bonne estimation de la moyenne de \(Y_i(1)\) pour toutes nos unités.
La même logique s’applique pour les unités assignées aléatoirement au contrôle.
A particular sample average will not be the true population average.
But the average of all the sample averages will be the true population average!
Un échantillon particulier ne nous donnera probablement pas la vraie valeur.
Mais la moyenne de toutes les moyennes possibles est la vraie valeur!
\[ \begin{aligned} ATE = \overline{\tau_i} &= \overline{Y_i(1)-Y_i(0)} \\ &= \overline{Y_i(1)}-\overline{Y_i(0)} \end{aligned} \]
And we can estimate these components!
Et nous pouvons estimer ces composantes !
\[\text{✓ }\mathbb E_R[\overline{Y_i}|X_i=1]=\overline{Y_i(1)}\]
\[\text{✓ }\mathbb E_R[\overline{Y_i}|X_i=0]=\overline{Y_i(0)}\]
| Unit | Y(0) | Y(1) | \(\tau_i\) |
|---|---|---|---|
| 1 | 4 | 3 | |
| 2 | 2 | 3 | |
| 3 | 1 | 3 | |
| 4 | 1 | 3 | |
| 5 | 2 | 3 |
Questions for us: What are the unit level treatment effects? What is the average treatment effect?
Questions pour nous : Quels sont les effets de traitement au niveau de l’unité ? Quel est l’effet moyen du traitement ?
| Z | Y(0) | Y(1) |
|---|---|---|
| ✓ | 2 | |
| X | 3 | |
| X | 1 | |
| ✓ | 3 | |
| X | 2 |
Fill in the blanks, assuming…
What is the actual treatment effect?
Complétez les cases vides, en supposant…
Quel est l’effet de traitement réel ?
Random assignment of treatment.
SUTVA (Stable unit treatment value assumption).
Excludability.
L’assignation aléatoire du traitement.
L’hypothèse SUTVA (Hypothèse stable de la valeur de traitement d’une unité).
La restriction d’exclusion.
Random assignment means that each observation has a known probability of assignment to experimental conditions between 0 and 1.
No unit in the experimental sample is assigned to treatment with certainty (probability = 1) or to control with certainty (probability = 0).
It doesn’t mean haphazard or uncontrolled!
L’assignation aléatoire signifie que chaque observation a une probabilité connue d’assignation au traitement comprise entre 0 et 1.
Aucune unité de l’échantillon expérimental n’est assignée au traitement (probabilité = 1) ou au contrôle avec certitude (probabilité = 0).
Cela ne signifie ni désordonné ni incontrôlé!
2.1 No interference – A subject’s potential outcome reflects only whether that subject receives the treatment himself/herself. It is not affected by how treatments happen to be allocated to other subjects.
2.1 L’absence de contamination – Le résultat potentiel d’un sujet reflète uniquement la réception du traitement par ce sujet. Il n’est pas affecté par le statut de traitement des autres sujets.
2.2 No hidden variations of the treatment
2.2 Pas de variations cachées du traitement
If the assumptions are not valid, the conclusions may not be trustworthy.
We should design and execute our research in ways that ensure these assumptions are valid. Check for problems when you can.
Si les hypothèses ne tiennent pas, les conclusions risquent de ne pas être fiables.
Nous devons concevoir et faire nos recherches de manière à assurer la validité de ces hypothèses. Vérifiez les problèmes lorsque vous le pouvez.
Randomize treatment, then measure outcomes.
Randomization creates two groups that we expect to be similar. Differences before receiving treatment are only due to chance.
We create the difference with the treatment. Therefore, we can attribute differences in outcomes to the treatment (plus chance) instead of other factors.
Randomiser le traitement, puis mesurer les résultats.
La randomisation crée deux groupes qui devraient être similaires. Les différences avant le traitement ne sont dues qu’au hasard.
Nous créons ensuite la différence avec le traitement. Nous pouvons donc attribuer les différences de résultats au traitement (plus le hasard) plutôt qu’à d’autres facteurs.