3 Randomisation 1

4.1 Quelques types courants de randomisation

Simple
Complète
Par bloc (ou stratifiée)
Par grappe (cluster)
Combinaison par bloc et par grappe
Conceptions à plusieurs bras

4.2 Randomisation simple (tirage au sort)

Pour chaque unité, lancez une pièce pour voir si elle sera traitée. Ensuite, vous mesurez les résultats au même niveau que la pièce.
Les pièces ne doivent pas nécessairement être équitables (50-50), mais vous devez connaître la probabilité d’assignation du traitement.

4.3 Randomisation simple (tirage au sort)

4.4 Randomisation simple (tirage au sort)

Avantage : la randomisation simple permet de ne pas connaître à l’avance la taille totale de l’échantillon.
Désavantage : vous ne pouvez pas garantir un nombre précis d’unités traitées et d’unités de contrôle.

simple_ra(3)

[1] 0 0 0

simple_ra(3)

[1] 1 0 0

4.5 Randomisation complète (tirage d’une urne)

Un nombre fixe de \(m\) sur \(N\) unités est assigné au traitement.
La probabilité qu’une unité soit assignée au traitement est de \(m/N\).
C’est comme avoir une urne avec \(N\) boules, dont \(m\) sont marquées comme traitement et \(N-m\) comme contrôle. La loterie publique utilise cette méthode.

4.6 Randomisation complète (tirage d’une urne)

4.7 Randomisation complète (tirage d’une urne)

Avantage : particulièrement utile lorsque vous avez un petit nombre d’unités pour éviter que toutes les unités soient dans une seule condition.
Désavantage : il faut connaître à l’avance le nombre total d’unités.

complete_ra(4)

[1] 1 1 0 0

complete_ra(4)

[1] 1 0 0 1

4.8 Randomisation par bloc (ou stratifiée)

Nous créons des blocs d’unités et randomisons séparément dans chaque bloc.
Nous faisons des mini-expériences dans chaque bloc. De ce fait, nous avons des unités traitées et des unités de contrôle dans chaque bloc.

4.9 Randomisation par bloc (ou stratifiée)

Exemple : bloc = région, unités = communautés. Nous randomisons le traitement au niveau communautaire au sein de la région et mesurons également les résultats au niveau communautaire.

4.10 Randomisation par bloc (ou stratifiée)

La taille des blocs peut varier.

4.11 Randomisation par bloc (ou stratifiée)

La probabilité de sélection des individus dans le groupe de traitement peut varier d’un bloc à un autre.

4.12 Randomisation par bloc (ou stratifiée)

Comment définir vos blocs ?

Créez des sous-groupes pour lesquels vous souhaitez estimer l’ATE. L’effet moyen de traitement pour un sous-groupe est aussi appelé effet moyen de traitement conditionnel (CATE). Vous pouvez les utiliser pour connaître les différences entre les CATE d’un groupe et d’un autre.

4.13 Randomisation par bloc (ou stratifiée)

Comment définir vos blocs ?

Par des variables qui prédisent le résultat. Cela augmentera la précision de vos estimations.

4.14 Randomisation par bloc (ou stratifiée)

Avantage : vous évitez les randomisations malheureuses qui créent des groupes de traitement et de contrôle différents selon la variable utilisée pour créer les blocs. Les blocs sont généralement très utiles.
Particulièrement utile lorsque vous avez un groupe rare.
Mais nous avons besoin de données pour former des blocs avant la randomisation.

4.15 Randomisation par bloc (ou stratifiée)

blocks <- c(1,1,1,1,2,2,2,2)
block_ra(blocks = blocks)

[1] 0 0 1 1 0 1 0 1

block_ra(blocks = blocks)

[1] 0 0 1 1 0 1 1 0

4.16 Randomisation par grappe (cluster)

Dans une étude randomisée par grappe, toutes les unités de la grappe sont assignées au même statut de traitement.

4.17 Randomisation par grappe (cluster)

Le traitement est assigné au niveau de la grappe.
Le résultat est mesuré au niveau de l’unité.

4.18 Randomisation par grappe (cluster)

Quand procéder à une randomisation par grappe ? Si l’intervention doit fonctionner au niveau de la grappe.
Ne le faites pas si vous pouvez l’éviter ! La randomisation par grappe réduit généralement la puissance statistique. La quantité dépend de la corrélation intra-groupe (ICC ou \(\rho\)). Un \(\rho\) plus élevé est pire.

4.19 Randomisation par grappe (cluster)

Si vous devez utiliser la randomisation par grappe, il est préférable d’en avoir un plus grand nombre.
Un nombre réduit de grappes nuit à votre capacité à détecter les effets du traitement et conduit à des \(p\)-valeurs et des intervalles de confiance (ou même des estimations) trompeurs.

4.20 Randomisation par grappe (cluster)

my_clusters <- c(1,1,1,1,2,2,2,2)
cluster_ra(clusters = my_clusters)

[1] 1 1 1 1 0 0 0 0

cluster_ra(clusters = my_clusters)

[1] 0 0 0 0 1 1 1 1

4.21 Vous pouvez combiner blocs et grappes

Vous pouvez avoir des grappes dans des blocs.
Est-ce que vous pouvez avoir des blocs dans les grappes ?

4.22 Vous pouvez combiner blocs et grappes

my_blocks <- c(1,1,1,1,2,2,2,2)
my_clusters <- c(1,1,2,2,3,3,4,4)
block_and_cluster_ra(blocks = my_blocks, clusters = my_clusters)

[1] 0 0 1 1 1 1 0 0

block_and_cluster_ra(blocks = my_blocks, clusters = my_clusters)

[1] 1 1 0 0 1 1 0 0

4.23 Conception à plusieurs bras

Vous pouvez randomiser les unités dans plus de conditions (bras) qu’un seul bras de traitement et un bras de contrôle.
Par exemple, nous pourrions avoir un groupe de transfert d’argent, un groupe de formation à l’emploi, et un groupe de contrôle sans intervention.

4.24 Conception à plusieurs bras

Un exemple avec une randomisation complète

4.25 Conception à plusieurs bras

Avantages : nous pouvons comparer chaque traitement au contrôle ou l’un à l’autre.
Désavantage : on peut rapidement se retrouver avec un très grand nombre de tests d’hypothèses, ce qui pose des problèmes.

4.26 Conception à plusieurs bras

complete_ra(12, num_arms = 3)

 [1] T2 T3 T2 T1 T1 T3 T1 T2 T3 T3 T1 T2
Levels: T1 T2 T3

complete_ra(12, prob_each = c(.1, .2, .7))

 [1] T2 T3 T3 T3 T3 T3 T3 T3 T1 T2 T2 T3
Levels: T1 T2 T3

4.27 Ressource

Guide des méthodes EGAP sur la randomisation : https://egap.org/fr/resource/10-choses-a-savoir-sur-la-randomisation/