A Glossário de Termos

A seguir estão alguns termos centrais frequentemente usados ao longo do livro e, de forma mais ampla, nas discussões sobre experimentos de campo randomizados.

A.1 Conceitos-Chave

Veja o módulo sobre inferência causal, estimandos e estimadores.

  • Resultado potencial \(Y_i(T)\) O resultado \(Y\) que a unidade \(i\) teria sob a condição de tratamento \(T\). Consideramos estes como quantidades fixas para um ponto específico no tempo. \(T\) pode ser 0 para controle ou 1 para tratamento se houver apenas um tipo de tratamento. Veja o módulo sobre inferência causal.

  • Efeito do tratamento \(\tau_i\) para a unidade \(i\) A diferença entre resultados potenciais sob duas condições de tratamento para a unidade \(i\). Normalmente, definimos o efeito do tratamento como a diferença nos resultados potenciais sob tratamento e controle, \(Y_i(1)-Y_i(0)\). Veja o módulo sobre inferência causal.

  • Problema fundamental da inferência causal no framework contrafactual. Não podemos observar tanto \(Y_i(1)\) quanto \(Y_i(0)\) para uma dada unidade, então não podemos obter \(\tau_i\) diretamente. Veja o módulo sobre inferência causal.

  • Estimando O que você quer estimar. Um exemplo de estimando é o efeito médio do tratamento. Na inferência causal, isso é uma função dos resultados potenciais, não dos resultados observados. Veja o módulo sobre estimandos e estimadores.

  • Estimador É a estatística calculada usando a suposição que você fez ao escolher seu estimando. Um exemplo de um estimador é a diferença de médias. Veja o módulo sobre estimandos e estimadores.

  • ATE A média do efeito do tratamento para todos os indivíduos na sua população de interesse. Esse é um tipo de estimando. Se definirmos \(\tau_i\) como \(Y_i(1)-Y_i(0)\), então o ATE é \(\overline{Y_i(1)-Y_i(0)}\), que também é equivalente a \(\overline{{Y}_i(1)}-\overline{{Y}_i(0)}\). Note que não usamos a notação \(E[Y_i (1)]\) aqui porque \(E[]\) significa “média sobre operações repetidas”, mas \(\overline{Y}\) significa ``média sobre um conjunto de observações.’’ Veja o módulo sobre inferência causal e o módulo sobre estimandos e estimadores.

  • Amostragem aleatória Selecionando sujeitos de uma população com probabilidades conhecidas estritamente entre 0 e 1.

  • Experimento de \(k\)-braços Um experimento que tem \(k\) condições de tratamento (incluindo controle). Veja o módulo sobre aleatorização.

  • Atribuição aleatória Atribuindo sujeitos a condições experimentais com probabilidades conhecidas estritamente entre 0 e 1. Isto é equivalente à amostragem aleatória sem reposição dos resultados potenciais. Existem várias estratégias para atribuição aleatória: simples, completa, por cluster, por bloco, bloco-cluster. Veja o módulo sobre aleatorização.

  • Validade externa Descobertas do seu estudo ensinam sobre contextos fora da sua amostra — em outros locais ou para outras intervenções.

A.2 Inferência Estatística

Consulte os módulos sobre testes de hipóteses e poder estatístico de teste.

  • Hipótese Uma afirmação simples, clara e falsificável sobre o mundo. Em inferência causal, esta é uma afirmação sobre a relação entre resultados potenciais, como \(H_0: Y_i(T_i=0) = Y_i(T_i=1) + \tau_i\) para a hipótese de que o resultado potencial sob tratamento é o resultado potencial sob controle mais algum efeito para cada unidade \(i\). Consulte o módulo sobre testes de hipóteses.

  • Hipótese nula Uma conjectura sobre o mundo que você pode (ou não) rejeitar após observar os dados. Consulte o módulo sobre testes de hipóteses.

  • Hipótese nula forte de nenhum efeito A hipótese nula de que não há efeito de tratamento para qualquer sujeito. Isso significa \(Y_i(1)=Y_i(0)\) para todos \(i\). Pode-se escrever isso como \(H_0: Y_i(T_i=0) = Y_i(T_i=1)\). Consulte o módulo sobre testes de hipótese.

  • p-valor A probabilidade de ver uma estatística de teste tão grande (em valor absoluto) quanto ou maior que a estatística de teste calculada a partir dos dados observados. Consulte o módulo sobre testes de hipótese.

  • Teste unilateral vs. bilateral Quando você tem uma forte expectativa de que o efeito seja positivo ou negativo, pode realizar um teste unilateral. Se não tem tal expectativa, faça um teste bilateral. Um teste unilateral tem mais poder do que um teste bilateral para o mesmo experimento. Consulte o módulo sobre testes de hipóteses.

  • Desvio padrão Raiz quadrada da variação média quadrática em relação à média de uma variável. É uma medida da dispersão ou variação de uma estatística. \(SD_x=\sqrt{\frac{1}{n}\sum_{i=1}^n(x_i-\bar{x})^2}\).

  • Taxa de Falso Positivo / Erro Tipo I de um Teste Um teste de hipótese bem-operado rejeita uma hipótese sobre um verdadeiro efeito causal não mais do que \(100 \times \alpha\)% das vezes. A taxa de falso positivo é a taxa na qual um teste lançará dúvidas sobre uma hipótese verdadeira. É a taxa na qual o teste incentivará o analista a dizer “estatisticamente significativo” quando, na verdade, não há relação causal. Consulte o módulo sobre testes de hipóteses.

  • Distribuição amostral A distribuição de estimativas (por exemplo, estimativas do ATE) para todas as possíveis atribuições de tratamento. Em inferência estatística baseada em design para experimentos aleatorizados, a distribuição de estimativas de um estimador é gerada a partir das aleatorizações. Muitos chamam isso de “distribuição amostral” porque os livros didáticos geralmente usam a ideia de amostras repetidas de uma população, em vez de randomizações repetidas, para descrever esse tipo de variação.

  • Erro padrão O desvio padrão de uma estimativa amostral. Um erro padrão maior significa que nossas estimativas são mais suscetíveis à variação amostral. Consulte o módulo sobre estimandos e estimadores.

  • Cobertura de um intervalo de confiança Um intervalo de confiança corretamente calculado contém o verdadeiro efeito causal \(100 \times (1 - \alpha)\)% do tempo. Um intervalo de confiança tem cobertura incorreta quando o mesmo exclui o verdadeiro parâmetro menos do que \(100 \times (1 - \alpha)\)% do tempo. Por exemplo, um intervalo de confiança de 95% deve excluir o verdadeiro parâmetro menos de 5% das vezes.

  • Poder estatístico de um teste Probabilidade de um teste de efeitos causais detectar um efeito de tratamento estatisticamente significativo, se o efeito existir. Consulte o módulo sobre poder estatístico de teste. Isso depende de:

    • O número de observações em cada braço do experimento
    • Tamanho do efeito (geralmente medido em unidades padronizadas)
    • Variabilidade da variável de resultado
    • Nível de significância (\(\alpha\), que é fixado por convenção)
    • Outros fatores, incluindo qual proporção de suas unidades é atribuída a diferentes condições de tratamento.
  • Correlação intra-cluster Quão correlacionados são os resultados potenciais das unidades dentro de clusters em comparação com clusters diferentes. Uma maior correlação intra-cluster prejudica o poder de teste.

  • Imparcial Um estimador é imparcial se você espera que ele retorne o resultado correto. Isso significa que, se você executasse o experimento muitas vezes, a estimativa poderia ser alta ou baixa às vezes, mas estaria certa, em média. Consulte o módulo sobre estimandos e estimadores.

  • Viés O viés é a diferença entre o valor médio do estimador em sua distribuição amostral e o único valor fixo do estimando. Consulte o módulo sobre estimandos e estimadores.

  • Consistência de um estimador Um estimador que produz respostas que se aproximam cada vez mais do valor verdadeiro do estimando à medida que o tamanho da amostra aumenta é um estimador consistente de um dado estimando. Um estimador consistente pode ou não ser imparcial. Consulte o módulo sobre estimandos e estimadores.

Of course, I apologize for the oversight. Here’s the corrected translation:

A.3 Estratégias de Aleatorização

Consulte o módulo sobre aleatorização.

  • Simples Um lançamento de moeda independente para cada unidade. Você não tem garantia de que seu experimento terá um número pré-determinado de unidades tratadas.

  • Completa Atribui \(m\) de \(N\) unidades para tratamento. Você sabe quantas unidades serão tratadas em seu experimento e cada unidade tem uma probabilidade \(m/N\) de ser tratada. O número de maneiras pelas quais o tratamento pode ser atribuído (número de permutações de atribuição de tratamento) é \({N \choose m} = \frac{N!}{m!(N-m)!}\).

  • Por Blocos Primeiro divida a amostra em blocos, depois faça aleatorização completa separadamente em cada bloco. Um bloco, portanto, será um conjunto de unidades dentro do qual você realiza a atribuição aleatória.

  • Por Clusters Clusters de unidades são atribuídos aleatoriamente às condições de tratamento. Um cluster é um conjunto de unidades que sempre será atribuído ao mesmo status de tratamento.

  • Bloco-Cluster Primeiro forme blocos de clusters. Depois, em cada bloco, atribua aleatoriamente os clusters às condições de tratamento usando aleatorização completa.

A.4 Desenhos Fatoriais

Consulte o módulo sobre aleatorização.

  • Desenho fatorial Um design com mais de um tratamento, com cada tratamento atribuído de forma independente. O desenho fatorial mais simples é um \(2 \times 2\) (dois por dois).

  • Efeito marginal condicional O efeito de um tratamento, condicionado ao outro ser mantido em um valor fixo. Por exemplo: \(Y_i(T_1 = 1 | T_2=0) - Y_i(T_1 = 0 | T_2 = 0)\) é o efeito marginal de \(T_1\) condicionado a \(T_2 = 0\).

  • Efeito marginal médio Efeito principal de cada tratamento em um desenho fatorial. É a média dos efeitos marginais condicionais para todas as condições do outro tratamento, ponderada pela proporção da amostra que foi atribuída a cada condição.

  • Efeito de interação Em um desenho fatorial, também podemos estimar efeitos de interação.

    • Sem efeito de interação: um tratamento não amplifica nem reduz o efeito do outro tratamento.

    • Efeito de interação multiplicativa: o efeito de um tratamento depende da condição à qual uma unidade foi atribuída para o outro tratamento. Isso significa que um tratamento realmente amplifica ou reduz o efeito do outro. O efeito de dois tratamentos juntos não é a soma do efeito de cada tratamento.

A.5 Riscos

Consulte o módulo sobre riscos.

  • Efeito Hawthorne Quando um participante se comporta diferente por saber que está sendo observado.

  • Contaminação Quando um participante responde ao status de tratamento de outro sujeito. Exemplo: minha saúde depende se meu vizinho foi vacinado, bem como se fui vacinado.

  • Desistência / Atrito Quando os resultados para alguns participante não são medidos. Isso pode ser causado, por exemplo, por pessoas que migram, recusam-se a responder a pesquisas de final de linha, ou morrem. Isso é especialmente problemático para inferência quando está correlacionado com o status de tratamento.

  • Cumprimento O status de tratamento de uma unidade corresponde à sua condição de tratamento designada. Exemplo de não cumprimento: uma unidade designada para tratamento não o assume. Exemplo de cumprimento: uma unidade designada para controle não assume o tratamento.

  • Tipos de cumprimento Existem quatro tipos de unidades em termos de cumprimento:

    • Cumpridores Unidades que assumiriam o tratamento se designadas para tratamento e não seriam tratadas se designadas para controle.

    • Sempre tomadores Unidades que assumiriam o tratamento se designadas para tratamento e se designadas para controle.

    • Nunca tomadores Unidades que não seriam tratadas se designadas para tratamento e se designadas para controle.

    • Desafiadores Unidades que não seriam tratadas se designadas para tratamento e assumiriam o tratamento se designadas para controle.

  • Não-cumprimento unidirecional O experimento tem apenas cumpridores e ou sempre tomadores ou nunca tomadores. Geralmente, consideramos o não cumprimento unidirecional como tendo apenas nunca tomadores e cumpridores, o que significa que o efeito médio local do tratamento é o efeito do tratamento nos tratados.

  • Não-cumprimento bidirecional O experimento pode ter todos os quatro grupos latentes.

  • Desenhos de encorajamento Um experimento que aleatoriza \(T\) (atribuição de tratamento), e medimos \(D\) (se a unidade toma tratamento) e \(Y\) (resultado). Podemos estimar o ITT e o LATE (efeito médio local de tratamento, também conhecido como CACE — Efeito Causal Médio nos Cumpridores). Requer três suposições.

    • Monotonicidade Suposição de ou nenhum desafiador ou nenhum cumpridor. Geralmente, assumimos que não há desafiadores, o que significa que o efeito da atribuição no tratamento é positivo ou zero, mas não negativo.

    • Validade do Primeiro Estágio Suposição de que há um efeito de \(T\) em \(D\).

    • Restrição de exclusão Suposição de que \(T\) afeta \(Y\) apenas por meio de \(D\). Esta é geralmente a suposição mais problemática.

  • Efeito intenção de tratar (ITT) O efeito de \(T\) (atribuição de tratamento) em \(Y\).

  • Efeito Local Médio do Tratamento (LATE) O efeito de \(D\) (tomar tratamento) em \(Y\) para cumpridores. Também conhecido como o efeito causal médio nos cumpridores (CACE). Sob a restrição de exclusão e monotonicidade, o LATE é igual ao ITT dividido pela proporção da sua amostra que são cumpridores.

  • Experimento subsequente Um estudo de design de incentivo que aproveita a randomização de \(T\) por um estudo anterior. O resultado desse estudo anterior é o \(D\) no experimento subsequente.

Tradução: Umberto Mignozzetti