O PROBLEMA DA ANÁLISE A POSTERIORI

Josikwylkson Costa Brito

A sequência ideal, e talvez óbvia, de se fazer um estudo com grande qualidade é desenhá-lo e, logo após, verificar os seus resultados. Nem todas as vezes, porém, executam isso, e é aí que nasce um problema metodológico.

Quem não conhece alguém que, ao invés de elaborar um projeto de pesquisa, coleta vários dados e, só então, decide o que fazer com eles, procurando alguma correlação? Mesmo que haja boas intenções, esse tipo de análise (a posteriori) pode ser extremamente enviesada e tem chances de gerar diversos erros.

O viés em questão é denominado de “viés do franco-atirador texano” e é descrito com uma analogia interessante. No estado do Texas, nos Estados Unidos, havia um homem que dizia ser o melhor atirador da época. Apesar de todas as pessoas duvidarem, de fato, o homem sempre acertava o alvo, independentemente da distância. Como poderia ser o atirador tão eficaz? Simples. Ele atirava várias vezes contra uma parede e, só depois, desenhava o alvo. Ele coletou os dados e, só depois, chegou a uma conclusão. Ele fez uma análise a posteriori.

Todos hão de concordar que essa não seria a melhor maneira de comprovar a eficácia do atirador. Ele teria de desenhar o alvo antes de atirar, e não depois. Analogamente, por que, então, não fazer o desenho de um estudo antes de coletar os dados? As duas situações estão sujeitas ao mesmo erro!

Vejamos, um exemplo (de uma situação comum e real): os cancer clusters. Pense em uma cidade com 100.000 habitantes cuja número de casos incidentes de leucemia é de 100 pessoas por ano. Você dividiu a cidade em quatro regiões (A, B, C e D) para poder documentar a incidência do câncer em cada uma delas.

Até o ano passado, as regiões costumavam ter casos distribuídos semelhantemente (A = 20, B = 20, C = 20, D = 20). Este ano, porém, houve uma diferença, na região A, apareceram 35 casos de leucemia. Na região B, permaneceu 20, na C, 5, na D, 20.

Houve um aumento inesperado de 15 casos na região A. Intuitivamente, nós começamos a procurar por algum fator causal. Mas ele realmente precisa existir? Não! Caso a divisão tenha sido de maneira aleatória, sem levar em consideração características do local ou dos habitantes para a realização da divisão, o que importa é a média geral, que permanece a mesma (100 casos/ano).

Para ficar mais fácil, considere outro exemplo. Imagine que um general quer saber os pontos em que mais caem bombas em uma determinada cidade. Abaixo, estão os registros das bombas na cidade deste mês.

Qual é a melhor maneira de analisar o local em que mais caem bombas? Quando fazemos essa análise a posteriori, podemos correr no risco de encontrar padrões, onde, verdadeiramente, não há. Por exemplo, poderíamos dividir o local de acordo com esse padrão:

Porém, essa divisão é arbitrária, dando a falsa ilusão de que sabemos quais são os lugares em que caem mais bombas. A verdade é que poderíamos dividir de outra maneira completamente diferente e chegar na mesma conclusão:

Portanto, qual das duas seria preferível? A resposta é: nenhuma das duas. O correto é fazer a divisão antes dos eventos ocorrerem para testar a hipótese. Perceba que o problema não está em como se faz a divisão, mas sim em ela ser feita após os dados terem sido coletados.

E esse, mais uma vez, é o problema da análise a priori.

Se você gostou desse post, não perca a próxima edição do curso de Leitura Crítica de Ensaios Clínicos Randomizamos da EBM Academy, com início dia 18 de maio de 2021.