“PENSAM QUE ME CONHECEM” – P, VALOR

EBM Academy
17 de jul. de 2019
5 min de leitura

Se você acredita que p > 0,05 invalida o resultado do estudo, contaremos uma novidade a você.

Com o avanço da pesquisa clínica e com a propagação de conceitos de Epidemiologia que embasam a interpretação dos resultados de estudos modificadores de conduta, surgiu um questionamento fundamental: é possível confiar nesses resultados? Para responder a essa questão, princípios matemáticos e estatísticos – como intervalo de confiança, hipótese nula, valor P, entre outros – começaram a ser aplicados aos estudos da área biomédica, buscando proporcionar maior consistência na apresentação dos achados de pesquisa.

Ao longo dos últimos 25 anos, a apresentação do valor P nos abstracts aumentou substancialmente: em 1990, ele apareceu 7,3% dos trabalhos na MEDLINE; em 2014, 15,6%. Entre os abstracts e os textos completos que apresentavam o valor P, 96% apresentavam pelo menos um valor “estatisticamente significativo” – quando o valor P é inferior a 5%.

Vamos partir do básico. O que é o valor P? Muitas definições são encontradas e reproduzidas, especialmente durante discussões de artigos. Mas será que estão todas corretas? Será que estão todas erradas ou imprecisas? Vamos ao trabalho para responder a essas questões.

Talvez a definição mais ouvida de valor P seja “a probabilidade de a hipótese nula ser verdadeira”. Outra bastante difundida – e muito simplória – é “a probabilidade do acaso”. Entretanto, a definição mais precisa do valor P é um pouco mais robusta (após a definição, a tradução): o valor P calcula a probabilidade de os dados da população serem diferentes dos dados observados (amostra) caso a hipótese nula seja verdadeira. Por exemplo, em um teste t (comparação de médias), calcula-se um valor “t” observado (obtido a partir da amostra) e compara-se com o valor t esperado (em uma população ideal) quando as duas médias populacionais são iguais. O valor P calculará a probabilidade do “t” calculado ser maior ou menor que o valor “t” esperado. Caso essa probabilidade seja pequena, presume-se que ou “o modelo estatístico está errado”, ou “a hipótese está errada”. Como normalmente tomamos o teste estatístico como uma certeza (estamos fazendo o teste certo para os dados certos), rejeitamos a hipótese de nulidade na população. Outra maneira de explicar seria a definição de Fisher (um dos mais brilhantes estatísticos do século passado e responsável pela popularização de conceitos estatísticos na literatura científica): é a probabilidade da ocorrência do resultado observado, acrescido dos valores mais extremos – os intervalos de confiança -, se a hipótese nula for verdadeira na população. Note que nesse conceito trabalhamos sempre com probabilidades e hipóteses. Dito de outra maneira, o valor P não nos dá certeza de nada, como ouvimos em diversas ocasiões.

Existem três pressupostos que devem ser atendidos quando se deseja utilizar o valor P como auxílio na interpretação de resultados:

Não há confundidores entre o fator causal que está sendo investigado e o desfecho de interesse;

O desenho do estudo é completamente livre de erros sistemáticos;

O teste estatístico adequado é selecionado para a análise.

(Você deve ter notado que em diversas vezes essas condições não são atendidas por completo, seja pela presença de fatores de confusão, seja pela impossibilidade de controle de vieses. Mas nem sempre isso é um problema, já que pode fornecer uma aproximação do tamanho do efeito quando os resultados forem replicados em condições “não ideais” pois na vida real existem confundidores e vieses.)

Baseado na definição de Fisher, podemos inferir que um valor P excessivamente pequeno é uma forte evidência contra a hipótese nula. Façamos um passo-a-passo para compreender melhor: se o valor P é a probabilidade da ocorrência do resultado observado caso a hipótese nula seja verdadeira, e se o valor P é baixo (por exemplo, menor que 0,05), podemos dizer que a probabilidade de encontrar o resultado que de fato foi encontrado se a hipótese nula for verdadeira é baixa; portanto, se o resultado foi encontrado, é porque a hipótese nula é falsa.

Outros dois estatísticos, Neyman e Pearson, adicionaram à pesquisa o conceito de hipótese alternativa, que é mutuamente excludente à hipótese nula de acordo com um nível de significância pré-selecionado. Por convenção, p < 0,05 é estatisticamente significativo, podendo-se rejeitar a hipótese nula e aceitar a hipótese alternativa; se p > 0,05, aceita-se a hipótese nula e rejeita-se a hipótese alternativa. Aceitar ou rejeitar as hipóteses baseado em probabilidades nos leva a cometer erros. O primeiro é o erro tipo I, em que se rejeita a hipótese nula quando na realidade ela é verdadeira. O segundo é o erro tipo II, em que se aceita a hipótese nula quando na verdade ela é falsa.

Aos que não simpatizam com estatística, apresentamos outra definição de valor P: é a probabilidade de erro tipo I. Talvez não seja um conceito preciso como o de Fisher – e por isso criticado por estatísticos -, mas certamente auxilia no entendimento e na interpretação a partir do valor P.

A estatística inferencial (também conhecida como indução Bayesiana) é baseada na observação inicial de um desfecho e de uma exposição prévia que possa justificá-lo. Por exemplo, acredita-se que a substância X predisponha a formação de câncer de pâncreas, pois em uma região onde a exposição da população à substância X é alta, há mais casos de câncer de pâncreas. A partir disso, desenha-se um estudo para testar essa hipótese a partir dos dados coletados dessa população (ou de uma amostra representativa da população), podendo-se determinar se existe de fato uma associação, se ela é causal e se apresenta significância estatística. O método Bayesiano, entretanto, não consegue quantificar o tamanho de efeito, sendo esta sua principal limitação. Ele é válido na elaboração de uma questão de pesquisa, mas a resposta (definitiva ou não) que buscamos será obtida apenas quando a hipótese for testada de forma estatística.

O valor P é essencialmente um conceito estatístico utilizado na interpretação de resultados. Ele não é capaz de estabelecer relação de causa-e-efeito entre dois fenômenos. O valor P pode – e deve – ser explorado no sentido de auxiliar na explicação de uma teoria levando em consideração os erros aleatórios, os quais podem ser apenas estimados probabilisticamente, com algum grau de incerteza. A crescente utilização do valor P e a sua superestimação o fazem uma ferramenta perigosa, especialmente para aqueles que não compreendem bem o seu conceito e não o analisam criticamente. Imagine um medicamento novo que apresenta risco relativo de 0.7 para mortalidade geral quando comparado com o medicamento utilizado no tratamento padrão para uma determinada doença, com intervalo de confiança de 95% variando de 0.6-0.8 e p = 0,051. O leitor mais desavisado observa o valor p acima de 5% e automaticamente passa a desprezar os resultados encontrados. Mas não esqueça que estamos falando do desfecho mais dramático que uma pessoa pode apresentar. Além disso, devemos analisar a relevância clínica de acordo com o intervalo de confiança no pior cenário (nesse caso, redução de 20% na mortalidade geral comparado ao tratamento padrão). Mas e qual o risco de mortalidade com o tratamento atual? Qual a redução absoluta de risco de mortalidade com o medicamento novo? Observe que o valor P sem significância estatística pode ser um mero detalhe quando analisamos outras variáveis que são tão ou mais relevantes que ele.

Não superestime o valor P – mas também não o subestime. Compreenda-o e não caia nas suas armadilhas para que você possa usá-lo a seu favor. De forma alguma incentivamos o desprezo pelo valor P; o que propusemos aqui foi a análise crítica dos diversos conceitos que são empregados nos estudos. E nunca esqueça: estamos trabalhando com probabilidades, e os pontos de corte para atingir a significância estatística são arbitrários.

Texto escrito por Guilherme Camargo Winckler e Lucas Primo de Carvalho Alves

Como citar esse texto: Winckler GC, Alves LPC. “Pensam que me conhecem” – P, valor. Junho de 2017 In: https://ebmacademy.wordpress.com/

“PENSAM QUE ME CONHECEM” – P, VALOR

Posts recentes

Comentários