O que é o p-valor?

Você já ouviu falar em teste de hipóteses? Em p-valor? Nível de significância? Se você gostaria de entender melhor esses termos com exemplos, esse texto é para você.

Entendendo o p-valor

Vamos supor que eu ganhei um baú cheio de moedas. Mas eu desconfio se elas são moedas “de verdade” ou se são moedas “viciadas” (moedas de mágico ou moedas que tendem a cair mais um lado do que o outro).

Para testar, eu jogo uma moeda na mesa algumas vezes e observo se cai cara ou coroa normalmente como uma moeda normal.

Primeira jogada: coroa
Segunda: coroa também
Terceira: novamente coroa
Quarta jogada: adivinha, coroa!
Quinta: caiu coroa de novo

Como entender o P-valor, aprender teste de hipóteses e erro tipo I e tipo II

Suspeito de que se trata de uma moeda viciada. Esta é uma hipótese.

Podemos ver a probabilidade estatística da minha hipótese ser verdadeira. Vamos fazer um Teste de Hipóteses.

Qual é a probabilidade de jogar 5 vezes uma moeda e nas 5 vezes dar coroa?

A probabilidade de jogar moeda uma vez e dar coroa é 50%.
Ao jogar a moeda duas vezes, dar coroa duas vezes seria 25%.
Joga a moeda 3a vez: coroa – 12,5%
– 4a vez: 6,25%.
– 5a vez: 3,125%

Esses 3,125% é uma chance bem pequena de acontecer. Mas, é possível.

Como é uma probabilidade muito pequena eu poderia concluir que essa moeda é viciada.

Essa probabilidade é o p-valor e eu acabei de fazer um teste de hipóteses.

Após visualizarmos o exemplo, vamos definir:

Quais são os passos do teste de hipóteses?

1) O primeiro é você definir as suas hipóteses.

No exemplo acima, existe a hipótese nula de que a moeda é honesta, é uma moeda normal.
A hipótese alternativa é que é uma moeda não honesta, portanto é uma moeda viciada.

2) O segundo passo do teste de hipóteses é selecionar um limite de erro. É o alfa. É o nível de significância.

É preciso definir qual é o percentual limite da sua desconfiança.
Um valor muito usado para alfa é de 5%. Por exemplo, em um resultado mais robusto, mais “exigente”, o nível de significância pode ser de 1%. Ou no caso de um resultado mais flexível pode ser usado, por exemplo, um nível de significância de 10%.

Não existe uma regra.

No caso das moedas que ganhei, eu posso aceitar, por exemplo, uma probabilidade – um alfa (nível de significância) – acima de 5%. Assim, qualquer valor abaixo de 5% é muito pequeno para que eu concorde com a hipótese nula.

3) O terceiro passo do teste de hipóteses é tirar a amostra e fazer o teste. Foi o que eu fiz ao abrir o baú e jogar uma moeda.

4) O quarto passo é concluir baseado nas evidências da minha amostra.

Porém…

Na estatística quando a gente toma decisões há sempre uma chance de erro.
Se a sua probabilidade é muito pequena, é inferior ao alfa – como o caso da moeda -, você acaba rejeitando a hipótese nula. E essa é a conclusão quando o p-valor é menor que o alfa.

Voltando ao exemplo:

Se a hipótese nula é que esta é uma moeda honesta, então quando eu rejeito esta hipótese, eu concluo que a moeda é uma moeda viciada.
É importante destacar que eu posso estar cometendo um erro. Porque 3,125%, apesar de ser uma probabilidade pequena, é uma probabilidade possível.
É preciso estar ciente, quando se faz testes e se usa a estatística, de que há chances de erros.

Tipos de erros

No caso de teste de hipóteses, o erro de rejeitar a hipótese nula quando ela é verdadeira é o Erro Tipo I.
Então, se eu estou dizendo que a moeda é viciada, mas na verdade ela é, eu estou cometendo um Erro Tipo I.

Se, ao contrário, eu afirmo que a hipótese nula é verdadeira quando ela é falsa, ou seja, eu digo que a moeda é honesta mas é viciada, eu estou cometendo o Erro Tipo II .

Conclusão

O p-valor é uma probabilidade com valor entre 0 e 1, ou entre 0 e 100% .

O p-valor é a probabilidade de que a estatística do teste tenha um valor extremo em relação ao valor observado quando a hipótese nula é verdadeira.

No exemplo da moeda, se a hipótese nula é verdadeira (a moeda é normal) o que eu espero daquela moeda é que ao jogar a moeda para cima eu tenho 50% de chance de sair cara e 50% de sair coroa. Então se eu for jogar moeda cinco vezes é esperado que a metade dessas vezes caia coroa. E não todas as cinco vezes.

O valor de 3,125% é considerado um valor extremo, o que está longe do que eu normalmente esperaria em uma moeda honesta ao jogá-la 5 vezes.

Essa explicação te ajudou a esclarecer suas dúvidas sobre o p-valor? Deixe seu comentário aqui abaixo.

Prof. Fernanda Maciel

Prof. Fernanda Maciel

Professora de Business Analytics na California State University

Inscreva-se na lista de e-mails da Prof. Fernanda Maciel e receba os próximos textos do blog.

© 2021 Prof. Fernanda Maciel

contato@proffernandamaciel.com