Regra empírica

Você sabe o que é Regra Empírica (também chamada de regra 68-95-99)? Neste artigo eu vou te ensinar o que é e como fazer.

A Regra empírica é representada pelo gráfico abaixo.

regra empírica

O que significa o gráfico da Regra Empírica?

Este gráfico facilita a compreensão rápida de alguns dados estatísticos conforme veremos a seguir.

A regra dos 68%

Quando você tem uma distribuição normal e você tem uma média e o seu desvio padrão, 68% dos seus dados estão concentrados entre -1 e +1 desvio padrão (representado por σ – para entender mais sobre a representação de parâmetros clique aqui).

Na distribuição normal (que é essa distribuição em formato de sino) você tem uma média, que fica no meio do gráfico e o primeiro ponto ao lado esquerdo é o -1 desvio padrão (σ) e o primeiro ponto ao lado direito é o +1 desvio padrão (σ).

No caso, 68% dos seus dados estão concentrados no intervalo “média – o desvio padrão” (μ – σ) e “média + o desvio padrão” (μ + σ).

Como a média está no meio, significa que do lado esquerdo tem 34% e do lado direito também. A curva normal é simétrica ao redor da média, então tudo o que acontece de um lado acontece também do outro.

A regra dos 95%

Esta regra indica que 95% dos seus dados estão concentrados entre dois desvios padrão, que seria a média menos 2 vezes o desvio padrão (μ – 2σ) e a média mais duas vezes o desvio padrão (μ + 2σ).

A regra dos 99%

Aqui você entende que 99,7% dos dados estão concentrados entre três desvios padrão. Ou seja, entre (μ – 3σ) e (μ + 3σ).

Essa é a regra geral para uma curva normal.

Diferenças na Regra Empírica

Mas se você estiver pensando na curva de distribuição normal padronizada você vai ter no meio (a média) zero e o seu desvio padrão é igual a 1.

Então, como vimos, na figura abaixo você tem à direita do zero, 1, 2 e 3 e à esquerda do zero -1, -2 e -3.

regra empírica

Para a distribuição normal padronizada você sabe que 99,7% dos casos vão estar entre -3 e 3.

Esses números abaixo da linha horizontal seriam os seus “z-score”.

Até se você for analisar uma tabela do z você vai ver que quase todos os números estão entre -3 e 3. 99,7% deles estão concentrados neste intervalo.

Como você monta isso?

1) Calcule a média μ e o desvio padrão σ dos seus dados.

2) Desenhe a curva normal e no meio dela faça um risco que representa a média μ.

3) Então você faz dois riscos ao lado direito e dois ao lado esquerdo da média:

a) Ao lado direito, o primeiro representa a média + o desvio padrão (μ + σ)

Exemplo: minha média é 10 e o desvio padrão é 2. Então no risco do meio estará o 10, no primeiro à direita estará o 10 +12 = 12, no segundo (10+2×2) ficará 14 e no terceiro (10+3×2) você terá 16.

b) E à esquerda a mesma coisa, mas ao invés de somar você vai subtrair. Assim, no primeiro risco à esquerda estará o 10 – 2 = 8, no segundo 6 e no terceiro 4.

Seus dados estarão distribuídos nessa curva

Pela regra empírica, 68% dos seus dados estarão entre os valores 8 e 12, 95% entre 6 e 14 e 99,7% entre 4 e 16.

Se eu falar para você: “eu colhi alguns dados e eles seguem a distribuição normal, eu tenho a média 10 e o desvio padrão 2.” Eu não preciso falar nada sobre meus dados. Você já sabe que 99,7% dos meus dados – quase todos – estão entre 4 e 16. Interessante, né?

Já conhecia essa regra? Comente aqui abaixo o que achou.

Prof. Fernanda Maciel

Prof. Fernanda Maciel

Professora de Business Analytics na California State University

Inscreva-se na lista de e-mails da Prof. Fernanda Maciel e receba os próximos textos do blog.

© 2021 Prof. Fernanda Maciel

contato@proffernandamaciel.com