Dizemos que é uma distribuição normal se puder ser descrita pela função (considerando um conjunto de dados que possui média μ e desvio-padrão σ):
Figura 1. Formula da função de probabilidade da distribuição normal
Calma, fique tranquilo! A função anterior, por conta da sua complexidade, não precisará ser utilizada em nenhum momento ao longo do texto. No lugar dela, utilizaremos uma tabela com valores previamente calculados e que garantem toda a ferramenta necessária para o estudo das distribuições normais.
Figura 2. Tabela função normal
Uma vez fixados os parâmetros μ e σ, a função anterior possui como gráfico a curva a seguir.
Figura 3. Curva Normal de Gauss
A curva anterior, por conta do seu formato, é chamada de curva sino, curva normal ou curva de Gauss.
A principal propriedade da curva de Gauss é a sua simetria em torno da média μ.
Observe que a lei que define tal curva depende apenas da média e do desvio-padrão. Uma vez alterados esses parâmetros, a curva se altera, mas mantém a forma de sino. A figura a seguir ilustra esse fato.
Figura 4. Influência dos parâmetros nas curvas normais
Iniciaremos nosso estudo assumindo que a média e o desvio-padrão são constantes e iguais a 0 e 1, respectivamente. Nesse caso, chamamos a nossa distribuição de normal padrão. Na próxima seção, aprenderemos a trabalhar com parâmetros diferentes dos assumidos na distribuição-padrão (μ=0 e σ=1).
Uma distribuição normal padrão tem as propriedades a seguir.
– O desvio-padrão é igual a 1.
– O gráfico possui o formato de sino.
A área sob a curva normal é sempre igual a 1, o que garante a existência de uma correspondência entre tal área e a probabilidade. Dessa fórmula, para calcular alguma probabilidade em uma distribuição normal, calcularemos alguma área abaixo da curva normal.
Como a função que descreve a curva normal é extremamente complexa e o procedimento para determinação de áreas de regiões delimitadas por ela requer cálculos longos, utilizaremos a tabela que consta no início deste texto para determinar essas áreas procuradas.
Para usar a tabela, é muito importante que você se atente aos itens a seguir:
– A tabela só pode ser utilizada quando a distribuição for normal padrão (μ=0 e σ=1).
– A tabela é dividida em duas partes: uma para valores negativos e outra para valores positivos.
– Um z-score é um valor limitante da área, situado no eixo horizontal. Na tabela, ela corresponde à primeira coluna e primeira linha.
– Cada valor observado na tabela corresponde à área acumulada até o valor do z-score (área sempre à esquerda de z).
Por convenção, utilizaremos a variável z apenas quando a distribuição for padrão. Para casos gerais, utilizaremos a variável x.
Considere que a variável z possui distribuição normal com média μ=0 e desvio-padrão σ=1, ou seja, a distribuição é normal padrão. Qual a probabilidade de que z≤1,32?
Essa pergunta pode ser respondida com o valor da área indicada em azul na figura a seguir. Ou seja: a área abaixo da curva de normal para z≤1,32.
Figura 5. Probabilidade para z≤1,32
Para determinação desta área, vamos recorrer à tabela de z-scores. Procurando na primeira coluna o valor de 1,3 e na primeira linha o valor de 0,02, obtemos a área (probabilidade) igual a 0,9066. Ou seja: a probabilidade para que z≤1,32 é igual a 90,66%.
Nessa seção, discutiremos como calcular probabilidades para distribuições normais não padronizadas, ou seja, μ≠0 ou σ≠1.
Nos casos de distribuições não padronizadas, converteremos a variável da questão para escores z, utilizando a relação a seguir.
Figura 6. Formula da distribuição normal não padronizada
A figura a seguir ilustra a conversão que deve ser realizada. Nela você deve observar que a área procurada permanece a mesma, o que justifica a troca de variáveis.
Figura 7. Mudança da variável x para a variável z
Os dados de uma pesquisa mostram algumas informações sobre o tempo de cirurgias para recostrução do Ligamento Cruzado Anterior (um ligamento do joelho) em hospitais com alto volume de cirurgia. A partir dos dados foram calculados, o tempo médio de 129 minutos com um desvio padrão de 14 minutos.
1. Qual é a probabilidade de uma cirurgia do Ligamento Cruzado Anterior, em um hospital com alto volume de cirurgias, requerer um tempo maior do que dois desvios-padrão acima da média?
2. Qual é a probabilidade de uma cirurgia do Ligamento Cruzado Anterior, em um hospital com alto volume de cirurgias ser completada em menos de 100 minutos?
1. Qual é a probabilidade de uma cirurgia ACL, em um hospital com alto volume de cirurgias, requerer um tempo maior do que dois desvios-padrão acima da média? 1−P(Z<2)=1−ϕ(2)=0.0228
2. Qual é a probabilidade de uma cirurgia ACL, em um hospital com alto volume de cirurgias ser completada em menos de 100 minutos?
Seja X o tempo, onde X∼N(129,14)
Figura 8. Solução do exemplo
O Excel disponibiliza as funções para cálculos com a Distribuição Normal:
Função DIST.NORMP.N(z) , onde, z: valor da variável aleatória. Para um intervalo genérico P(a < z < b) , pode-se aplicar F(b) – F(a) diretamente:
P(a < z < b) = DIST.NORMP.N(b) – DIST.NORMP.N(a)
Vamos para alguns exemplos utilizando essa função:
a) Calcule P(z < 0,85) ► DIST.NORMP.N(0,85;1) ► = 0,8023 ( ou 80,23%).
b) Calcule P(0 < z < 1,25) ► DIST.NORMP.N(1,25;1)-DIST.NORMP.N(0;1) ► =
0,3944 (ou 39,44%).
c) Calcule P(z>2,39) ► 1-DIST.NORMP.N(2,39;1) ► = 0,0084 ou 0,84%.
d) Calcule P(-2,55 < z < 1,2) ► DIST.NORMP.N(1,2;1)-DIST.NORMP.N(-2,55;1)
► = 0,8795 ou 87,95%.
Também temos a função DIST.NORM.N( x ; média ; desv_padrão ; cumulativo),
X: valor da variável aleatória;
Média: média da variável aleatória X ;
Desv_padrão: desvio padrão da variável aleatória X ;
Cumulativo: um valor lógico que define o tipo de distribuição:
VERDADEIRO (1): retorna o valor da função de distribuição acumulada (FDA) F(x) = P( X < x ) e FALSO (0): retorna o valor da função densidade de probabilidade no ponto x: f(x)
Essa é a função mais completa para tratamento de distribuição normal. No caso de
média=0, desvio=1 e cumulativo=1(verdadeiro), esta função retorna o mesmo valor
da DIST.NORMP.N
Função INV.NORMP.N(probabilidade): Retorna o valor z da VA Normal Padrão, abaixo do qual se tem a probabilidade informada. É o inverso da função DIST.NORMP.N(z)
Exemplo do emprego da Função INV.NORMP.N (p):
Sendo, P(z < a) = 0,3015 ache “a” ► INV.NORMP.N(0,3015)► = -0,524401
Função INV.NORM.N( probabilidade ; média ; desv_padrão)
Como no caso acima, é o inverso da função geral DIST.NORM.N(), aplicável a
qualquer Variável aleatória Normal X, desde que conhecidos sua média e desvio padrão.
Função PADRONIZAR ( x ; média ; desv_padrão)
Retorna o desvio padrão normalizado z, considerando os argumentos x, média e desvio padrão, utilizando a fórmula já apresentada:
Exemplo do emprego da PADRONIZAR( x ; média ; desv_padrão):
A altura dos alunos de uma escola é normalmente distribuída com média 1,60 m e desvio
padrão 0,30 m. Calcule a probabilidade de um aluno medir entre 1,50 m e 1,80 m.
z1 = (1,50 – 1,60)/0,30 ► PADRONIZAR(1,5;1,6;0,3) ► = -0,33
z2 = (1,80 – 1,60)/0,30 ► PADRONIZAR(1,8;1,6;0,3) ► = 0,67
Logo: P(-0,33 < z < 0,67) ► DIST.NORMP.N(0,67;1)-DIST.NORMP.N(-0,33;1) ► = 0,3779
ou 37,79%
Você já usou a Distribuição Normal? Se sim, o que mediu? Deixe nos comentários abaixo.
DEVORE, J. L. Probabilidade e estatística para engenharia e ciências . São Paulo: Pioneira Thomson Learning, 2006.
MONTGOMERY, D. C.; RUNGER, G. C. Estatística aplicada e probabilidade para engenheiros . Rio de Janeiro: LTC, 2003.
TRIOLA, M. F. Introdução à Estatística : atualização da tecnologia, v. único. 11. ed. Rio de Janeiro: LTC, 2013.