Teorema Central do Limite

Acompanhe o texto a seguir para conhecer o Teorema Central do Limite (TCL) e entender sua importância para a análise estatística!

Porém, antes de abordar o Teorema em si, é necessário entender o que é uma distribuição amostral.

Definição de uma distribuição amostral

Sabemos que geralmente não temos acesso à população de interesse que estamos estudando e por isso, utilizamos amostras.

Ao retirar amostras com reposição, muito provavelmente elas irão ser diferentes entre si, em maior ou menor magnitude. Assim, se tivermos 5 amostras (de mesmo tamanho), cada uma terá a sua própria média, chamada de média amostral

Nesse exemplo, teremos então um conjunto de 5 médias amostrais, como mostrado na figura abaixo, em que o retângulo representa a população, e os círculos as amostras:       

Teorema Central do Limite | Blog da Prof. Fernanda Maciel
População, amostras e médias amostrais

Ao repetir o processo de amostragem várias vezes, poderemos agrupar todas as médias amostrais possíveis em uma distribuição de probabilidade ou de frequência:

Teorema Central do Limite | Blog da Prof. Fernanda Maciel
Distribuição amostral das médias

O gráfico acima é  chamado de distribuição amostral das médias e terá o formato de uma curva normal se certas condições forem verdadeiras como veremos mais adiante.

Tal como qualquer distribuição, podemos calcular a sua média e o desvio-padrão:

  • A média da distribuição amostral das médias  (μx̅), será sempre a verdadeira média da população (μ);
  • E o seu desvio-padrão (conhecido como erro padrão ) será o desvio padrão populacional (σ)  dividido pela raiz quadrada do tamanho da amostra (n).

Lembre-se que: a distribuição amostral será obtida sempre a partir de uma  estatística da amostra, como a média, a proporção e a variância.

O que diz o Teorema Central do Limite (TCL) ?

Agora que estamos familiarizados com o conceito de distribuição amostral, podemos abordar o TCL. O uso do Teorema dependerá de como é a forma da distribuição populacional dos nossos dados. Nesse caso há duas situações possíveis:

a) A população é normalmente distribuída

Imagine que estamos analisando variáveis cuja população já é conhecida por ter uma  distribuição normal, como altura, peso, frequência cardíaca, etc.     

Nesse caso, vamos observar que depois de fazer a amostragem com reposição, a distribuição amostral das médias obtida também será normal. E isso não é uma coincidência! Sempre que a população for normal, a distribuição das médias também será normalmente distribuída, independentemente do tamanho da amostra.      

 Esse cenário é o ‘melhor’ que podemos encontrar e nesse caso o Teorema Central do Limite não é necessário.

Teorema Central do Limite | Blog da Prof. Fernanda Maciel
Distribuição das médias amostrais quando a população é normal

b) A população não é normalmente distribuída ou não sei como é a distribuição populacional

É muito comum, porém, que sequer saibamos qual é a forma da distribuição populacional que estamos lidando ou que os dados não são normalmente distribuídos. Então é aqui que o Teorema Central do Limite se aplica! 

O Teorema nos explica que se a distribuição da população de origem for desconhecida ou assimétrica, uniforme, etc, ao retirarmos amostras suficientemente grandes – acima de 30 elementos : n >=30 –  a distribuição amostral das médias será aproximadamente normal. 

Assim, podemos dizer que o Teorema “funciona” em geral, se tivermos amostras de tamanho mínimo igual a  30 elementos. Entretanto, vale mencionar que em alguns casos, esse número pode ser diferente dependendo da forma da distribuição populacional que estamos lidando. 

Por exemplo:

  • Em distribuições em que  quase não há outliers (de cauda ‘leve’), amostras com 20 elementos já podem ser o suficiente para que o Teorema seja observado;
  • De forma contrária, em distribuição de cauda ‘pesada’, isto é, com muitos valores atípicos (grande assimetria), amostras com 100 elementos podem ser necessárias para que o Teorema comece a ser observado. 
Teorema Central do Limite | Blog da Prof. Fernanda Maciel
Distribuição amostral das médias quando a população não é normal ou é desconhecida

De forma geral, quanto maior for a amostra, mais próxima da normal a distribuição amostral das médias será.

 

No esquema abaixo, na primeira imagem temos uma distribuição populacional assimétrica à direita. Suponha que inicialmente foram retiradas 5.000 amostras, cada uma com 5 elementos. Em seguida foram calculadas as médias e como resultado, obtemos uma distribuição amostral das médias ainda ligeiramente assimétrica.

 

Mas se retirássemos as mesmas 5.000 amostras, porém cada qual com 30 elementos, percebemos que a distribuição das médias se torna perfeitamente simétrica e normal. E se retirássemos 5.000 amostras, cada qual com 100 elementos, a distribuição das médias é normal e ainda menos dispersa (mais concentrada em torno da média).

 

Teorema Central do Limite | Blog da Prof. Fernanda Maciel
Amostras maiores se aproximam mais da distribuição normal

Se quiser fazer suas propróprias simulações e visualizar o TCL para diferentes distribuições populacionais, acesse sites como Seeing Theory e Stat Crunch .

Entendi o que é o TCL. Mas qual a sua importância?

Ao utilizarmos amostras, nosso objetivo final é fazer inferências a respeito dos reais parâmetros da população. Para isso, usamos ferramentas como intervalos de confiança e teste de hipóteses que partem da suposição da normalidade dos dados.

 

Desse modo, mesmo que os nossos dados sejam de uma população com distribuição desconhecida ou que não seja normalmente distribuída, ainda assim poderemos fazer tais análises uma vez que o Teorema Central do Limite é verdadeiro.

 

Gostou do post de hoje? Deixe um comentário ou sugestão!

 

No Curso de Estatística: Introdução à Estatística Aplicada, a Profª Fernanda Maciel ensina como aplicar estatística com autonomia e ser um profissional mais qualificado. Caso queira saber os detalhes do conteúdo do curso, basta clicar aqui.

Referências

FIELD, Andy. Discovering Statistics Using IBM SPSS Statistics. 5.ed. SAGE Publications, 2017.

JAWLIK, Andrew. Statistics from A to Z: confusing concepts clarified. 1.ed. Wiley, 2016.

 LARSON, Ron; FARBER, Betsy. Estatística Aplicada. 6.ed. São Paulo: Pearson Education do Brasil, 2015.

TRIOLA, M. F. Introdução à Estatística. 12. ed. Rio de Janeiro, LTC, 2017.

Aline Ester Gomes

TUTORA NO CURSO DE ESTATÍSTICA DA PROF. FERNANDA MACIEL | ECONOMISTA PELA PUC-MG

Pesquise o assunto desejado em estatística no campo abaixo
Prof. Fernanda Maciel

Prof. Fernanda Maciel

Professora de Business Analytics na California State University

Inscreva-se na lista de e-mails da Prof. Fernanda Maciel e receba os próximos textos do blog.

Leia também:

© 2021 Prof. Fernanda Maciel

contato@proffernandamaciel.com