Acompanhe o texto a seguir para conhecer o Teorema Central do Limite (TCL) e entender sua importância para a análise estatística!
Porém, antes de abordar o Teorema em si, é necessário entender o que é uma distribuição amostral.
Sabemos que geralmente não temos acesso à população de interesse que estamos estudando e por isso, utilizamos amostras.
Ao retirar amostras com reposição, muito provavelmente elas irão ser diferentes entre si, em maior ou menor magnitude. Assim, se tivermos 5 amostras (de mesmo tamanho), cada uma terá a sua própria média, chamada de média amostral.
Nesse exemplo, teremos então um conjunto de 5 médias amostrais, como mostrado na figura abaixo, em que o retângulo representa a população, e os círculos as amostras:
Ao repetir o processo de amostragem várias vezes, poderemos agrupar todas as médias amostrais possíveis em uma distribuição de probabilidade ou de frequência:
O gráfico acima é chamado de distribuição amostral das médias e terá o formato de uma curva normal se certas condições forem verdadeiras como veremos mais adiante.
Tal como qualquer distribuição, podemos calcular a sua média e o desvio-padrão:
Lembre-se que: a distribuição amostral será obtida sempre a partir de uma estatística da amostra, como a média, a proporção e a variância.
Agora que estamos familiarizados com o conceito de distribuição amostral, podemos abordar o TCL. O uso do Teorema dependerá de como é a forma da distribuição populacional dos nossos dados. Nesse caso há duas situações possíveis:
Imagine que estamos analisando variáveis cuja população já é conhecida por ter uma distribuição normal, como altura, peso, frequência cardíaca, etc.
Nesse caso, vamos observar que depois de fazer a amostragem com reposição, a distribuição amostral das médias obtida também será normal. E isso não é uma coincidência! Sempre que a população for normal, a distribuição das médias também será normalmente distribuída, independentemente do tamanho da amostra.
Esse cenário é o ‘melhor’ que podemos encontrar e nesse caso o Teorema Central do Limite não é necessário.
É muito comum, porém, que sequer saibamos qual é a forma da distribuição populacional que estamos lidando ou que os dados não são normalmente distribuídos. Então é aqui que o Teorema Central do Limite se aplica!
O Teorema nos explica que se a distribuição da população de origem for desconhecida ou assimétrica, uniforme, etc, ao retirarmos amostras suficientemente grandes – acima de 30 elementos : n >=30 – a distribuição amostral das médias será aproximadamente normal.
Assim, podemos dizer que o Teorema “funciona” em geral, se tivermos amostras de tamanho mínimo igual a 30 elementos. Entretanto, vale mencionar que em alguns casos, esse número pode ser diferente dependendo da forma da distribuição populacional que estamos lidando.
Por exemplo:
De forma geral, quanto maior for a amostra, mais próxima da normal a distribuição amostral das médias será.
No esquema abaixo, na primeira imagem temos uma distribuição populacional assimétrica à direita. Suponha que inicialmente foram retiradas 5.000 amostras, cada uma com 5 elementos. Em seguida foram calculadas as médias e como resultado, obtemos uma distribuição amostral das médias ainda ligeiramente assimétrica.
Mas se retirássemos as mesmas 5.000 amostras, porém cada qual com 30 elementos, percebemos que a distribuição das médias se torna perfeitamente simétrica e normal. E se retirássemos 5.000 amostras, cada qual com 100 elementos, a distribuição das médias é normal e ainda menos dispersa (mais concentrada em torno da média).
Se quiser fazer suas propróprias simulações e visualizar o TCL para diferentes distribuições populacionais, acesse sites como Seeing Theory e Stat Crunch .
Ao utilizarmos amostras, nosso objetivo final é fazer inferências a respeito dos reais parâmetros da população. Para isso, usamos ferramentas como intervalos de confiança e teste de hipóteses que partem da suposição da normalidade dos dados.
Desse modo, mesmo que os nossos dados sejam de uma população com distribuição desconhecida ou que não seja normalmente distribuída, ainda assim poderemos fazer tais análises uma vez que o Teorema Central do Limite é verdadeiro.
Gostou do post de hoje? Deixe um comentário ou sugestão!
No Curso de Estatística: Introdução à Estatística Aplicada, a Profª Fernanda Maciel ensina como aplicar estatística com autonomia e ser um profissional mais qualificado. Caso queira saber os detalhes do conteúdo do curso, basta clicar aqui.
FIELD, Andy. Discovering Statistics Using IBM SPSS Statistics. 5.ed. SAGE Publications, 2017.
JAWLIK, Andrew. Statistics from A to Z: confusing concepts clarified. 1.ed. Wiley, 2016.
LARSON, Ron; FARBER, Betsy. Estatística Aplicada. 6.ed. São Paulo: Pearson Education do Brasil, 2015.
TRIOLA, M. F. Introdução à Estatística. 12. ed. Rio de Janeiro, LTC, 2017.
© 2021 Prof. Fernanda Maciel
contato@proffernandamaciel.com