Introdução ao Intervalo de Confiança

Vamos entender algumas ideias a respeito de um grande aliado da inferência estatística: o intervalo de confiança! 

 

O que é um intervalo de confiança?

Intervalo de Confiança (I.C) é uma estimativa intervalar de uma característica (parâmetro) da população de interesse. Esse parâmetro normalmente é a média, a proporção ou variância (desvio padrão).

Normalmente, você verá o  I.C sendo descrito da seguinte maneira: “com 95% de confiança, podemos afirmar que entre  63% e 68% dos brasileiros gostam de futebol” (dados fictícios).

Por que precisamos do I.C?

Há uma limitação comum na pesquisa estatística: não temos como coletar dados de toda uma população na maioria das vezes. Mas por que? Imagine que para obter a  média dos brasileiros para qualquer informação, seria necessário entrevistar mais de 200 milhões de pessoas, o que seria muito trabalhoso e caro! (Não é à toa que o Censo é feito a cada 10 anos, não é mesmo?).

Então o que fazemos para resolver esse desafio é entrar em contato com uma pequena parte da população chamada amostra. Em seguida, podemos calcular as estatísticas da amostra,, como a média ( x̅). Então usaremos esse valor pontual para estimar a verdadeira média da população.

Porém, não podemos afirmar  que esse valor único seja de fato a média populacional porque foi calculado a partir de uma única amostra. Se o processo de amostragem foi feito corretamente podemos afirmar apenas  que a média amostral é uma boa estimativa, uma boa aproximação do valor populacional.

Dessa forma, precisamos somar e subtrair  uma margem de erro, que representa a lacuna que naturalmente existirá entre a estatística amostral e o parâmetro da população. É assim que chegamos aos intervalos de confiança! 

Do que é feito um intervalo de confiança?

De modo geral, todo intervalo de confiança é formado a partir das seguintes partes:

Introdução ao Intervalo de confiança | Blog da Prof. Fernanda Maciel
'Fórmula' geral de um I.C

 

  • Estimativa do parâmetro: é a o valor da média ou proporção obtida a partir de uma amostra (denominado estimativa pontual);
  • Margem de erro: é a junção entre a confiança desejada e a acurácia da amostra (erro padrão);
  • Confiança desejada : é a confiança de que detectamos o parâmetro populacional no intervalo gerado. Normalmente utiliza-se  90%, 95% ou 99% de confiança. Mas o que isso significa, na prática? Que se temos um intervalo com 95% de confiança, em 95% das vezes que a pesquisa for repetida, o parâmetro da população (média, proporção) estará no intervaloTodo nível de confiança está associado com um valor (score) na distribuição normal padrão (ou t de student). Quando sabemos que a população é normalmente distribuída ou temos amostras suficientemente grandes (pelo Teorema Central do Limite, n => 30), usaremos o z escore da distribuição normal.                                   O z escore nos diz quantos desvios padrão devem ser adicionados ou subtraídos para se calcular o nível de confiança:
Introdução ao Intervalo de confiança | Blog da Prof. Fernanda Maciel
Níveis de confiança e Z scores associados
  • Erro padrão:  obtido pelo desvio padrão da população (σ) dividido pelo tamanho da amostra (n). Quando o desvio padrão da população é desconhecido usamos o desvio padrão da amostra (s).

Trade off entre nível de confiança e precisão do I.C

Ao utilizar intervalos de confiança estamos preocupados com dois aspectos:

  • o nível de confiança, isto é, a capacidade do intervalo de conter o parâmetro populacional;
  • a precisão, isto é, a amplitude dos intervalos (normalmente queremos intervalos pequenos).

Porém, há um trade off, isto é,  normalmente temos que escolher priorizar um dos dois. Vamos entender melhor isso a partir de simulações feitas no site Seeing Theory

a) Efeito do nível de confiança no I.C

 Para uma distribuição normal e  mantendo o tamanho da amostra constante (n = 5), começamos a simulação com 80% de confiança e percebemos que os intervalos são pequenos (isto é, temos maior precisão), porém sabemos que o verdadeiro valor da média estará contido em apenas 80 vezes que a pesquisa for repetida. 

Fazendo uma analogia com o jogo de dardos, com 80% de confiança, acertaríamos o alvo menos vezes, apenas em 80% das tentativas, mas quando conseguíssemos, estaríamos mais perto do alvo (isto é, da média) e portanto, dizemos que a precisão é maior.

E o que acontence quando aumentamos o nível de confiança para 99%!?  O tamanho dos intervalos aumentou consideravelmente, isto é, a precisão diminui, porém, podemos ter certeza de que em 99 das vezes que a pesquisa for repetida, o intervalo conterá o  verdadeiro valor da média. Continuando com a analogia, seria como se conseguíssemos acertar o alvo em 99% das tentativas, porém, dificilmente seria exatamente no centro do alvo.

Usualmente, os níveis de confiança mais utilizados são 90%, 95% e 99%, justamente porque tentamos equilibrar a precisão e a confiança dos resultados. Para trabalhar com um nível de 99% de confiança e não perder precisão, seria necessário aumentar o tamanho da amostra, o que nem sempre é possível.

Em síntese, quanto maior a confiança desejada, maior será o intervalo onde o parâmetro da população estará contido. (são diretamente proporcionais).

b) Efeito do tamanho da amostra no I.C

Na simulação seguinte, mantivemos constante o nível de confiança em 95% e em seguida verificamos como o intervalo se altera com tamanhos de amostras diferentes. Inicialmente, começamos com amostras bem pequenas, de 5 elementos, e percebemos que a amplitude dos intervalos é grande, ou seja, temos menos precisão. Mas se aumentarmos  o tamanho amostral para 30 elementos, percebemos que os intervalos diminuíram muito em tamanho, isto é, com mais dados, a nossa precisão aumenta, mantendo o mesmo nível de confiança.

Em síntese, quanto maior o tamanho da amostra (n), menor o erro padrão  (pois temos mais dados e menos incerteza). Assim, os intervalos serão mais precisos, e portanto, menores.

 

Gostou do post de hoje?  Deixe seu comentário, dúvida ou sugestão! 

E para continuar estudando esse assunto acesse o nosso canal do Youtube e veja como calcular um I.C para:

No Curso de Estatística: Introdução à Estatística Aplicada, a Profª Fernanda Maciel ensina como aplicar estatística com autonomia e ser um profissional mais qualificado. Caso queira saber os detalhes do conteúdo do curso, basta clicar aqui.

Referências

JAWLIK, Andrew. Statistics from A to Z: confusing concepts clarified. 1.ed. Wiley, 2016.

LARSON, Ron; FARBER, Betsy. Estatística Aplicada. 6.ed. São Paulo: Pearson Education do Brasil, 2015.

ALINE ESTER GOMES

ALINE ESTER GOMES

TUTORA NO CURSO DE ESTATÍSTICA DA PROF. FERNANDA MACIEL | ECONOMISTA PELA PUC-MG

Pesquise o assunto desejado em estatística no campo abaixo
Prof. Fernanda Maciel

Prof. Fernanda Maciel

Professora de Business Analytics na California State University

Inscreva-se na lista de e-mails da Prof. Fernanda Maciel e receba os próximos textos do blog.

Leia também:

© 2021 Prof. Fernanda Maciel

contato@proffernandamaciel.com