Vamos entender algumas ideias a respeito de um grande aliado da inferência estatística: o intervalo de confiança!
Intervalo de Confiança (I.C) é uma estimativa intervalar de uma característica (parâmetro) da população de interesse. Esse parâmetro normalmente é a média, a proporção ou variância (desvio padrão).
Normalmente, você verá o I.C sendo descrito da seguinte maneira: “com 95% de confiança, podemos afirmar que entre 63% e 68% dos brasileiros gostam de futebol” (dados fictícios).
Há uma limitação comum na pesquisa estatística: não temos como coletar dados de toda uma população na maioria das vezes. Mas por que? Imagine que para obter a média dos brasileiros para qualquer informação, seria necessário entrevistar mais de 200 milhões de pessoas, o que seria muito trabalhoso e caro! (Não é à toa que o Censo é feito a cada 10 anos, não é mesmo?).
Então o que fazemos para resolver esse desafio é entrar em contato com uma pequena parte da população chamada amostra. Em seguida, podemos calcular as estatísticas da amostra,, como a média ( x̅). Então usaremos esse valor pontual para estimar a verdadeira média da população.
Porém, não podemos afirmar que esse valor único seja de fato a média populacional porque foi calculado a partir de uma única amostra. Se o processo de amostragem foi feito corretamente podemos afirmar apenas que a média amostral é uma boa estimativa, uma boa aproximação do valor populacional.
Dessa forma, precisamos somar e subtrair uma margem de erro, que representa a lacuna que naturalmente existirá entre a estatística amostral e o parâmetro da população. É assim que chegamos aos intervalos de confiança!
De modo geral, todo intervalo de confiança é formado a partir das seguintes partes:
Ao utilizar intervalos de confiança estamos preocupados com dois aspectos:
Porém, há um trade off, isto é, normalmente temos que escolher priorizar um dos dois. Vamos entender melhor isso a partir de simulações feitas no site Seeing Theory:
Para uma distribuição normal e mantendo o tamanho da amostra constante (n = 5), começamos a simulação com 80% de confiança e percebemos que os intervalos são pequenos (isto é, temos maior precisão), porém sabemos que o verdadeiro valor da média estará contido em apenas 80 vezes que a pesquisa for repetida.
Fazendo uma analogia com o jogo de dardos, com 80% de confiança, acertaríamos o alvo menos vezes, apenas em 80% das tentativas, mas quando conseguíssemos, estaríamos mais perto do alvo (isto é, da média) e portanto, dizemos que a precisão é maior.
E o que acontence quando aumentamos o nível de confiança para 99%!? O tamanho dos intervalos aumentou consideravelmente, isto é, a precisão diminui, porém, podemos ter certeza de que em 99 das vezes que a pesquisa for repetida, o intervalo conterá o verdadeiro valor da média. Continuando com a analogia, seria como se conseguíssemos acertar o alvo em 99% das tentativas, porém, dificilmente seria exatamente no centro do alvo.
Usualmente, os níveis de confiança mais utilizados são 90%, 95% e 99%, justamente porque tentamos equilibrar a precisão e a confiança dos resultados. Para trabalhar com um nível de 99% de confiança e não perder precisão, seria necessário aumentar o tamanho da amostra, o que nem sempre é possível.
Em síntese, quanto maior a confiança desejada, maior será o intervalo onde o parâmetro da população estará contido. (são diretamente proporcionais).
Na simulação seguinte, mantivemos constante o nível de confiança em 95% e em seguida verificamos como o intervalo se altera com tamanhos de amostras diferentes. Inicialmente, começamos com amostras bem pequenas, de 5 elementos, e percebemos que a amplitude dos intervalos é grande, ou seja, temos menos precisão. Mas se aumentarmos o tamanho amostral para 30 elementos, percebemos que os intervalos diminuíram muito em tamanho, isto é, com mais dados, a nossa precisão aumenta, mantendo o mesmo nível de confiança.
Em síntese, quanto maior o tamanho da amostra (n), menor o erro padrão (pois temos mais dados e menos incerteza). Assim, os intervalos serão mais precisos, e portanto, menores.
Gostou do post de hoje? Deixe seu comentário, dúvida ou sugestão!
E para continuar estudando esse assunto acesse o nosso canal do Youtube e veja como calcular um I.C para:
No Curso de Estatística: Introdução à Estatística Aplicada, a Profª Fernanda Maciel ensina como aplicar estatística com autonomia e ser um profissional mais qualificado. Caso queira saber os detalhes do conteúdo do curso, basta clicar aqui.
JAWLIK, Andrew. Statistics from A to Z: confusing concepts clarified. 1.ed. Wiley, 2016.
LARSON, Ron; FARBER, Betsy. Estatística Aplicada. 6.ed. São Paulo: Pearson Education do Brasil, 2015.
© 2021 Prof. Fernanda Maciel
contato@proffernandamaciel.com