Análise de Variância (ANOVA)

Nesse texto vamos aprender um pouco sobre o que é a análise de variância (ANOVA), quando usá-la e as diferenças entre a ANOVA de um fator da ANOVA de dois fatores.

O que é análise de variância (ANOVA)

A análise de variância mais conhecida como ANOVA é um teste estatístico bastante utilizado nas pesquisas, seja em áreas biológicas e de saúde ou exatas. Esse teste estatístico tem como objetivo verificar a diferença entre médias de três ou mais grupos baseado na análise das variâncias amostrais. 

Ou seja, a ANOVA permite identificar se esses grupos possuem diferenças estatísticas significativas ou não a partir da comparação de vários grupos. Possibilitando a identificação se as diferenças entre os grupos são reais ou ao decorrente da variabilidade implícita da amostra.

Quando utilizar a ANOVA

Imagine que você seja um estudante de biologia que está fazendo sua primeira iniciação científica na área de Bioquímica Vegetal. O seu projeto tem como objetivo avaliar os impactos no crescimento de uma determinada planta que foi tratada com várias concentrações de água salina diferentes. 

Em um primeiro momento você terá que realizar o procedimento prático do seu projeto que é plantar as sementes dessa planta, que vamos chamar de Alface, e separar as diferentes concentrações de água salina para que você regue as plantas durante um tempo até que essas plantas cresçam um tamanho razoável. 

Passando um tempo você observou que já é hora de fazer as análises necessárias para obter o resultado do seu objetivo inicial. O seu orientador te falou que você precisa comparar as médias do tamanho do crescimento das plantas de acordo com a água salina utilizada. 

Bom, essa é uma ótima hora para aplicar a análise de variância. Quando você precisa identificar se há alguma diferença estatística significativa entre esses grupos.

Como calcular a ANOVA

A ANOVA parte do princípio que para determinar a diferença entre médias é necessário a análise de da variação entre as médias dos grupos analisados e da variação em relação às amostras dentro do mesmo grupo. Abaixo está elencado como se calcula a ANOVA.

Glossário (ANOVA)

Antes de realizarmos o cálculo da ANOVA é necessário que você possua conhecimento sobre determinadas palavras chaves importantes no cálculo da ANOVA. São elas: 

  • SQT é a Soma dos Quadrados Totais
  • SQF é a Soma dos quadrados dos Grupos (tratamentos)
  • SQU é a Soma dos Quadrados dos Resíduos
  • QMF é a Média Quadrada dos grupos
  • QME  é a Média Quadrada dos resíduos 

Abaixo temos o quadro da análise de variância com os respectivos cálculos que precisamos realizar. 

anova

Quadro 1 – Cálculos para realizar a análise de variância (ANOVA).

Realizando a ANOVA

Dando continuidade no exemplo anterior agora vamos aprender como você calcula essa análise de variância. Para isso você anotou todos os comprimentos das plantas separadas por concentração da água salina utilizada. 

Nesse caso, a concentração da água é o nosso tratamento ou grupo. 

Antes de começar a análise de variância é necessário que os dados sigam algumas suposições. São elas:

  1. Observações Independentes
  2. Homogeneidade de variâncias
  3. Distribuição normal 
  4. A variável dependente é contínua

Nesse exemplo temos a variável explanatória categórica (X) e a variável resposta contínua (Y). Observe na tabela abaixo os dados do experimento: 

Tabela 1 – Dados referente a variável comprimento (cm) dividida por quatro tratamentos de água salina com concentrações:
T4: 25% de água salina, T3: 50% de água salina, T2: 75% de água salina e T1 apenas com água de torneira. 

Realizando todos os cálculos que estão no quadro 1, temos a seguinte resposta:

Tabela 2 – Resultado do cálculo de análise de variância (ANOVA)

Agora que já realizamos os cálculos preenchendo a tabela de análise de variância, o que temos que fazer é visitar nossas hipóteses e verificar qual se hipótese vamos rejeitar ou aceitar. As hipóteses são:

H0: Não existe diferença entre os grupos (p-valor > 0,05).

H1: Existe diferença em pelo menos dois grupos (p-valor < 0,05)

Como o p-valor foi 0,38 não rejeitamos a hipótese H0 que informa que não existem diferenças entre os grupos (p-valor > 0,05). Ou seja, as diferentes concentrações de água salina não influenciaram no comprimento das plantas.

Diferença entre a ANOVA de um fator e ANOVA dois fatores

O exemplo que fizemos acima sobre ANOVA era referente a anova de um fator porque só possuía um fator, que nesse caso era o tratamento. 

Caso você estivesse analisando dados referentes a um questionário aleatório a uma determinada amostra e você quisesse saber o efeito do sexo e da escolaridade. Isso seria considerado uma ANOVA de dois fatores, sendo eles: sexo (com dois níveis: feminino e masculino) e escolaridade (com três níveis: fundamental, ensino médio ou graduação).

No meu Curso de Estatística eu ensino como aplicar estatística com autonomia e ser um profissional mais qualificado. Caso queira saber os detalhes do conteúdo do curso, basta clicar aqui.

Referências

Você achou que agora ficou mais fácil realizar a ANOVA? Conte aqui nos comentários o que você achou!

Leia também nosso texto sobre p-valor.
Prof. Fernanda Maciel

Prof. Fernanda Maciel

Professora de Business Analytics na California State University

Pesquise o assunto desejado em estatística no campo abaixo
Inscreva-se na lista de e-mails da Prof. Fernanda Maciel e receba os próximos textos do blog.

© 2021 Prof. Fernanda Maciel

contato@proffernandamaciel.com