Análise de Dados no Excel

Aula 3

Neste post eu mostro como fazer o teste t para dados em pares (ou dados pareados), com uma aplicação prática no Excel.

Considerações importantes:

1) Para a análise de hoje, utilizaremos uma base de dados diferente da que estávamos usando, pois iremos fazer uma análise de antes e depois. O arquivo com os dados é o Calorias, para acessar clique aqui.

2) Também é necessário que você já tenha instalado no seu excel um suplemento chamado “análise de dados”, que ensinamos como obter no 1º post da série “Análise de Dados no Excel”. Caso você ainda não tenha instalado, veja como fazer aqui: Análise de dados no Excel – Aula 1

Vamos ao problema:

Entrou em vigor uma lei nos Estados Unidos que exigia que estabelecimentos, como restaurantes, lanchonetes e cafeterias colocassem no menu o número de calorias de cada produto.

Uma nutricionista, querendo investigar se houve uma mudança no comportamento dos consumidores, coletou dados de uma Starbucks. A hipótese dela é que ao ver a quantidade de calorias em um produto, as pessoas passariam a consumir menos calorias em média.

Para fazer esta análise ela coletou os dados de 40 pessoas, para saber qual a média do que eles consomem. Isso foi verificado pelo cartão da Starbucks que os consumidores utilizam, no qual são salvos os produtos consumidos.

A nutricionista teve acesso aos dados dessas 40 pessoas e o que elas consumiam antes da lei ser implementada e o que eles passaram a consumir depois. Ela calculou a média de calorias consumidas.

Como resolver o problema no Excel?

Na base de dados “calorias”, temos uma coluna “antes”, que significa antes da lei ser implantada, e a coluna “depois”, que significa depois que a Starbucks começou a mostrar o número da caloria de cada produto. Esses dados mostram as médias de calorias consumidas por 40 clientes da Starbucks.

A pergunta que vamos investigar é: mostrar a informação calórica de cada produto reduz a média de consumo calórico (nível de significância de 5%) ?

Hipótese alternativa (Ha): é a hipótese que a gente quer testar, neste caso é se depois as pessoas consomem menos calorias do que antes. Então, a média de antes é menor que a média de depois, ou seja, a média de antes menos a média de depois é maior que zero.

Hipótese nula (Ho): é o complemento da hipótese alternativa, ou seja, a média de antes menos a média de depois é menor ou igual a zero, o que significa que o consumo médio de calorias não diminuiu.

Figura 1
Iniciando:
Começamos clicando em “análise de dados” e selecionando “Teste-T: duas amostras em par para médias”, depois clicar em “OK”.

Figura 2

  • Intervalo da variável 1: selecionar o intervalo da coluna “antes”;
  • Intervalo da variável 2: selecionar o intervalo da coluna “depois”;
  • Rótulos: selecionamos os rótulos, pois há títulos nas colunas;
  • Intervalo de saída: escolher uma célula vazia, onde aparecerá os resultados.
  • Clicar em “OK”.
Figura 3

Aparecerá a seguinte tabela com as seguintes informações:

Figura 4

A Média mostra a média de calorias consumidas de todas as 40 pessoas, antes e depois da nova lei. Antes, em média, elas consumiam 400 calorias e elas passaram a consumir 391. Percebemos que há uma redução, mas para saber se é significativa teremos que analisar.
A informação que vamos analisar neste problema é P(T<=t) uni-caudal, que é o p-valor.

Figura 5

Como podemos observar, existem na tabela: o p-valor uni-caudal e o p-valor bi-caudal.
O Excel não sabe o que você quer, ele apenas dá as informações, é necessário que você investigue qual informação você precisa para o seu problema.
Neste problema, utilizaremos o teste uni-caudal. Essa decisão é dada pela teoria do teste de hipóteses, que não cobrimos nesse post, mas você pode assistir a essa aula para entender: Aprenda Teste de Hipóteses em 4 passos

Figura 6

Analisando o resultado:

Obtemos o p-valor de 2,15E-08, mas o que significa este número? O Excel não dá valores na potência de 10 ele coloca a letra “E” (muitos programas fazem isso). Esse valor significa que é 2,15*10^-8, ou seja, esse número é 0,0000000215, então é um número muito pequeno. Como que a gente usa esse p-valor? Se o p-valor for menor que a nossa significância (nossa significância é 5%), então rejeitamos a hipótese nula.

Conclusão:

Como nosso p-valor é menor do que 5%, rejeitamos a hipótese nula. Quando rejeitamos a hipótese nula, assumimos a hipótese alternativa como verdadeira. E isso significa que a hipótese da nutricionista, de que as pessoas consomem menos calorias quando elas sabem a quantidade de calorias, é confirmada. Dessa forma, é possível concluir dizendo que a nutricionista coletou os dados e através do teste t conseguiu provar que sua hipótese é verdadeira.

E aí, gostou? Se você tiver que trabalhar com esses tipos de dados de antes e depois de algum determinado fato, você pode fazer a análise, como eu fiz no exemplo acima, utilizando o teste de hipóteses.

O teste de hipóteses é um dos tópicos abordados no meu Curso de Estatística, com teoria e exemplos. Para saber mais, visite:
Curso de Estatística da Prof. Fernanda Maciel.

Na próxima aula eu ensino a fazer Análise de Regressão no Excel. Para acessar, clique aqui.
Prof. Fernanda Maciel

Prof. Fernanda Maciel

Professora de Business Analytics na California State University

Inscreva-se na lista de e-mails da Prof. Fernanda Maciel e receba os próximos textos do blog.

© 2021 Prof. Fernanda Maciel

contato@proffernandamaciel.com