Assimetria e Curtose dos dados

Quer saber como interpretar a assimetria e curtose dos dados? Fique neste texto até o final para você entender o que são essas medidas de forma e como interpretá-las.

As medidas de centro e dispersão são as mais utilizadas para explorar os dados inicialmente. Porém, você já deve ter percebido que nas tabelas descritivas há outras duas informações: assimetria e curtose.

Ambas são chamadas medidas de forma porque descrevem a forma da curva de distribuição a partir de como os dados estão distribuídos. Vamos entender melhor como interpretar cada conceito.

assimetria | Blog da Prof. Fernanda Maciel
Tabela do Excel com estatísticas descritivas

O que é assimetria?

A assimetria (Skewness em inglês) é a falta de simetria observada quando os dados estão concentrados em um dos lados da distribuição. Podemos afirmar que a assimetria é uma medida do grau de simetria em torno da média dos dados. Podemos interpretar essa medida visualmente e numericamente. Há basicamente três classificações em relação à assimetria:

a) Distribuição simétrica

assimetria | Blog da Prof. Fernanda Maciel
Figura 1
Encontramos uma perfeita simetria na distribuição normal, em que os dados estão concentrados em um ponto central e quanto mais distante da média, menor é a frequência dos dados. Ao traçarmos uma linha no meio da curva teremos dois lados espelhados. Se você tiver acesso às demais medidas descritivas, irá verificar que a média, a mediana e a moda também são iguais.

b) Distribuição assimétrica à direita/positiva:

assimetria | Blog da Prof. Fernanda Maciel
Figura 2
Percebemos que o pico da distribuição está do lado esquerdo e os dados se espalham em direção ao lado positivo da escala, criando uma cauda que se estende para a direita. A moda é a menor medida descritiva (sempre a encontramos no ponto mais alto da curva), em seguida temos a mediana e a média, que é maior por ser sensível aos valores extremos positivos. Nessa situação os dados estão concentrados abaixo da média.

c) Distribuição assimétrica à esquerda/negativa:

assimetria | Blog da Prof. Fernanda Maciel
Figura 3
Os dados se encontram concentrados do lado direito e se espalham em direção ao lado negativo da escala, criando assim uma cauda esquerda mais alongada. Nesse caso, a média é o menor valor por ser afetada pelos valores extremos negativos, em seguida temos a mediana e a moda representando o maior valor (na parte mais alta da distribuição). Percebemos que os dados estão concentrados acima da média.

Interpretação numérica

Uma das formas adotadas para o cálculo da assimetria é através do coeficiente de assimetria de Fisher. O coeficiente vem a partir do terceiro momento de ordem superior em torno da média através de uma função geradora de momentos. Momentos são medidas resumo de uma distribuição, sendo 1º momento = média (valor esperado), 2º momento = variância, 3º momento = assimetria e 4º momento = curtose.

O coeficiente de assimetria de Fisher pode ser escrito como:

assimetria | Blog da Prof. Fernanda Maciel
Sendo que o terceiro momento é:
assimetria | Blog da Prof. Fernanda Maciel

A interpretação, será:

g1 = 0, a distribuição é simétrica;
g1 > 0, a distribuição é assimétrica positiva (à direita);
g1 < 0, a distribuição é assimétrica negativa (à esquerda).

É desejável que a assimetria dos nossos dados esteja próxima da normal, isto é, no intervalo [-1, +1].

Na tabela inicial desse post temos a assimetria de 2,78 para uma variável hipotética “Z”  apresentada no Excel (que utiliza o coeficiente de Fisher para encontrar a assimetria). Podemos fazer a seguinte interpretação: o sinal positivo significa que a distribuição é assimétrica à direita e como 2,78 é maior que o intervalo de referência, os dados apresentam alto grau de assimetria.

Para encontrar a assimetria no Excel, se usa a função DISTORÇÃO ou através do suplemento Análise de Dados. Acesse este post para aprender como instalar o suplemento e saber como acessar a tabela com as estatísticas descritivas dos seus dados.

O que é curtose?

A curtose (kurtosis em inglês) representa o grau de achatamento da distribuição, isto é, quão espalhados os dados estão em torno da média. Novamente, usamos a curva normal padrão como referência e podemos interpretar a curtose por meio de gráficos ou numericamente. Pode ser classficada em três tipos:

a) Mesocúrtica: que é própria curva normal padrão 

b) Platicúrtica: possui grau de achatamento maior que da curva normal padrão, o que nos indica que os dados estão mais espalhados (logo, o desvio padrão também é maior).

c) Leptocúrtica: seu grau de achatamento é menor que o da curva normal padrão (curva mais pontiaguda), indica que os dados estão mais concentrados (desvio padrão menor).                                                                                                                                                            

assimetria | Blog da Prof. Fernanda Maciel
Figura 4

Interpretação numérica

A curtose pode ser calculada pelo coeficiente de curtose de Fisher, que neste caso utiliza o quarto momento de ordem superior ao redor da média:
assimetria | Blog da Prof. Fernanda Maciel

Em que o quarto momento é dado por:

assimetria | Blog da Prof. Fernanda Maciel

Assim, se:

 g2 = 0, a curva é normal padrão, isto é, mesocúrtica                                                                                                                                                                           g2 > 0, grau de achatamento baixo, a curva é leptocúrtica                                                                                                                                                                 g2 < 0, grau de achatamento alto, a curva é platicúrtica

Em alguns programas estatísticos, como o STATA, é comum encontrar a curtose da distribuição normal como K = 3. Neste caso, a interpretação é a mesma. Isto é:                                                                                                                                                                                                                                          K = 3, curva normal padrão                                                                                                                                                                                                                        K > 3, curva leptocúrtica                                                                                                                                                                                                                            k < 3, curva platicúrtica

Como interpretar na prática? Para a variável hipotética “Z” da tabela inicial, o Excel encontrou uma curtose de 10,82, o que nos indica que a curva é leptocúrtica, isto é, é menos achatada que a curva normal – o pico da distribuição é mais acentuado – então sabemos que os dados estão mais concentrados.

No Excel, a curtose pode ser encontrada por meio da função CURT e pelo suplemento Análise de Dados mencionado anteriormente.

Você gostou do post de hoje? Compartilhe sua opinião ou sugestão de temas que você gostaria de ler aqui no blog!

Referências

DECARLO, L. T. On the meaning and use of kurtosis. Psychological Methods, v. 2, n.3, p. 292–307. 1997.

FÁVERO, Luiz Paulo; BELFIORI, Patrícia. Manual de análise de dados. 1. ed. Rio de Janeiro: Elsevier, 2017.

FIELD, Andy. Descobrindo a estatística usando o SPSS. 2.ed. Porto Alegre: Artmed, 2009.

GUJARATI, Damodar N; PORTER, Dawn C. Econometria Básica. 5. ed. Porto Alegre: AMGH, 2011.

Prof. Fernanda Maciel

Prof. Fernanda Maciel

Professora de Business Analytics na California State University

Inscreva-se na lista de e-mails da Prof. Fernanda Maciel e receba os próximos textos do blog.

© 2021 Prof. Fernanda Maciel

contato@proffernandamaciel.com