Distribuições Geométricas e Hipergeométricas

Neste texto você estudará duas distribuições discretas de probabilidade, a Geométrica e a Hipergeométrica; as quais são aplicadas a contextos distintos e essa adequação do tipo de problema a que cada distribuição esteja associada é uma questão fundamental neste estudo.

Distribuição Geométrica

Várias tarefas, ou ações cotidianas são repetidas até que aquilo que desejamos ocorra (sucesso). Por exemplo, você pode ter de enviar uma mensagem diversas vezes até que o receptor efetivamente a receba – sucesso. Um problema como esse pode ser representado por uma distribuição geométrica.
Quando você tiver interesse na probabilidade de um sucesso ocorrer em determinada tentativa x, a distribuição de probabilidades adequada será a distribuição discreta geométrica.

Condições

A distribuição de probabilidade geométrica de uma variável aleatória x deve satisfazer às seguintes condições:
– A tentativa deve ser repetida até que um sucesso ocorra;
– Cada tentativa repetida é independente uma da outra;
– A probabilidade de sucesso p é a mesma para cada tentativa;
– A variável aleatória x representa o número de tentativas até ocorrer o primeiro sucesso.

Função de probabilidade

Assim, a probabilidade de que o primeiro sucesso ocorra considerando a tentativa número x é:
Distribuições Geométricas e Hipergeométricas
Figura 1. Formula da função de probabilidade da distribuição geométrica
Sendo:
K= número de tentativas
p= probabilidade de sucesso

Exemplo

Uma estatística precisa consultar informações públicas disponibilizadas em um site governamental que é protegido com um sistema de CAPTCHA. Para isso, ela programou um algoritmo baseado em OCR (optical character recognition) que resolve corretamente as CAPTCHAS com p = 0.5. Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?
Solução:
p (2) = (1 − 0.5) ^ 2 · 0.5 = 0.250.

Distribuição Hipergeométrica

Como em uma distribuição binomial, na distribuição hipergeométrica em cada tentativa a variável pode assumir os valores: sucesso e fracasso; porém, o experimento é realizado sem reposição, de forma distinta dos experimentos binomiais, nos quais qualquer amostragem deve ser feita com reposição, porque cada tentativa deve ser independente das outras.

Função de probabilidade

Pense em uma população composta por N elementos, dos quais uma quantidade r de elementos possui a característica A, e a quantidade N-r de elementos possui a característica B. Uma amostra de n elementos é escolhida ao acaso, sem reposição. Para calcular a probabilidade de que essa amostra contenha k elementos com a característica A, utilizando o princípio multiplicativo, você pode aplicar a equação:
Distribuições Geométricas e Hipergeométricas
Figura 2. Formula da função de probabilidade da distribuição hipergeométrica
Em que max(0, n−N+r) ≤ k ≤ min(r, n).
Os pares (k, p(k)) formam a distribuição hipergeométrica de probabilidades.
Observação: Se você definir a variável aleatória X como sendo o número de elementos na amostra que possui a característica A, então P(X=k) = p(k).

Exemplo

Considere um problema de controle de qualidade, e suponha que para um lote de cem peças, dez sejam defeituosas. Qual a probabilidade de não se obter peças defeituosas escolhendo, aleatoriamente, cinco peças sem reposição?
Solução:
Nesse caso, N=100; r=10; n=5 e como queremos probabilidade de NÃO se obter peças defeituosas, temos que calcular p(0).
Portanto, a probabilidade de não se obter peças defeituosas, nesse contexto, é de aproximadamente 58,38%.
Figura 3. Solução do exemplo

No meu Curso de Estatística eu ensino como aplicar estatística com autonomia e ser um profissional mais qualificado. Caso queira saber os detalhes do conteúdo do curso, basta clicar aqui.

Você já usou as Distribuições Geométricas e Hipergeométricas? Se sim, o que mediu? Deixe nos comentários abaixo.
Espero ter ajudado! Leia também nosso texto sobre p-valor.

Referências

LARSON, R.; FARBER, B. Estatística aplicada. 4. ed. São Paulo: Pearson Education do Brasil, 2015.
MONTGOMERY, D. C. Estatística aplicada e probabilidade para engenheiros. 6. ed. Rio de Janeiro: LTC, 2018.
NASCIMENTO, W. F. et al. Efeitos da temperatura sobre a soja e milho no Estado de Mato Grosso do Sul. Investig. Agrar., San Lorenzo, v. 20, n. 1, p. 30-37, jun. 2018. Disponível em: http://scielo.iics.una.py/scielo.php?script=sci_arttext&pid=S2305-06832018000100030&lng=en&nrm=iso.
TRIOLA, M. F. Introdução à estatística. 12. ed. Rio de Janeiro: LTC, 2017.
Prof. Fernanda Maciel

Prof. Fernanda Maciel

Professora de Business Analytics na California State University

Pesquise o assunto desejado em estatística no campo abaixo
Inscreva-se na lista de e-mails da Prof. Fernanda Maciel e receba os próximos textos do blog.

© 2021 Prof. Fernanda Maciel

contato@proffernandamaciel.com