Neste texto você estudará duas distribuições discretas de probabilidade, a Geométrica e a Hipergeométrica; as quais são aplicadas a contextos distintos e essa adequação do tipo de problema a que cada distribuição esteja associada é uma questão fundamental neste estudo.
Várias tarefas, ou ações cotidianas são repetidas até que aquilo que desejamos ocorra (sucesso). Por exemplo, você pode ter de enviar uma mensagem diversas vezes até que o receptor efetivamente a receba – sucesso. Um problema como esse pode ser representado por uma distribuição geométrica.
Quando você tiver interesse na probabilidade de um sucesso ocorrer em determinada tentativa x, a distribuição de probabilidades adequada será a distribuição discreta geométrica.
A distribuição de probabilidade geométrica de uma variável aleatória x deve satisfazer às seguintes condições:
– A tentativa deve ser repetida até que um sucesso ocorra;
– Cada tentativa repetida é independente uma da outra;
– A probabilidade de sucesso p é a mesma para cada tentativa;
– A variável aleatória x representa o número de tentativas até ocorrer o primeiro sucesso.
Assim, a probabilidade de que o primeiro sucesso ocorra considerando a tentativa número x é:
Figura 1. Formula da função de probabilidade da distribuição geométrica
p= probabilidade de sucesso
Uma estatística precisa consultar informações públicas disponibilizadas em um site governamental que é protegido com um sistema de CAPTCHA. Para isso, ela programou um algoritmo baseado em OCR (optical character recognition) que resolve corretamente as CAPTCHAS com p = 0.5. Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?
p (2) = (1 − 0.5) ^ 2 · 0.5 = 0.250.
Como em uma distribuição binomial, na distribuição hipergeométrica em cada tentativa a variável pode assumir os valores: sucesso e fracasso; porém, o experimento é realizado sem reposição, de forma distinta dos experimentos binomiais, nos quais qualquer amostragem deve ser feita com reposição, porque cada tentativa deve ser independente das outras.
Pense em uma população composta por N elementos, dos quais uma quantidade r de elementos possui a característica A, e a quantidade N-r de elementos possui a característica B. Uma amostra de n elementos é escolhida ao acaso, sem reposição. Para calcular a probabilidade de que essa amostra contenha k elementos com a característica A, utilizando o princípio multiplicativo, você pode aplicar a equação:
Figura 2. Formula da função de probabilidade da distribuição hipergeométrica
Em que max(0, n−N+r) ≤ k ≤ min(r, n).
Os pares (k, p(k)) formam a distribuição hipergeométrica de probabilidades.
Observação: Se você definir a variável aleatória X como sendo o número de elementos na amostra que possui a característica A, então P(X=k) = p(k).
Considere um problema de controle de qualidade, e suponha que para um lote de cem peças, dez sejam defeituosas. Qual a probabilidade de não se obter peças defeituosas escolhendo, aleatoriamente, cinco peças sem reposição?
Nesse caso, N=100; r=10; n=5 e como queremos probabilidade de NÃO se obter peças defeituosas, temos que calcular p(0).
Portanto, a probabilidade de não se obter peças defeituosas, nesse contexto, é de aproximadamente 58,38%.
Figura 3. Solução do exemplo
Você já usou as Distribuições Geométricas e Hipergeométricas? Se sim, o que mediu? Deixe nos comentários abaixo.
LARSON, R.; FARBER, B. Estatística aplicada. 4. ed. São Paulo: Pearson Education do Brasil, 2015.
MONTGOMERY, D. C. Estatística aplicada e probabilidade para engenheiros. 6. ed. Rio de Janeiro: LTC, 2018.
NASCIMENTO, W. F. et al. Efeitos da temperatura sobre a soja e milho no Estado de Mato Grosso do Sul. Investig. Agrar., San Lorenzo, v. 20, n. 1, p. 30-37, jun. 2018. Disponível em: http://scielo.iics.una.py/scielo.php?script=sci_arttext&pid=S2305-06832018000100030&lng=en&nrm=iso.
TRIOLA, M. F. Introdução à estatística. 12. ed. Rio de Janeiro: LTC, 2017.