O que é necessário para o cálculo do tamanho amostral?

Você sabe para que precisamos fazer o cálculo do tamanho amostral ? Quando realizamos estudos, sejam eles investigativos ou experimentais, temos como objetivo principal descrever fenômenos ou comparar o comportamento de variáveis em uma população. Todavia, é inviável em maior parte dos casos realizar uma pesquisa em toda a população. Nesse contexto, se faz necessário utilizar amostras. Nesse processo, necessitamos fazer o cálculo do tamanho amostral !
Uma amostra é uma parte da população com finalidade de representá-la na pesquisa. Queremos que nossa amostra seja exatamente igual à população a ser representada . Quando se dispõe de uma amostra representativa, conseguimos realizar inferências à população-alvo. Para termos uma amostra com a “cara” da população precisamos selecionar uma amostra com “qualidade” e “quantidade” suficiente.
A “qualidade” deve ser garantida pelo pesquisador utilizando técnicas de seleção da amostra por sorteio, representar todos os estratos da população, fazer pareamento quando necessário, etc. Já a “quantidade” diz respeito ao número suficiente de elementos na amostra para que a pesquisa consiga atingir o objetivo proposto que é a resposta à questão por meio do método científico.
Não existe um número padrão de tamanho da amostra, para cada pesquisa vai existir o tamanho adequado. O planejamento amostral adequado depende do conhecimento básico da estatística do estudo e do conhecimento profundo do problema investigado, a fim de que se possa unir a significância estatística dos testes ao significado dos resultados. Para isso, fazemos o cálculo do tamanho amostral.
Aqui nesse texto nós não iremos explorar as fórmulas para realização do cálculo amostral. Isso conseguimos fazer facilmente em programas como R, Stata e WinPepi. Nosso objetivo é que você entenda quais parâmetros você precisa ter em mãos para realizar o cálculo do seu tamanho amostral e como interpretar nos principais tipos de análise que você for fazer.

Cálculo do tamanho amostral de acordo com tipo de análise

Intervalo de confiança de uma proporção

Utilizado quando se deseja determinar a proporção (prevalência) de uma característica em uma população. Por exemplo, determinar qual a proporção de sujeitos com doença cardiovascular na população adulta brasileira. O resultado será apresentado assim: Prevalência = 17,6% (IC95%: 14,3 – 20,9%).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
Nível de significância (α): margem de erro máximo que o pesquisador admite na sua pesquisa. O mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
Imprecisão tolerável : margem de erro máximo que o pesquisador admite na sua pesquisa. Por exemplo, eu quero que a amplitude do meu intervalo de confiança seja bem preciso e eu só tolero erro de ± 1%. Por exemplo, em uma prevalência estimada de 6%, eu tolero ± 1% de variação no meu intervalo de confiança (pode variar de 5% a 7%, sendo uma amplitude de 2%). Seria a amplitude do meu intervalo de confiança.
Proporção esperada (%): a proporção (prevalência) que o pesquisador estima que vai encontrar na população com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

Intervalo de confiança de uma média

Utilizado quando se deseja determinar a média de uma característica quantitativa em uma população. Por exemplo, determinar qual o peso médio da população adulta brasileira. O resultado será apresentado assim: Peso médio = 72,3Kg (IC95%: 70,2 – 74,4Kg).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
Nível de significância (α): margem de erro máximo que o pesquisador admite na sua pesquisa. O mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
Imprecisão tolerável: margem de erro máximo que o pesquisador admite na sua pesquisa. Por exemplo, eu quero que a amplitude do meu intervalo de confiança seja bem preciso e eu só tolero erro de ± 10 unidades. Seria a amplitude do meu intervalo de confianç
Desvio padrão estimado: o desvio padrão que o pesquisador estima que vai encontrar na população com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

Diferença entre duas proporções

Utilizado quando se pretende determinar se existe diferença na proporção (prevalência) de uma caraterística entre duas populações. Por exemplo, determinar se existe diferença na prevalência de doença cardiovascular entre as populações de homens e mulheres brasileiros. É o caso de quando iremos utilizar na análise o teste de qui-quadrado.
Para calcular o tamanho da amostra são necessárias as seguintes informações:
Estimativa de prevalência em ambos os grupos estudados: a proporção (prevalência) que o pesquisador estima que vai encontrar na população 1 e população 2 com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.
Nível de significância (α): margem de erro máximo que o pesquisador admite na sua pesquisa. O mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
Poder: O poder estatístico é a chance de detectar o efeito de um teste quando de fato houver um efeito. Dito de outra maneira, também pode ser a capacidade de diferenciarmos um efeito real de um efeito aleatório em um estudo. O mais usual é utilizar um poder de 80%.

Diferença entre duas médias com grupos independentes

Utilizado quando se pretende determinar se existe diferença na média de uma caraterística entre duas populações independentes. Por exemplo, determinar se existe diferença de peso entre as populações de homens e mulheres brasileiros. O cálculo pressupõe que o pesquisador utilizará o teste t de Student para fazer a comparação.
Para calcular o tamanho da amostra são necessárias as seguintes informações:
Desvio padrão estimado: o desvio padrão que o pesquisador estima que vai encontrar na população com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.
Mínima diferença a ser detectada: É a menor diferença que, se existir entre as populações, o pesquisador deseja provar que as populações são diferentes. Podemos também dizer que é a menor diferença entre as populações que têm alguma relevância clínica.
Nível de significância (α): margem de erro máximo que o pesquisador admite na sua pesquisa. O mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
Poder: O poder estatístico é a chance de detectar o efeito de um teste quando de fato houver um efeito. Dito de outra maneira, também pode ser a capacidade de diferenciarmos um efeito real de um efeito aleatório em um estudo. O mais usual é utilizar um poder de 80%.

Diferença entre duas médias com grupos dependentes

Utilizado quando se pretende determinar se existe diferença na média de uma caraterística entre duas populações dependentes (pareadas). Por exemplo, determinar se existe diferença de peso na população de homens antes e após um regime de 4 semanas. O cálculo pressupõe que o pesquisador utilizará o teste t pareado para fazer a comparação. Para calcular o tamanho da amostra são necessárias as seguintes informações:
Estimativa do desvio padrão da diferença: o desvio padrão que o pesquisador estima que vai encontrar nas diferenças entre as duas medições. É necessário o desvio padrão da diferença entre os pares de dados. Essa estimativa pode vir da literatura ou de um projeto piloto.
Mínima diferença a ser detectada: É a menor diferença que, se existir entre as populações, o pesquisador deseja provar que as populações são diferentes. Podemos também dizer que é a menor diferença entre as populações que têm alguma relevância clínica.
Nível de significância (α): margem de erro máximo que o pesquisador admite na sua pesquisa. O mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
Poder: O poder estatístico é a chance de detectar o efeito de um teste quando de fato houver um efeito. Dito de outra maneira, também pode ser a capacidade de diferenciarmos um efeito real de um efeito aleatório em um estudo. O mais usual é utilizar um poder de 80%.

Correlação entre duas variáveis

Utilizado quando se pretende determinar se existe correlação entre duas variáveis quantitativas dentro de uma mesma população. Por exemplo, determinar se existe correlação entre o número de vezes que a pessoa escova os dentes por dia e o número de dentes cariados que ela tem. O cálculo pressupõe que o pesquisador utilizará o Coeficiente de Correlação de Pearson para avaliar o grau de correlação entre as duas variáveis. Para calcular o tamanho da amostra são necessárias as seguintes informações:
Coeficiente de correlação: É um valor entre -1 e +1 que corresponde ao menor coeficiente de correlação, que se existir entre as duas variáveis, o pesquisador deseja provar que há correlação entre elas.
Nível de significância (α): margem de erro máximo que o pesquisador admite na sua pesquisa. O mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
Poder: O poder estatístico é a chance de detectar o efeito de um teste quando de fato houver um efeito. Dito de outra maneira, também pode ser a capacidade de diferenciarmos um efeito real de um efeito aleatório em um estudo. O mais usual é utilizar um poder de 80%.

Aprenda a fazer o cálculo do tamanho amostral no R

Aprenda a fazer o cálculo do tamanho amostral no WinPepi

Referências

Azevedo RS. Qual o tamanho da amostra ideal para se realizar um ensaio clínico? Rev Assoc Med Bras. 2008;54:289.
Fontelles MJ, Simões MG, Almeida JC, Fontelles RGS. Metodologia da pesquisa: diretrizes para o cálculo do tamanho da amostra. Rev Paran Med. 2010;24:57-64.
Paes AT. Itens essenciais em bioestatística. Arq Bras Cardiol. 1998;71:575-80.

Veja também nossos textos sobre histogramaboxplot e gráfico de dispersão

Prof. Fernanda Maciel

Prof. Fernanda Maciel

Professora de Business Analytics na California State University

Inscreva-se na lista de e-mails da Prof. Fernanda Maciel e receba os próximos textos do blog.

© 2021 Prof. Fernanda Maciel

contato@proffernandamaciel.com