Amostragem probabilística: Amostra estratificada

Vimos no post anterior as definições, vantagens e inconvenientes da amostra aleatória simples. Agora vamos explorar a amostra estratificada.

Esta técnica pertence a família de amostras probabilísticas e consiste em dividir toda a população ou o "objeto de estudo" em diferentes subgrupos ou estratos diferentes, de maneira que um indivíduo pode fazer parte apenas de um único estrato ou camada. Após as camadas serem definidas, para criar uma amostra, selecionam-se indivíduos utilizando qualquer técnica de amostragem em cada um dos estratos de forma separada. Por exemplo, se usamos a amostra aleatória simples em cada estrato, estamos falando de amosta aleatória estratificada (M.A.E. que veremos mais pra frente).  Podemos usar outras técnicas de amostragem em cada estrato (amostra sistemática, aleatória, com reposição, etc).

As camadas ou estratos são grupos homogêneos de indivíduos, que por sua vez, são heterogêneos entre diferentes grupos. Por exemplo, se num estudo esperamos encontrar um comportamento diferente entre homens e mulheres, é conveniente definir duas camadas, uma para cada gênero. Se a seleção desses estratos for correta, encontraremos: (1) os homens devem se comportar de forma muito semelhante entre si, (2) as mulheres devem se comportar de forma muito parecida entre si e (3) homens e mulheres devem mostrar comportamentos diferentes entre si.

Se a condição comentada anteriormente é cumprida de forma correta (estratos internamente homogêneos e heterogêneos entre si), o uso da amostragem aleatória estratificada reduz o erro amostral, melhorando a precisão dos resultados ao realizar um estudo sobre a amostra.

É relativamente habitual definir os estratos de acordo com algumas variáveis características da população, tais como: idade, sexo, classe social ou região geográfica. Essas variáveis permitem dividir facilmente a amostra em grupos mutuamente exclusivos e frequentes, permitem discriminar comportamentos diferentes dentro da população.

 

Tipos de amostra estratificada

Dependendo do tamanho atribuído as camadas, estamos falamos sobre os diferentes tipos de amostragem estratificada. Também é costume falar sobre diferentes formas de definir as camadas da amostra.

 

(1) Amostra estratificada proporcional

Quando selecionamos uma característica dos indivíduos para definir camadas, frequentemente o tamanho resultante das subpopulações do universo são diferentes. Por exemplo, queremos estudar a % da população fumante no México e estipulamos que a idade pode ser um bom critério para a estratificação (ou seja, existem diferenças significativas de fumantes de acordo com a idade). Definimos três camadas: menores de 20 anos, 20 a 44 e superiores a 44 anos.
É de se esperar que, ao dividir a população mexicana, essas 3 camadas não resultam em grupos de tamanhos iguais. Na verdade, se olharmos para os dados oficiais, obtemos:

* Estrato 1 - População mexicana menor de 19 anos: 42,4 milhões (41,0%)

* Estrato 2 - População mexicana de 20 a 44 anos: 37,6 milhões (36,3%)

* Estrato 3 - População mexicana maior de 44 anos: 23,5 milhões (22,7%)

Se usamos a amostra estratificada proporcional, a amostra deverá obter camadas que obtenham as mesmas proporções observadas na população. Se queremos criar uma amostra de 1.000 indivíduos, os estratos precisam ter este tamanho:

Estrato População Proporção Amostra
1 42,4M 41,0% 410
2 37,6M 36,3% 363
3 23,5M 22,7% 227

 

(2) Amostra estratificada uniforme

Para definir uma amostra uniforme, é necessário atribuir o mesmo tamanho de amostra para todas as camadas, independentemente do peso dos estratos da população. Continuando com o exemplo acima, a amostragem estratificada uniforme definiria a seguinte amostra por estrato:

Estrato População Proporção Amostra
1 42,4M 41,0% 334
2 37,6M 36,3% 333
3 23,5M 22,7% 333

Esta técnica favorece os estratos que têm menor peso na população, equivalendo a importância dos estratos mais relevantes. Globalmente, reduz a eficiência da nossa amostra (resultados menos precisos), mas em troca, permite estudar características de cada camada de forma mais eficiente. No nosso exemplo, se emitirmos uma declaração específica sobre a população do estrato 3 (mais de 44 anos), podemos fazê-lo com menor erro de amostragem.

 

(3) Amostra estratificada ótima (a respeito do desvio-padrão)

Neste caso, o tamanho das camadas da amostra não será proporcional com a população. Por outro lado, o tamanho das camadas é definido em proporção com o desvio-padrão das variáveis estudadas. Isto é, se obtêm camadas maiores dos estratos com maior  variabilidade interna para representar melhor o total da amostra nos grupos populacionais mais difíceis de estudar.

 

Eficiência dos diferentes tipos de amostras estratificadas

As perguntas inevitáveis são: Quando devemos usar a estratificação? Que tipo de estratificação é mais conveniente?

  • A amostra estratificada proporcional produz um erro amostral menor ou igual a amostra aleatória simples, é mais precisa. A igualdade ocorre quando as médias ou as proporções que estamos analisando são iguais em todos os níveis dos estratos. Portanto, a estratificação produz mais benefícios quanto mais diferentes as camadas são.
  • A amostragem estratificada ótima é sempre igual ou mais precisa que a amostra estratificada proporcional. Ambos os métodos são igualmente precisos quando os desvios-padrão são iguais dentro de cada camada, neste caso ambos os métodos são completamente equivalentes. A estratificação ótima produz mais benefícios quando maior for o número de diferenças entre cada grupo, situação que podemos reduzir o tamanho da amostra dos grupos mais homogêneos para beneficiar os mais heterogêneo. Em contrapartida, é um método complexo que exige ter muita informação antes de se obter a amostra estudada, algo que normalmente não temos.

 

Tamanhos de amostras necessárias para cada técnica

Vemos que a estratificação pode proporcionar benefícios. Se essas técnicas podem ser usadas para estimar as médias de forma mais precisa (p.e.média de cigarros consumidos pelos fumantes do México) ou proporções (p.e. proporção da população do México que fuma), também podem permitir reduzir o tamanho da amostra necessária para alcançar uma estimação com um nível de erro determinado.

A seguinte tabela resume o tamanho da amostra para cada técnica, em função do erro máximo que estamos dispostos a aceitar e as características do próprio universo, que consideraremos um tamanho infinito (se fosse finito, teríamos que aplicar um fator de correção):

Para interpretar o quadro, é necessário saber:

  • L é o número de camadas que dividimos a amostra e h é um índice que se refere a um estrato concreto. Ou seja, h pode variar entre 1 a L estratos.
  • p é a proporção que buscamos no total da população (p.e. % de fumantes). (1-p) é a proporção da amostra complementar, que não cumpre o critério buscado (não fumantes). Do mesmo modo, ph é a proporção dentro de cada uma das camadas.
  • σ2 é a variável do dado que buscamos (no caso de estimar as médias) que tem o total da população. σh2 é a variável dentro de cada camada.
  • e é a margem de erro aceita.
  • Wh é o peso que o estrato/camada tem na amostra (tamanho do estrato a respeito do total da amostra). Se falamos sobre amostra estratificada proporcional, cada Wh é igual a proporção que esta camada representa na população. Se falamos da amostra estratificada ótima, cada Wh se calcula em função da dispersão dentro de cada camada.

É possível demonstrar a partir das fórmulas anteriores que os diferentes métodos de estratificação só reduzem o tamanho da amostra se os valores de p e σ variam entre camadas. Do contrário, todas as expressões são equivalentes. Vejamos um exemplo: expressão do tamanho da amostra necessário para estimular uma média mediante a uma amostra estratificada ótima

formula4

e consideramos que todas as variáveis das camadas são iguais (σh=σ) e o tamanho das camadas são idênticas (Wh=1/L), o resultado que obtemos é:

formula3

No próximo post sobre a série, abordaremos sobre a amostra sistemática. Obrigada por acompanhar nosso blog!

 

ÍNDICE: Série "Amostragem"

  1. Amostragem: O que é e por quê funciona
  2. Amostragem probabilística e não probabilística
  3. Amostragem probabilística: Amostar aleatória simples
  4. Amostragem probabilística: Amostra estratificada
  5. Amostragem probabilística: Amostra sistemática
  6. Amostragem probabilística: Amostra por conglomerados
  7. Amostragem não probabilística: Amostra por conveniência
  8. Amostragem  não probabilística: Amostra por quotas
  9. Amostragem não probabilística: Amostra por bola de neve

Suscríbete a nuestro blog y recibe las últimas novedades aquí o en tu email.