February 4, 2020 | Carlos Ochoa

Tamaño de muestra efectiva

Las técnicas de ponderación permiten corregir sesgos producidos por desequilibrios en la composición de una muestra. En muestras online, por ejemplo, es frecuente usar ponderación para compensar la falta de gente mayor o de personas de una determinada región.

Sin embargo, el uso de la ponderación tiene un coste: el margen de error de las estimaciones aumenta. Una forma muy clara de verlo es calcular el tamaño de muestra efectivo. Hoy te explicamos qué es el tamaño de muestra efectivo a través de ejemplos.


multitud-calle-shutterstock_740632636c

 

¿Qué es una ponderación de muestra?

Imagina la siguiente situación. Queremos estudiar mediante una encuesta una población de personas para conocer su predisposición a comprar un nuevo producto. El 50% de la población son hombres y el 50% son mujeres. Pero al realizar la encuesta hemos obtenido 25% hombres y 75% mujeres.

Si tenemos el sexo de las personas influye en su intención de compra, la muestra que hemos obtenido va a dar unos resultados claramente sesgados. Si, por ejemplo, las mujeres tienen una mayor intención de compra, al estar sobrerrepresentadas en la muestra, nuestra estimación total de compra estará inflada.

Corregirlo es aparentemente simple: debemos dar más peso a la opinión de los hombres y menos a la delas mujeres, para compensar su desequilibrio en la muestra. O, visto desde otro punto de vista, tenemos que calcular la intención de compra para hombres y mujeres por separado, y posteriormente hacer una media ponderada corrigiendo las diferencias de proporciones entre la población y la muestra.

Veámoslo con un ejemplo. Supongamos que un 30% de los hombres ha declarado que compraría el producto y un 50% de las mujeres. Si no ponderamos, la intención de compra (x) media que obtendremos en la muestra será

x = 25% × 30% + 75% × 50% = 45%

Si corregimos la proporción entre hombres y mujeres de la muestra (25% - 75%), reemplazándola por la de la población (50% - 50%), obtendremos:

x = 50% × 30% + 50% × 50% = 40%

 

 

Entonces, ¿la ponderación es la solución a todos mis problemas con las muestras?

La pregunta anterior es muy pertinente. Si ponderando el peso de las subpoblaciones puedo corregir mis estimaciones, ya no hace falta que me preocupe más por obtener muestras representativas. Cualquier tipo de muestra podría ser corregida.

Esto no es exactamente así, por dos razones:

1. La ponderación corrige estimaciones en relación a variables que sepas de antemano que afectan al resultado. Pero puede haber otras variables ocultas que no puedas controlar. Por lo tanto, te interesa trabajar con muestras lo más representativas posibles.

2. La ponderación tiene un efecto colateral que a menudo se ignora: reduce la precisión de tus estimaciones.

Hoy nos vamos a centrar en el segundo efecto. Plantéate esta pregunta: en el ejemplo anterior, ¿crees que una estimación hecha con una muestra compuesta por 25% hombres y 75% mujeres es igual de buena a la que habrías hecho con una proporción de 50% hombres y 50% mujeres?

La respuesta es NO. De lo contrario, en una muestra de 1,000 personas nos bastaría tener 1 hombre y 999 mujeres para estimar correctamente la intención de compra. Y parece obvio que una muestra así no puede ser buena. Veamos exactamente por qué.

 

 

Margen de error en una muestra ponderada

Formalicemos un poco el problema para hacerlo más general. Aquí es donde entra las fórmulas y la estadística, pero trataremos de explicarlo con detalle.

Supongamos que la proporción de hombres en la población es p y, por lo tanto, la de mujeres es 1-p. Y supongamos que la proporción de hombres en la muestra es q y la de mujeres 1-q. Si p≠q, por tanto, tenemos una muestra desbalanceada. 

La media de la intención de compra en la población (la llamaremos x) es el resultado de combinar la intención de compra media de hombres (xh) y mujeres (xm), usando las proporciones poblacionales

x = xh p + xm (1-p)

Partimos de la hipótesis de que hombres y mujeres pueden tener diferente intención de compra. Técnicamente, lo que estamos asumiendo es que hombres y mujeres son dos subpoblaciones diferentes, cada una caracterizada por su propia media y varianza poblacionales: llamemos μh y σh2 a la media y la varianza poblacional de la intención de compra de los hombres, y μm y σm2 a la de las mujeres.

La intención de compra media de hombres y mujeres (μh y μm) son los valores que estimamos a través de la muestra. En concreto, si tenemos una muestra con n individuos, estamos estimando μh usando n×q hombres, y μm usando n×(1-q) mujeres.

De acuerdo al teorema central del límite, las medias x-h y x-m que calculamos en la muestra se distribuyen siguiendo una distribución Normal con media igual a la media poblacional (μh y μm respectivamente) y con varianza igual a la varianza poblacional dividida por el tamaño de la muestra, es decir, σh2/(nq) y σm2/(n(1-q)) .

Dado que la intención de compra media x- es una combinación lineal de las intenciones de compra de hombres y mujeres, la varianza de la estimación total se puede calcular usando propiedad siguiente: var(aX+bY)=a2var(X)+ b2var(Y), siempre y cuando X e Y sean variables independientes. En nuestro caso

var(x) = p2var(xh) + (1-p)2var(xm)

Usando el teorema central del límite anteriormente descrito, tenemos

var(x) = p2
σh2 nq
+ (1-p)2
σm2 n(1-q)

Supongamos por el momento que ambas subpoblaciones, hombres y mujeres, tienen la misma varianza (σh2=σm2=σs2) y que las subpoblaciones solo difieren en la media. Entonces,

var(x) =
σs2 n
(
p2 q
+
(1-p)2 (1-q)
)

Como hemos visto en otros posts, el margen de error que vamos a obtener en nuestra estimación depende de esta varianza. Más concretamente, es igual a la raíz de la varianza (la desviación estándar) multiplicada por un valor ZNC que depende del nivel de confianza que queramos usar en nuestras estimaciones. Por lo tanto, mayor varianza produce mayor error de estimación.

Observando la expresión anterior, podemos analizar el efecto que tiene el hecho de que hombres y mujeres estén presentes en diferentes proporciones en la población (p y 1-p) y en la muestra (q y 1-q).

La primera observación es que esta varianza es mínima si p=q, en cuyo caso.

var(x) =
σs2 n
(
p2 p
+
(1-p)2 (1-p)
)
=
σs2 n
( p + (1-p) ) =
σs2 n

Es decir, si la muestra tiene la misma proporción de hombres y mujeres que la población, la varianza es mínima e igual a la varianza que obtendríamos al hacer una muestra de tamaño n de una única población.

Sabiendo esto, cobra especial interés volver a nuestra anterior expresión y hacer una pequeña transformación.

var(x) =
σs2 n
(
p2 q
+
(1-p)2 (1-q)
) =
σs2
n
(
p2 q
+
(1-p)2 (1-q)
)

Si comparamos esta expresión con la anterior (σs2/n) vemos que el tamaño de muestra n está dividido por un factor que únicamente depende de p, 1-p, q y 1-q. Este factor es igual a 1 cuando p=q, en cualquier otro caso es mayor que 1. Cuando las proporciones no coinciden, el efecto en la varianza es equivalente a una disminución efectiva del tamaño de muestra n. Podemos definir el tamaño de muestra efectivo como

neff =
n
(
p2 q
+
(1-p)2 (1-q)
)

Usando esta mirada, podemos pensar en la pérdida de precisión de nuestras estimaciones por causa de la ponderación como el resultado de reducir el tamaño efectivo de la muestra.

Volviendo a nuestro ejemplo, si las proporciones en la población de hombres y mujeres es de 50%-50% y nuestra muestra guarda idénticas proporciones, la muestra efectiva es igual al tamaño real de la muestra n. Pero si las proporciones en la muestra son, por ejemplo, 25%-75%, tendremos

neff =
n
(
0.52 0.25
+
0.52 0.75
)
=
n 1.33
= 0.75n

Por lo tanto, aunque ponderemos para corregir la diferencia de proporciones, nuestra estimación va a tener la precisión propia de una muestra de tamaño igual al 75% del tamaño original de la muestra. Si nuestra encuesta se ha hecho a 1,000 personas, tenemos la precisión de una encuesta de 750 personas.

A continuación, tienes una tabla en la que calculamos el tamaño de muestra efectivo para diferentes proporciones en la muestra en una situación en la que la proporción en la población es 50%-50%.

Proporcion q - Eficiencia

 

Cuanto más se aleja la proporción q de la muestra de la proporción p=0.5 de la población, más se reduce el tamaño efectivo de muestra. Solo si q=p=0.5 tenemos eficiencia 100%.

 

Generalización a más subpoblaciones: pesos

Podemos extender el ejemplo anterior a más de dos subpoblaciones.

Supongamos que la población se compone de m subpoblaciones, cada una con proporciones p1, p2 …. pm. Y que la muestra tiene unas proporciones para cada subpoblación q1, q2 …. qm.

Un individuo cualquiera de la subpoblación 1, debería aparecer en la muestra con una proporción p1, pero realmente aparece con una proporción q1. En lugar de calcular la media en cada subpoblación y ponderar las medias resultantes, es muy habitual darle un peso w a cada individuo. En este ejemplo, los individuos de la subpoblación 1 tendrán un peso p1/q1. Los pesos de toda la muestra deben sumar 1. Aquellos individuos que están infrarrepresentados (q<p) tendrán pesos mayores que 1, los sobrerrepresentados (q>p) tendrán pesos menores que 1.

Al hacer esto, la media poblacional se calcula como la media ponderada de todos los individuos

x =
n n=1 wi xi n

donde xi es el valor de la variable observada para cada individuo y wi es el peso de dicho individuo (la relación entre la proporción en la población y en la muestra de su subpoblación). En nuestro ejemplo anterior, los hombres pesaban w=0.5/0.25=2 y las mujeres w=0.5/0.75=0.67.

Una vez asignamos pesos a cada individuo de la muestra, es posible demostrar que el tamaño efectivo de muestra es igual a

neff =
( n n=1 wi ) 2 n n=1 wi2

Es fácil comprobar que esta expresión es equivalente a la que hemos usado anteriormente cuando tenemos dos subpoblaciones. Para ello, solo debes tener en cuenta que la subpoblación de hombres consta de nq individuos con peso p/q, y la subpoblación de mujeres consta de n(1-q) individuos con peso (1-p)/(1-q).

 

Ejemplo: media ponderada en 4 subpoblaciones

Supongamos una población dividida en 4 regiones con el mismo número de habitantes. Queremos estimar el tiempo medio diario (en minutos) que los habitantes dedican a ver TV mediante una encuesta a 1,000 personas. Sabemos que las regiones consumen TV en diferentes proporciones.

Supongamos que la muestra no está equilibrada. Para cada una de las 4 regiones tenemos un total de 200, 100, 300 y 400 individuos, en lugar de 250 en cada una. Y los minutos de TV consumida respectivamente por región son, de acuerdo a la encuesta, 380, 360, 400 y 450. La desviación típica observada en cada submuestra es muy similar y aceptaremos que es 100 minutos en todos los casos.

Los individuos de las dos primeras regiones están infrarrepresentados, mientras que los de las dos segundas están sobrerrepresentados. Los pesos para cada región son iguales a la relación entre proporción de la población y de la muestra: 0.25/0.2, 0.25/0.1, 0.25/0.3 y 0.25/0.4, por lo tanto: 1.25, 2.50, 0.83 y 0.63.

Lo primero que debemos hacer es calcular la media ponderada de consumo de TV, teniendo en cuenta el peso de cada individuo en función de su subpoblación.

x =
n n=1 wi xi n
=
200 n=1 wi xi + 300 n=201 wi xi + 600 n=301 wi xi + 1000 n=601 wi xi n
=
200w1x1 + 100w2x2 + 300w3x3 + 400w4x4 n
=
200×1.25×380 + 100×2.50×360 + 300×0.83×400 + 400×0.63×450 1,000
= 397.5

Nos falta medir la precisión de nuestra estimación. Para ello, calculamos el tamaño efectivo de la muestra.

neff =
( n n=1 wi ) 2 n n=1 wi2
=
(200×1.25 + 100×2.50 + 300×0.83 + 400×0.63)2 (200×1.252 + 100×2.502 + 300×0.832 + 400×0.632)
= 768

El margen de error resultante para un nivel de confianza del 90%, tal y como hemos visto en otro post, es

e =Z90%
σs neff
=1.645
100 768
= 5.9

Podemos concluir que el consumo de TV medio en el total del país es, con un nivel de confianza del 90%:

x = 397.5 ± 5.9

Si la muestra hubiera estado perfectamente equilibrada, el margen de error habría sido 5.2 (=1.645×100/√1,000).

 

Ejemplo: proporciones ponderadas

En el ejemplo anterior hemos usado ponderación para estimar una media (minutos de TV diarios), pero también podemos emplear esta técnica para estimar una proporción: por ejemplo, el porcentaje de gente dispuesta a comprar un producto.

En estos casos, sin embargo, la fórmula del tamaño efectivo de muestra que hemos presentado solo puede ser una aproximación. La principal razón para ello es que no podemos aceptar la hipótesis de que la varianza de ambas subpoblaciones es igual.

Retomemos el ejemplo inicial de este post para ver porqué. En ese ejemplo, estimábamos la intención de compra de un producto. Ésta era diferente para hombres y mujeres (30% y 50%) calculada sobre una muestra desproporcionada (25%-75% en lugar de 50%-50%).

La razón por la que no podemos aceptar igual varianza para hombres y mujeres es que, en la estimación de proporciones, la varianza depende de la propia proporción estimada. En concreto, si hemos estimado una proporción x, la varianza es x(1-x). Por lo tanto, si las medias son diferentes, las varianzas también. En el ejemplo, la varianza de la proporción de hombres con intención de compra es 0.3(1-0.3)=0.21, mientras que en las mujeres dicha varianza es 0.5(1-0.5)=0.25.

Al no poder aceptar que ambas poblaciones comparten varianza, no podemos simplificar el cálculo de la varianza total de nuestra estimación. Tenemos que usar la fórmula

var(x) = p2
σh2 nq
+ (1-p)2
σm2 n(1-q)

Reemplazando los valores estimados en la encuesta

var(x) = p2
0.21 nq
+ (1-p)2
0.25 n(1-q)
var(x) = 0.52
0.21 n0.25
+ 0.52
0.25 n0.75
=
0.3 n

Si las proporciones hubieran sido iguales en la población y en la muestra (p=q), esta varianza habría sido

var(x) =
1 n
( pσh2 + (1-p)σm2 )
=
1 n
( 0.5σh2 + 0.5σm2 ) =
0.23 n

Comparando ambas expresiones, vemos que la varianza difiere en un factor 0.3/0.23=1.3. Es decir, la diferencia de proporciones entre población y muestra ha inflado la varianza un 30%. Si atribuimos este aumento a un tamaño efectivo de muestra, podemos decir

1 neff
0.23 =
1 n
0.3
neff = n
0.23 0.3
= 0.76n

Por lo tanto, la muestra desproporcionada produce una precisión equivalente al 76% de una muestra proporcionada.

 

Conclusiones

La ponderación es una herramienta muy útil para corregir desviaciones en las proporciones de una muestra, en relación a una o varias variables. Pero no debería utilizarse indiscriminadamente como una forma de suplir cualquier carencia en la representatividad de una muestra.

Esto aplica especialmente a muestras obtenidas de paneles online. En estos paneles es habitual tener dificultades para alcanzar ciertos perfiles poblacionales: gente de edad avanzada, personas de clase baja o muy alta, personas en ciertas regiones… En estos casos, la ponderación puede ayudar a corregir el sesgo de nuestras estimaciones, pero siempre a costa de aumentar la varianza de las mismas y el margen de error.

Calcular el tamaño efectivo de la muestra es una buena manera de ver qué impacto en la precisión de nuestras estimaciones tiene la ponderación.

 

Carlos Ochoa

About the author

Carlos Ochoa | Chief Client Officer

FREE EBOOK

The essentials of online data collection

Download ebook

Netquest Blog Archives

Search and discover over last years latest market research topics.

View the archives

Suscribete a nuestro blog

Recibe las últimas noticias en tu email.

Subscribe to our blog

netquest-blog-suscription-shape-illustration

Hey!

It looks that you are enjoying what you've been reading

Want to read more?

Hey!

It looks that you are enjoying what you've been reading

Want to read more?

Have access to more genuine content, subscribe to our blog.

I'm already subscribed. Close