November 11, 2013 | Carlos Ochoa

¿Qué tamaño de muestra necesito?

Una de las secciones de nuestra web más visitadas es la calculadora de muestras: una aplicación online que te indica cuantas personas deberías encuestar para estimar un dato de una población sin superar un nivel máximo de error.

A menudo recibimos consultas acerca de qué hace esta calculadora: qué fórmulas emplea, qué significan términos como margen de error o nivel de confianza. Hoy te explicamos cómo funciona exactamente.

El problema

Tamaño de muestra

Imagina que quieres saber qué porcentaje de la población brasileña entre 15 y 65 años fuma. O cuantos minutos por día ven la televisión. Obviamente, lo ideal sería preguntar a todos los miembros de la población (136 millones) pero eso es extremadamente costoso. Por ello normalmente optamos por encuestar a una parte de la población, lo que se conoce como una muestra. Como una muestra no contiene a todos los individuos, inevitablemente vamos a cometer cierto error en nuestras estimaciones. Cuanto más pequeña sea la muestra, ese error va a ser potencialmente mayor.

Pero ¿es posible asegurar que el error de estimación no supere ciertos límites? Sí, es posible y vamos a ver cómo.

 

Un poco de teoría: el teorema central del límite

Para empezar, simplifiquemos un poco el problema. La población brasileña entre 15 y 65 años es muy grande, podemos considerarla una población infinita. Esta asunción es muy práctica: permite aceptar que cada vez que selecciono un individuo para mi muestra, su probabilidad de tener la característica que quiero medir (por ejemplo, fumar) es constante, con independencia de los individuos que ya haya seleccionado anteriormente. Veremos luego qué hacer si no puedo aceptar la asunción de población infinita.

Si aceptamos esta simplificación, podemos utilizar el teorema central del límite. Este teorema dice que si obtenemos múltiples muestras de n individuos de una población infinita, la media de estas muestras tiende a una distribución Normal centrada en la media de la población. Y dice algo más: esta distribución Normal tiene una desviación típica igual a la desviación de la población de origen dividida por √n.

Veamos qué significa esto en la práctica. Volvamos a la población brasileña, a los 136 millones. Imagina por un momento que pudiésemos observar a todos los individuos y medir cuánto tiempo ven la televisión. Unos la verán poco, otros mucho… pero con todos los individuos podríamos calcular una media exacta (supongamos 400 minutos). También podríamos calcular la desviación típica de la población, una medida de la dispersión de los individuos respecto a la media (por ejemplo, 100 minutos).

Ahora supongamos que obtenemos una muestra aleatoria simple de n personas y observamos cuánto ven la TV. La media en esta primera muestra debería ser similar a la media de la población (400), pero seguramente no será exacta. Podría ser 380, por ejemplo. A continuación, obtenemos una segunda muestra y resulta una media de 415. Y una tercera, y una cuarta… Y así sucesivamente. La secuencia podría ser algo así.

Muestra 1 -> Media observada 380

Muestra 2 -> Media observada 415

Muestra 3 -> Media observada 405

Muestra 4 -> Media observada 394

...

Lo que nos dice el teorema central del límite es que estas medias que observamos en las muestras de n individuos forman a su vez una distribución de probabilidad Normal. La media de esta distribución de medias coincide con la media de la población original, que llamaremos μ. Y la desviación de esta distribución de medias es igual a la desviación original (que llamaremos σ) dividida por √n. Es decir, σ/√n.Y esta es la razón por la que cuanto mayor es el tamaño de una muestra, más precisa es la estimación: la distribución de medias está más concentrada en torno a la media de la población y por lo tanto es más probable que la media de la muestra se acerque a la media de la población.

El siguiente esquema te puede ayudar a entender el teorema central del límite.

muestreo_esquema-1

El teorema central del límite funciona aunque la población original no se distribuya de forma Normal. Se cumple para cualquier distribución. Al final, las medias de las muestras sí se distribuyen de forma Normal. Y esto es lo que nos permite medir y acotar el error de nuestras estimaciones.

 

Margen de error y nivel de confianza

Ya sabemos qué podemos esperar si obtenemos muchas muestras de nuestra población. Pero en la práctica, solo tenemos una muestra de tamaño n. Sin embargo, saber que esta muestra forma parte de una distribución de medias nos sirve de ayuda.

Una distribución Normal tiende a estar concentrada en torno a la media. Y sabemos en qué medida. Por ejemplo, sabemos que en el 90% de los casos, la media de la muestra va a estar en un intervalo μ±1.645σ/√n. O que en el 95% de los casos, la media va a estar en un intervalo μ±1.96 σ/√n.

La relación entre “el 90% de los casos” (conocido como el nivel de confianza) y el valor “1.645”(conocido como Z-score) es una propiedad de la distribución Normal. Podemos fijar otros niveles de confianza. Habitualmente se usan niveles de confianza (NC) de 80%, 90%, 95% y 99%, a los que corresponde los Z-scores 1.282, 1.645, 1.960 y 2.576.

 
Nivel de confianza (NC) Z-score
80% 1.282
90% 1.645
95% 1.96
99% 2.576

Por lo tanto, de forma general podemos decir que la media que hemos medido en la muestra (m) cumple lo siguiente:

Probabilidad ( μ-ZNC
σ n
< m < μ+ZNC
σ n
) = NC

La expresión anterior se lee así: la probabilidad de que la media m observada en la muestra esté entre el intervalo definido por la media de la población μ menos el margen de error ZNC×σ/√n y la media de la población más el margen de error ZNC×σ/√n, es NC

Como lo que nosotros queremos estimar es justamente la media de la población μ, podemos transformar la expresión anterior como sigue, cambiando de orden los elementos de la desigualdad:

Probabilidad ( m-ZNC
σ n
< μ < m+ZNC
σ n
) = NC

Para comprender mejor esta expresión, retomemos el ejemplo anterior acerca de la población brasileña. Supón que obtenemos una muestra de n=500 personas, calculamos la media de minutos de TV vistos por esas 500 personas y resulta 415. Y supongamos por el momento que sabemos que la desviación típica en la población no supera los 100 minutos. Podríamos decir

P( 415-1.645
100 500
< μ < 415+1.645
100 500
) = 90%
P( 415 - 7.4 < μ < 415 + 7.4 ) = 90%
P( 407.6 < μ < 422.4 ) = 90%

Gracias al teorema central del límite podemos decir que en un 90% de los casos, la media de consumo de TV de la población brasileña está entre 407.6 y 422.4 minutos. En lugar de dar una estimación puntual (415) estamos dando una estimación, un margen de error (±7.4) y el nivel de confianza que tenemos en que la realidad esté dentro del margen de error (90%).

 

¿Y cómo me ayuda esto a decidir el tamaño de la muestra?

Muy fácil, solo tienes que decidir de antemano cuál es el error máximo que estás dispuesto a aceptar (e) y el nivel de confianza que quieres tener en que ese error no va a ser superado (NC).

Sabiendo que el error máximo es

e ZNC
σ n

solo tenemos que darle la vuelta a esta expresión

n ZNC2
σ2 e2

Volviendo a nuestro ejemplo. Imagina que no hemos hecho la encuesta aún, pero queremos tener un nivel de confianza del 90% de que la media que observemos en la muestra no se desvíe de la realidad en más de ±5 minutos. La muestra que necesitamos será de

n =1.6452
1002 52
= 1,082.4 ≈ 1,083

Hemos redondeado al alza (1,082.4->1,083) porque queremos garantizar que no superamos el error de 5 minutos, pero es un detalle sin mucha importancia. Observa que la muestra resultante es mayor a la anterior de 500 individuos, porque el error máximo que pedimos (5) es más pequeño que el que teníamos antes (7.4).

 

¿Y si lo que quiero estimar es una proporción?

Supongamos que en lugar de estimar una media (minutos de TV) quiero estimar una proporción (porcentaje de fumadores). En este caso el problema es más sencillo, podemos simplificar las fórmulas anteriores de forma muy conveniente.

Llamemos p al porcentaje de fumadores en el total de la población brasileña. En este caso, la población se distribuye siguiendo una distribución de Bernoulli: una proporción p de la población fuma (fumar=1) y una proporción 1-p no fuma (fumar=0). Esta distribución es extremadamente simple y tiene una desviación típica σ=√p(1-p). Por lo tanto, el tamaño de la muestra que garantiza un error máximo e es

n =ZNC2
p(1-p) e2

Podemos simplificar un poco más esta expresión. Antes de hacer la encuesta no sabemos qué proporción de fumadores vamos a encontrar (para eso hacemos la encuesta). Pero sí podemos ponernos en el peor caso. Observa que la cantidad p(1-p) resulta 0 tanto si p=0 como si p=1. Es decir, si todo el mundo fuma o no fuma, la muestra que necesitamos es prácticamente nula. El peor caso se produce cuando la población es lo más diversa posible (p=0.5), es decir, cuando la mitad de la gente fuma.

Si uso este escenario pesimista, resulta

n =ZNC2
1 4e2

A diferencia del caso en el que estimábamos minutos de TV vistos, no necesitamos hacer ninguna hipótesis sobre la desviación típica de la población de origen, porque podemos usar el peor caso: la máxima desviación posible en una proporción.

¿Cómo se usa esta fórmula? Supón que queremos hacer una encuesta entre brasileños para estimar qué porcentaje de la población fuma y estamos dispuestos a aceptar un error máximo del 5% con un nivel de confianza del 90%. Resulta

n =1.6452
1 4 × 0.052
= 271

Solo necesitamos encuestar a 271 personas. Importante: el error se define en términos absolutos. Es decir, si observamos un 40% de fumadores, tendremos un 90% de confianza de que la proporción real en la población esté entre 40%-5% y 40%+5% (no entre 40%×0.95 y 40%×1.05).

 

¿Y si la población no es infinita?

Se acostumbra a aceptar que una población con más de 100,000 individuos es infinita (algunos autores consideran 50,000 como el mínimo exigible). En general, en investigación de mercados las poblaciones objeto de estudio suelen cumplir este requisito. Pero en determinados casos podemos tener poblaciones pequeñas. Por ejemplo, una encuesta a empleados de una empresa.

En estos casos las fórmulas que hemos visto deben modificarse un poco. Te ayudamos a entender el porqué. Imagina un caso muy extremo en el que solo hay 10 personas en la población, la mitad fumadores y la otra mitad no fumadores. Y quieres una muestra de 2 personas.

Inicialmente, tienes un 50% de probabilidad de que el primer individuo de tu muestra sea fumador. Seleccionas un individuo y fuma. La probabilidad de que el segundo individuo sea fumador ya no es 50%, porque quedan solo 4 fumadores entre los 9 individuos no seleccionados. Ahora la probabilidad de que selecciones un fumador es 4/9=44%. La probabilidad de que fumen los individuos a seleccionar depende de los ya seleccionados.

Esta dificultad la puedes obviar cuando la población es de cientos de miles de individuos: el hecho de que los que vayas seleccionando fumen o no, apenas afecta a la probabilidad de los restantes. Pero con muestras finitas debes tenerlo en cuenta.

En este post no entraremos en detalle, pero con poblaciones finitas necesitas aplicar un factor corrector al tamaño de la muestra. En concreto

nfin = ninf 1 + ninf - 1 N

Donde ninf es el tamaño de muestra que obtendríamos si aceptásemos la hipótesis de población infinita y N el tamaño finito de la población.

Relación entre error, nivel de confianza y tamaño de muestra

Recuerda que margen de error, nivel de confianza y tamaño de la muestra siempre van de la mano. Modificar cualquiera de los 3 parámetros, altera los restantes:

1. Reducir el margen de error obliga a aumentar el tamaño de la muestra.
2. Aumentar el nivel de confianza obliga a aumentar el tamaño de la muestra.
3. Si aumenta el tamaño de mi muestra, puedo reducir el margen de error o incrementar el nivel de confianza.


¿Necesitamos hacer estos cálculos?

No, por eso disponemos de una calculadora que hace todo el trabajo por ti. Si estás tratando de estimar una proporción, sólo debes saber que el parámetro "nivel de heterogeneidad" es esta proporción esperada y que, en ausencia de información, deberás indicar un valor de 50%, como hemos hecho en este post.

Si lo que necesitas estimar es el tamaño de una muestra para calcular una media o hacer otro cálculo más complejo, te invitamos a que visites la sección de calculadoras avanzadas.

Esperamos haberos ayudado a interpretar el uso de nuestras calculadoras de muestras. 

-------

Respondiendo a una pregunta habitual de los lectores de este post: la primera persona que formuló el cálculo del tamaño de la muestra en estos términos fue William G. Cochran.

 

 

Free ebook - The essentials online data collection

 

Carlos Ochoa

About the author

Carlos Ochoa | Chief Client Officer

FREE EBOOK

The essentials of online data collection

Download ebook

Netquest Blog Archives

Search and discover over last years latest market research topics.

View the archives

Suscribete a nuestro blog

Recibe las últimas noticias en tu email.

Subscribe to our blog

netquest-blog-suscription-shape-illustration

Hey!

It looks that you are enjoying what you've been reading

Want to read more?

Hey!

It looks that you are enjoying what you've been reading

Want to read more?

Have access to more genuine content, subscribe to our blog.

I'm already subscribed. Close