June 12, 2015 | Carlos Ochoa

Muestreo no probabilístico: muestreo por cuotas

Llegamos al fin, en nuestra serie de posts dedicada al muestreo, al método estrella entre los muestreos no probabilísticos: el muestreo por cuotas. Esta técnica es la que suele usarse en investigación online a través de paneles. Podemos ver el muestreo por cuotas como la versión no probabilística del muestreo estratificado. Consta de tres fases:

 

1. Segmentación

En primer lugar, dividimos la población objeto de estudio en grupos de forma exhaustiva (todos los individuos están en un grupo) y mutuamente exclusiva (un individuo sólo puede estar en un grupo), de forma similar a la división en estratos empleada en el muestreo estratificado. Normalmente esta segmentación se hace empleando alguna variable sociodemográfica como sexo, edad, región o clase social.

2. Fijamos el tamaño de las cuotas

A continuación, fijamos el objetivo de individuos a encuestar para cada uno de estos grupos. Normalmente definiremos estos objetivos de forma proporcional al tamaño del grupo en la población. Por ejemplo, si hemos definido unos segmentos por sexo en una población en la que hay un 60% de mujeres y un 40% de hombres, y queremos obtener una muestra de 1.000 personas, definiremos un objetivo de 600 mujeres y 400 hombres. Estos objetivos se conocen como cuotas. En este ejemplo, tendríamos una cuota por sexo de 600 mujeres y 400 hombres. En ocasiones se definen cuotas no proporcionales a la población, por ejemplo para poder profundizar en el análisis de un grupo específico.

3. Selección de participantes y comprobación de cuotas

Por último, se buscan participantes para cubrir cada una de las cuotas definidas. En este punto es donde nos alejamos de un muestreo probabilístico: en el muestreo por cuotas aceptamos que la selección de individuos no sea aleatoria, puede ser una selección mediante muestreo por conveniencia. Por ejemplo, en un estudio en el que hayamos definido una cuota de 100 personas menores de 25 años y 100 personas de 25 o más años, podríamos salir a la calle y abordar a las personas que encontramos a nuestro paso, preguntarles su edad y encuestarlas si no hemos cubierto nuestro objetivo.

 

muestreo-segmentacion

 

De acuerdo a la descripción anterior, la diferencia entre el muestreo estratificado y el muestreo por cuotas está en la forma en que selecciono participantes. En el muestreo estratificado dispongo de una lista de posibles entrevistados, todos ellos con una cierta probabilidad (conocida) de ser seleccionados. En el muestreo por cuotas no. Voy obteniendo candidatos a formar parte de la muestra de forma no aleatoria y voy comprobando antes de entrevistar si son válidos para mi estudio (es decir, si puede formar parte de una de mis cuotas o ya he excedido mi objetivo). Cuando debo descartar a un posible participante por efecto de una cuota (es la mujer 101 cuando mi cuota es de 100 mujeres), hablamos de un individuo descartado por ser quota-full.

 

La elección de variables

La pregunta que nos podemos plantear es: ¿qué variables debo escoger en un muestreo por cuotas? ¿cómo segmento la población? Esta cuestión es un factor clave en este técnica.

Pensemos cual es la finalidad de usar cuotas: es  lograr que la muestra sea lo más representativa posible del universo estudiado. Cuando definimos cuotas por sexo y edad en una muestra, lo que garantizamos es que, independientemente de que el método de selección de individuos no sea puramente aleatorio, al menos la muestra va a guardar unas proporciones idénticas al universo en cuanto a sexo y edad.

Visto desde este punto de vista, debemos elegir para definir cuotas aquellas variables que cumplan dos condiciones: (1) que más puedan verse alteradas respecto a la población por el proceso de selección no aleatorio que empleamos, y (2) que más puedan incidir en el dato que queremos medir.

 

Veamos los dos criterios anteriores en un ejemplo concreto: una muestra obtenida de un panel online. Supongamos que queremos medir a través de una muestra extraída de un panel online el % de personas que fuman en una población . ¿Qué variables deberíamos seleccionar para definir cuotas?

De entrada, aquellas variables que pensemos que pueden aparecer distorsionadas por el hecho de seleccionar la muestra en un panel online respecto a la población: por ejemplo la edad (en los paneles online suele haber mayor proporción de jóvenes que en la población) y clase social (los paneles tienen dificultades para captar personas de clases bajas, especialmente en América Latina).

Podríamos prescindir de cuotas de región. Los paneles online no suelen captar en una región concreta, sino que captan a través de medios online que son accesibles desde cualquier región. Salvo que estemos en un país con grandes diferencias entre regiones a nivel socioeconómico, no sería necesario. Si, además, no esperamos que haya diferencias en el hábito de fumar por regiones, no tendría ningún beneficio forzar una cuota de este tipo.

Si atendemos al segundo criterio (cuotas que puedan afectar al resultado medido), podríamos optar por añadir una cuota de sexo: el hábito de fumar suele variar entre hombres y mujeres y, salvo que trabajemos con un panel en el que nos garanticen que la composición por sexo es perfecta, es recomendable controlar esta cuota también.

 

Muestreo por cuotas y representatividad

El uso de cuotas en un muestreo no probabilístico no nos va a permitir transformarlo en probabilístico. Seguiremos sin poder calcular el margen de error y el nivel de confianza sobre los resultados. Es decir, el uso de cuotas no nos permite medir el grado de precisión de nuestros resultados.

 

muestreo-cuotas

 

¿Significa esto que es lo mismo usar o no usar cuotas? ¿Es el muestreo por conveniencia es equivalente al muestreo por cuotas? La respuesta es NO. El uso de cuotas pone cierto control a los sesgos que pueden producirse por el método de selección empleado, nos garantiza que en una serie de variables clave vamos a reproducir la composición de la población en nuestra muestra. El problema es que, pese a que es una práctica común por parte de muchos investigadores, no vamos a poder afirmar cuan representativa es nuestra muestra. Las cuotas mejoran la representividad, pero no sabemos cuánto.

Pese a todo, el muestreo por cuotas es uno de los métodos de muestreo más populares y prácticamente el único método viable cuando hacemos investigación online (salvo que contemos con un panel probabilístico). Usar cuotas es un sistema efectivo y económico de obtener muestras que proporcionan información relevante.

 

Ventajas e inconvenientes

La principal ventaja del muestreo por cuotas es que ofrece resultados útiles a un coste efectivo y, si se han elegido correctamente las variables sobre las que segmentar, dichos resultados suelen ser fiables.

Los principales inconvenientes son dos: (1) la imposibilidad de acotar el error que estamos cometiendo al usar este tipo de muestreo y (2) el riesgo de obviar una cuota relevante en un estudio. Por ejemplo, si en un estudio electoral no fijamos una cuota por regiones y resulta que la tendencia de voto es muy diferente en unas regiones respecto a otras, los resultados globales estarán fuertemente distorsionados.

Errores frecuentes al usar cuotas en Internet

El muesteo por cuotas es muy popular. La mayor parte de estudios telefónicos y personales, ante la falta de un marco muestral preciso (como podría ser un censo de población) emplean cuotas para asegurar un nivel de representatividad aceptable. Esta técnica también predomina en estudios online a través de paneles. Sin embargo, el medio online tiene sus particularidades y es frecuente que algunos investigadores no las tengan en cuenta, limitándose a reproducir técnicas empleadas en medios offline. Esta práctica puede producir resultados de menor calidad y en algunos casos mayores costes.

 

Algunos ejemplos:

Cuotas geográficas

 

cuota-geografica

 

* En offline... la región del respondiente es una variable clave a controlar cuando hacemos encuestas personales, por razones obvias. Si los encuestadores están en una ciudad, todos los respondientes serán de esa ciudad. Es por ello que la región es una cuota clave. También es habitual limitar la muestra a unas cuantas ciudades, las más importantes de cada país, para reducir el coste.

* En online... la región no es tan importante, es simple encontrar personas de diferentes ciudades. No tiene un sobre-coste encuestar gente de una o de diez ciudades. Por ello, si el factor geográfico no es clave, podríamos no controlar las cuotas geográficas. Si es importante, podemos fijar cuotas para obtener respuesta de todas las regiones, no de unas pocas ciudades. De esta forma, obtendremos mejores datos y a menor coste, ya que podemos usar todo el panel para obtener resultados.

 

Cuotas por clase social

* En offline...la clase social no suele considerarse una cuota clave en los países europeos y en Norteamérica, al menos no en todos los estudios. Las diferencias entre clases sociales existen pero no son tan profundas como en otras regiones como Latinoamérica. Justamente en esta última zona, al recolectar los datos mediante entrevista personal, las clases sociales altas son de difícil acceso mientras que las clases sociales bajas son más simples de obtener.

* En online... la clase social es más relevante que en offline, especialmente en países con una adopción de Internet media o baja. Curiosamente, en estos países la situación en Internet es inversa a la situación offline: es más fácil acceder a clases altas en Latinoamérica a través de Internet y es muy difícil acceder a clases bajas.

 

Cuotas por sexo y edad

* En offline...sexo y edad son variable típicas a controlar mediante cuotas. En campo personal no suelen dar muchos problemas, mientras que en campo telefónico es más sencillo acceder a mujeres que a hombres, y a personas mayores frente a jóvenes. Con la irrupción del móvil el problema se ha agravado: los jóvenes apenas usan el teléfono fijo.

* En online... ambas variables deben controlarse, igual que en offline. Los paneles online acceden más fácilmente a gente joven, especialmente en la franja de los 20 a 35 años. También es habitual que los paneles recluten más mujeres que hombres, porque son más demandadas para estudios de mercado, por lo que es necesario controlar la variable sexo.

 

Os esperamos en el próximo post de esta serie, que dedicaremos a la técnica conocida como bola de nieve.

ÍNDICE: Serie Muestreo

  1. El muestreo: qué es y por qué funciona
  2. Muestreo probabilístico o no probabilístico
  3. Muestreo probabilístico: muestreo aleatorio simple
  4. Muestreo probabilístico: muestreo estratificado
  5. Muestreo probabilístico: muestreo sistemático
  6. Muestreo probabilísitico: muestreo por conglomerados
  7. Muestreo no probabilístico: muestreo por conveniencia
  8. Muestreo no probabilístico: muestreo por cuotas
  9. Muestreo no probabilístico: muestreo por bola de nieve
Carlos Ochoa

About the author

Carlos Ochoa | Marketing and Innovation Manager

FREE EBOOK

The essentials of online data collection

Download ebook

Netquest Blog Archives

Search and discover over last years latest market research topics.

View the archives

Suscribete a nuestro blog

Recibe las últimas noticias en tu email.

Subscribe to our blog