Muestreo probabilístico o no probabilístico

Vimos en un post reciente qué es el muestreo y qué ventajas nos ofrece cuando queremos estudiar una población. Hoy veremos las dos grandes familias de técnicas de muestreo existentes: las técnicas de muestreo probabilístico y no probabilístico. Para ello, empezaremos definiendo el concepto de marco muestral.

 

Marco muestral

Un marco muestral es una lista de todos los elementos que componen el universo que queremos estudiar y de la cual se extrae la muestra. Estos elementos a investigar pueden ser individuos, pero también pueden ser hogares, instituciones o cualquier otra cosa susceptible de ser investigada. Cada uno de estos elementos presentes en el marco muestral se conoce como unidades muestrales

 

Pongamos un ejemplo. Supongamos que queremos medir la satisfacción de los clientes de una empresa. Para poder generar un marco muestral, podríamos acceder al sistema informático de la misma y extraer una lista de todas las personas que han contratado algún producto o servicio en el último año. Cada una de las personas de esa lista serían unidades muestrales. Seleccionando un conjunto de estos clientes, obtendríamos una muestra.

 

La proporción entre el tamaño de la muestra y el tamaño del marco muestral se conoce como fracción muestral. Ésta, junto con el tamaño del marco muestral, definen la precisión de los resultados que que obtenemos cuando analizamos la muestra.

 

 

Muestreo probabilístico

Hablaremos de muestro probabilístico siempre que se cumplan dos condiciones:

 

  1. Todos los elementos de la población tienen una probabilidad mayor a cero de ser seleccionados en la muestra.

  2. La probabilidad de inclusión de cada elemento en la muestra se conoce de forma precisa. 

 

El cumplimiento de ambos criterios es el que hace posible obtener resultados no sesgados cuando se estudia la muestra y determinar el grado de incertidumbre que añade el proceso de muestreo. En ocasiones, estos resultados no sesgados requieren usar técnicas de ponderación (weighting), pero esta ponderación es posible precisamente porque se conoce la probabilidad de que cada individuo sea seleccionado en la muestra. Las muestras generadas en estas condiciones se conocen también como muestras probabilísticas.

 

La definición anterior nos lleva a concluir que sólo podemos hacer muestreo probabilístico si se dispone de un marco muestral. El censo de un país, el conjunto de direcciones de hogares en una población o la lista de clientes de una empresa, son ejemplos de marcos muestrales que hacen posible un muestreo probabilístico. En cada uno de estos casos, el universo a estudiar es diferente: habitantes de un país, hogares de una población y clientes de una empresa, respectivamente.

 

Una tenemos un marco muestral, la forma exacta en que se utiliza para seleccionar la muestra define las diferentes técnicas de muestreo probabilístico: muestreo aleatorio simple, muestreo sistemático, muestreo estratificado, muestreo por conglomerados...

 

 

Muestreo no probabilístico

Sin embargo, no es sencillo cumplir con los requisitos propios de un muestreo probabilístico:

 

  1. Disponer de un marco muestral es algo relativamente poco habitual en estudios de mercado. ¿Qué empresas pueden tener listados de toda población?

  2. Lograr que todos los individuos de la población tengan una probabilidad no nula de ser seleccionados es un requisito igualmente exigente, más aún conocer la probabilidad de inclusión exacta de cada unidad muestral. Todos los individuos que no pueden ser seleccionados en una muestra se suelen referir como unidades fuera de cobertura.

 

Por todas estas razones, así como por razones de coste, los investigadores recurren con frecuencia a otras técnicas de muestreo, agrupadas dentro de lo que se conoce como muestreo no probabilístico. En estas técnicas alternativas, es habitual seleccionar elementos para la muestra basándose en hipótesis relativas a la población de interés, lo que se conoce como criterios de selección. Por ejemplo, seleccionar una muestra buscando individuos por la calle, tratando de que la mitad sean hombres y la mitad mujeres (coincidiendo con la distribución que se supone en la población) sería un criterio de muestreo no probabilísitico.

 

En estos casos, debido a que la selección de las unidades de la muestra no es aleatoria, cuando hablamos de muestreo no probabilístico no deberíamos incluir estimaciones de error. Dicho de otra forma, una muestra no probabilística nos informa de cómo es un universo pero no nos permite saber con qué precisión: no podemos establecer unos márgenes de error y unos niveles de confianza.

 

Algunas técnicas de muestreo de este tipo son:

 

  • Muestreo por conveniencia.
  • Muestreo secuencial.
  • Muestreo por cuotas.
  • Muestreo discrecional.
  • Muestreo por bola de nieve.

 

Error de muestreo

Tal y como hemos indicado, no es posible conocer qué margen de error vamos a tener en un estudio (por ejemplo, los resultados de una encuesta) cuando empleamos muestreo no probabilístico. Esto incluye encuestas en las que se ha seleccionado personas por la calle, entrevistándolas cara a cara, haciendo llamadas telefónicas al azar o a través de una muestra obtenida en un panel online.

 

En ninguno de estos casos se cumplen los criterios exigidos por el muestreo probabilístico: tener un marco muestral con unidades para las que puedo calcular la probabilidad de que sean seleccionadas en mi muestra. En encuestas cara a cara por la calle no tengo el listado de individuos que componen el universo. En la encuesta telefónica, aunque disponga de un listado telefónico, no todos los individuos tienen un teléfono fijo o aparecen en las guías telefónicas públicas. En el caso de un panel online, las personas que no acceden a internet no pueden ser seleccionadas y tienen probabilidad de inclusión nula.

 

Sin embargo, es habitual encontrar estudios hechos con estas técnicas que indican margen de error y nivel de confianza. Es una práctica formalmente incorrecta, pero que suelen usar los investigadores con el objetivo de dar una indicación de la influencia que tiene el tamaño muestral empleado en la precisión de los resultados. Debería leerse como "si esta muestra fuese probabilística, ofrecería un margen de error X".

 

A este respecto, hay diversidad de opiniones sobre la bondad de indicar el margen de error en estas circunstancias, como se puso de manifiesto en un debate descrito en el siguiente post.

 

En próximos posts veremos cada una de las técnicas de muestreo: cómo son, para qué se utilizan y qué resultados ofrecen.

 

ÍNDICE: Serie Muestreo

 

  1. El muestreo: qué es y por qué funciona

  2. Muestreo probabilístico o no probabilístico

  3. Muestreo probabilístico: muestreo aleatorio simple

  4. Muestreo probabilístico: muestreo estratificado

  5. Muestreo probabilístico: muestreo sistemático

  6. Muestreo probabilístico: muestreo por conglomerados

  7. Muestreo no probabilístico: muestreo por conveniencia

  8. Muestreo no probabilístico: muestreo por cuotas

  9. Muestreo no probabilístico: muestreo por bola de nieve

¡Suscríbete a nuestro boletín de noticias para recibir actualizaciones exclusivas y las últimas noticias!