C√≥mo un padre descubre el embarazo de su hija gracias al ‚Äútargeting‚ÄĚ

Escrito por Carlos Ochoa el 19 de diciembre 2014

La publicidad en Internet está en ebullición. La disponibilidad de enormes cantidades de datos de usuarios (big data), los grandes avances en algoritmos predictivos y la mayor predisposición de los consumidores a comprar a través de Internet contribuyen a ello.

Una curiosa anécdota acerca de cómo un site de e-commerce se percató de que una chica estaba embarazada antes de que lo hiciese su padre, ilustra perfectamente cómo está cambiando la publicidad online.

 

publi-internet-embarazo

 

La publicidad e Internet

Antes de entrar en materia, una breve reflexión acerca de la publicidad online.

La publicidad apareció en Internet tan pronto como la Red pasó de ser un sistema de comunicación entre profesionales para ser un medio de difusión al alcance de todo el mundo.

En una √©poca con un escaso desarrollo del comercio electr√≥nico, Internet estaba dominado por medios de comunicaci√≥n ansiosos de rentabilizar sus contenidos. Era la¬† √©poca de los ‚Äúportales web‚ÄĚ. La publicidad online era una de las escasas v√≠as de obtenci√≥n de ingresos online. Se desarrollaron los primeros formatos publicitarios, los banners est√°ticos, que con el tiempo dar√≠an lugar a nuevos formatos m√°s sofisticados e interactivos, el video, el flash‚Ķ

 

Un copia de la publicidad offline

Como en tantas otras industrias, la migración online de la publicidad estuvo dominada por los modelos imperantes en el mundo offline.

La publicidad tradicional se caracteriza por el aislamiento entre el medio de contacto con el consumidor y su proceso de compra. Mostramos un anuncio en TV para lograr convencer a una persona de que compre un coche y luego, ¬Ņc√≥mo sabemos si finalmente el usuario impactado ha decidido comprar? Ese ha sido siempre el gran reto de la investigaci√≥n publicitaria, medir el efecto f√≠sico de la publicidad, transformar inversi√≥n publicitaria en resultados de venta.

La publicidad online ha seguido un camino similar hasta ahora. Eran pocos los sites que lograban materializar la venta online. Por ello se desarrollaron modelos publicitarios en los que se buscaba que el usuario impactado facilitase alg√ļn tipo de feedback, completando alg√ļn formulario para recibir informaci√≥n, o entranado en un sorteo…

 

Bienvenidos al e-commerce

Sin embargo, las cosas han¬†cambiado en los √ļltimos a√Īos. Amazon ya no est√° sola vendiendo libros en Internet. Los consumidores cada d√≠a est√°n m√°s dispuestos a comprar por Internet todo tipo de productos. Las principales cadenas de distribuci√≥n tienen su versi√≥n online, las¬†marcas de moda ya apuestan decididamente por vender a trav√©s de Internet, como H&M, Zara o Mango. Nuevos players de e-commrece como Privalia o Zalando irrumpen en escena.

La publicidad est√° evolucionando para dar respuesta a esta realidad. Ahora es posible medir la rentabilidad final de una campa√Īa y obtener un feedback preciso de qu√© √©xito obtengo mostrando¬†cada publicidad a¬†cada persona.

 

targeting-publicidad-internet

Targeting

Hablamos de ‚Äútargeting‚ÄĚ para referirnos a la capacidad de mostrar a un usuario de Internet la publicidad que m√°s probabilidad de √©xito tiene de lograr un impacto positivo y su consecuente venta online.

A medida que navegamos por Internet vamos dejando un rastro de información que permite a las grandes redes publicitarias (incluyendo Google, por supuesto) hacer un retrato robot de nosotros. Cada vez que consultamos una noticia, entramos en una página para mirar información de un producto o buscamos una palabra en un buscador, estamos ayudando a forjar una imagen más precisa de nosotros mismos.

Los anunciantes procesan esa información mediante algoritmos predictivos que optimizan la posibilidad de que una publicidad nos interese y genere una compra. Y su capacidad de acierto es asombrosa

 

“Le informamos de que su hija est√° embarazada”

Un ejemplo ilustrativo de estas técnicas hace referencia a la empresa de e-commerce Target.

Target lleva tiempo contando con estadísticos para procesar toda la información que sus consumidores generan en las visitas a su página web, con el fin de poder dirigirles ofertas personalizadas y cupones de descuento que incrementen el gasto por consumidor.

Uno de sus √ļltimos proyectos, a cargo de Andrew Pole, fue tratar de identificar mujeres en sus primeros meses de embarazo. Se trata de un perfil¬†con un enorme potencial de consumo, clave para una empresa como Target.

Pole pronto vio que el proyecto era viable. Las mujeres embarazadas acostumbran a consumir cantidades mayores de lo habitual de ciertos productos, como lociones o suplementos dietéticos. El equipo de Target identificó 25 productos que, analizados conjuntamente, permitían hacer predicciones realmente fiables para identificar mujeres embarazadas e incluso la fecha prevista del nacimiento.

El resultado del proyecto queda ilustrado con una an√©cdota. Un consumidor se dirigi√≥ indignado a una tienda f√≠sica de Target, quej√°ndose de que la empresa estaba enviando cupones por correo con productos para beb√©s, cuando su hija apenas era una adolescente y se encontraba estudiando en el instituto. ¬ŅAcaso estaba Target tratando de animar a su hija para que se quedase embarazada?

El responsable del local se disculpó inmediatamente, sin entender bien qué había pasado. La sorpresa saltó cuando, pasados unos días, hicieron una llamada al papá indignado para asegurarse de que el malentendido había quedado resuelto, y esta vez fue el padre el que tuvo que disculparse: efectivamente, su hija estaba embarazada, y Target se había percatado antes que él mismo.

 

Privacidad y ética

Seguro que al leer esta noticia has pensado en la cuestión de la privacidad. Aunque un anunciante no sepa tu nombre y apellidos, simplemente identificándote como un individuo anónimo al cual vincular todas las actividades que haces en internet, puede llegar a saber mucho más que tu nombre.

Esta es una de las razones por las que existen varias iniciativas legislativas para limitar el uso de cookies y otros elementos de rastreo para mejorar la eficacia publicitaria. O, por lo menos, para obligar a informar al usuario de manera que sea plenamente consciente del uso que se está dando a su información, tanto aquella que da como aquella que es observada.

Estos conflictos entre anunciantes y consumidores afectan de pleno a la investigaci√≥n online. Empresas como Netquest, que vivimos de la confianza de los consumidores que aceptan participar en proyectos de investigaci√≥n, somos las m√°s interesadas en lograr un sistema transparente en el que el consumidor sea due√Īo en todo momento de su informaci√≥n. Y, por supuesto, que sea recompensado adecuadamente por compartirla.

Categoría: Big data Trackback | Comentarios(0)

Cápsula 7: Programación de cuestionarios Conjoint

Escrito por Carlos Ochoa el 18 de diciembre 2014

Ya hemos visto c√≥mo podemos dise√Īar un experimento Conjoint. Debemos abordar el siguiente paso: transformar el dise√Īo en un cuestionario online que nos permita registrarlas preferencias de los consumidores de forma fiable. Veamos c√≥mo podemos lograrlo.

Tipos de software

software-conjoint

 

Para programar un cuestionario Conjoint necesitamos un software de encuestas online. Podemos clasificar los softwares en 3 categorías.

  • Softwares no aptos:

Los softwares tradicionales de encuestas online sólo permiten programar estudios Conjoint muy simples. Estos softwares construyen cuestionarios pregunta por pregunta. Suelen ser aplicaciones fáciles de usar, pero limitados. Un cuestionario Conjoint puede contener cientos de preguntas posibles, aunque un respondiente concreto sólo vaya a ver unas pocas de ellas (entre 10 y 20 típicamente)

Estos softwares también presentan otra dificultad: el fichero de resultados contiene información de todas las posibles preguntas del cuestionario,    aunque la mayoría de preguntas no tienen respuesta ya que sólo las han visto unos pocos respondientes. Estos ficheros son inmanejables.

  • Softwares especializados:

Es posible encontrar en el mercado software de encuesta online espec√≠ficamente dise√Īado para llevar a cabo estudios Conjoint. Este tipo de software suele incluir tambi√©n la capacidad de dise√Īar experimentos y realizar el an√°lisis, constituyendo una soluci√≥n integral para este tipo de estudio.¬†Realizar estudios Conjoint con este tipo de software es c√≥modo y potente.Sin embargo, al ser soluciones espec√≠ficas para Conjoint, tienen serias limitaciones para implementar otro tipo de cuestionarios: pueden o admitir ¬† ¬†cierto tipo de preguntas, tener limitaciones visuales, etc.

Cuando un proyecto requiere un cuestionario convencional junto a un Conjoint, en ocasiones es recomendable programar ambos cuestionarios en    softwares diferentes. Esto dificulta la gestión técnica y la transición entre cuestionarios puede generar problemas a los respondientes.

  • Softwares programables:

Son softwares de encuestación online avanzada. Pueden funcionar como un software convencional, editando preguntas simples individuales, o pueden emplearse en modo programador para crear cuestionarios sofisticados.

Este tipo de software es especialmente adecuado para ser empleado en estudios Conjoint. En realidad, un estudio Conjoint es una √ļnica ¬† pregunta que se muestra repetidas veces, mostrando cada vez los productos que corresponda en funci√≥n de la versi√≥n del dise√Īo asignada al respondiente y el set en el que nos encontremos. El software programable de encuestas permite gestionar un Conjoint mediante una pregunta iterativa que lee la informaci√≥n a mostrar del dise√Īo que le proporcionemos.

El inconveniente de este tipo de software es que requiere un usuario avanzado que sepa programarlos convenientemente. No es apto para cualquier tipo de usuario.

 

La importancia visual

comunicacion-visual

 

Una encuesta tipo Conjoint muestra a los respondientes un conjunto de productos, cada uno con sus atributos correspondientes, para que el encuestado elija la opción que prefiere. La forma en que presentamos los productos es de capital importancia.

Es frecuente ver softwares especializados para estudios Conjoint que muestran los productos como unas cajas de texto con una enumeración de atributos en su interior. Si la cantidad de atributos y la cantidad de texto descriptivo por atributo es grande, la pregunta puede resultar muy poco visual, propiciando que el encuestado no preste atención a la encuesta.

Que un encuestado no preste atenci√≥n a la encuesta siempre es un problema. En estudios Conjoint, a√ļn lo es m√°s. Pensemos que queremos detectar qu√© atributos son m√°s relevantes en las decisiones de los encuestados. Si estos no leen con detenimiento los productos mostrados, la informaci√≥n que recolectamos ser√° poco fiable.

Algunos aspectos a tener en cuenta:

  1. Emplea un dise√Īo atractivo, a ser posible utiliza im√°genes (logos, descripciones gr√°ficas de productos) y reduce la extensi√≥n del texto a la m√≠nima expresi√≥n.
  2. Facilita la respuesta. Por ejemplo, permite al respondiente indicar su producto preferido haciendo clic sobre él, sin necesidad de localizar un botoncito en el pie del producto.
  3. Facilita feedback. Una vez seleccionado, debe ser evidente cuál es el producto que ha quedado seleccionado. Debe ser posible cambiar de opción.
  4. Recuerda que el mundo es m√≥vil. No des por hecho que el participante va a acceder al cuestionario online desde un PC, podr√≠a hacerlo desde un m√≥vil. El cuestionario debe adaptarse convenientemente al tama√Īo de la pantalla y debe seguir funcionando correctamente.
  5. Explora nuevos formatos. Para ciertos estudios, especialmente si tiene mucha cantidad de informaci√≥n por producto, puede ser bueno probar nuevos formatos tipo ‚Äúarrastrar y dejar‚ÄĚ que promuevan la parte l√ļdica de la encuesta.

A continuación te mostramos ejemplos de formatos de pregunta Conjoint, desde un formato más clásico a uno más interactivo.

 

El resultado

Hemos visto que existe una forma conveniente de describir un dise√Īo experimental Conjoint, mediante una matriz num√©rica. Del mismo modo, es posible recolectar los resultados de un estudio Conjoint de diferentes maneras. Te mostramos aqu√≠ la m√°s habitual. Esta forma es especialmente adecuada para ser analizada posteriormente.

Recuperemos el dise√Īo experimental de ejemplo que vimos en el post V.

matriz-conjoint

 

En este dise√Īo tenemos dos versiones de cuestionario, cada una con 9 sets de 3 alternativas. Un respondiente, cuando accede al cuestionario, es asignado a una de las versiones. A partir de ese momento, ir√° viendo los diferentes sets y para cada uno de ellos indicar√° cual de las alternativas contenidas en el set es su preferida.

A continuaci√≥n ver√° un ejemplo de fichero de resultados con la respuesta de 3 individuos, los dos primeros asignados a la versi√≥n 1 del cuestionario, el √ļltimo asignado a la versi√≥n 2.

fichero-conjoint

Observa que el fichero contiene la siguiente información:

  1. Idrespondiente: es un n√ļmero √ļnico por individuo participante.
  2. Versi√≥n: es la versi√≥n del dise√Īo que ha sido asignada al respondiente cuando ha entrado en el cuestionario.
  3. Set: N√ļmero de pregunta respondida.
  4. Alternativa: N√ļmero de opci√≥n dentro de un mismo set.
  5. Atributos (color, marca, precio): Una columna por cada atributo del producto. Para cad alternativa se indica que niveles de los atributos se incluían.
  6. Selección: Indica un 1 si la alternativa ha sido seleccionada como respuesta. En este ejemplo, cada 3 filas debe haber una de ellas con valor 1.

 

Partiendo de este fichero, podemos emprender la tarea de an√°lisis, ya sea un an√°lisis agregado (que veremos en el post siguiente) o un an√°lisis individual (que veremos en el post IX). Te esperamos.

Categoría: conjoint Trackback | Comentarios(0)

El internet de las cosas y la investigación de mercados

Escrito por Silvia Vi√Īuales el 15 de diciembre 2014

Internet-de-las-cosas“Para 2020,¬†todo estar√° conectado” -Gartner Inc.

Actualmente un 99% de los objetos que nos rodean no est√°n conectados a Internet, pero esta cifra est√° cambiando. Este fen√≥meno se denomina¬†IoT, del ingl√©s Internet of Things o Internet de las cosas, y busca, a trav√©s de microsensores, “despertar” ¬†el mundo f√≠sico para conectarlo con la red y hacer nuestra vida m√°s f√°cil.

Un mundo interconectado

Conforme avanzan las comunicaciones cada vez es m√°s f√°cil contar con conexiones de alta velocidad en casi todas partes; el precio del acceso disminuye¬†y los tel√©fonos inteligentes contin√ļan¬†acaparando el mercado al ver reducido su coste. Por otra parte, cada vez son m√°s los dispositivos incluyen sensores wifi en su mecanismo; desde relojes, art√≠culos textiles, alarmas, coches, c√°maras¬†y un sin fin¬†de nuevos gadgets.

La regla de oro es, “si algo puede conectarse, estar√° conectado” pero, ¬Ņpor qu√© querr√≠amos que todos los aparatos terrestres estuvieran en l√≠nea?. Las posibilidades son infinitas, pongamos un ejemplo del d√≠a a d√≠a: tienes una reuni√≥n, pero hay tr√°fico denso debido a un accidente, por lo que ¬†tu calendario te ofrece una alternativa m√°s r√°pida, y en caso de prever que llegar√°s tarde igualmente, manda un mensaje¬†autom√°ticamente a tu trabajo. O imaginemos¬†que te despiertas a las 6 de la ma√Īana y tu cafetera se sincroniza con tu despertador para que tu espresso¬†est√© listo en cuanto pisas la cocina.

Por otro lado, y pensando a gran escala, otro concepto interesante es el de la aplicación del Internet de las Cosas en la construcción de ciudades inteligentes. Espacios más eficientes en gestión de residuos, comunicaciones, coste energético o calidad de vida a través de sensores localizados, por ejemplo, en la flota de transporte urbano, semáforos, plantas depuradoras y un largo etc.

Aplicaciones a la Investigación de Mercados

 

netquest-internet-of-things

Imagen: Ross Patton / Wired

Es cierto que a√ļn queda mucho por hacer en este campo, pero vayamos un paso por delante y analicemos como este poderoso fen√≥meno puede jugar un papel clave en la obtenci√≥n de datos para los investigadores: podemos usar el IoT para obtener¬†datos directamente a trav√©s de las m√°quinas, gadgets u objetos del d√≠a a d√≠a.

Comenzando a peque√Īa escala, desde el hogar, podr√≠amos conseguir¬†datos instant√°neos y actualizados de los h√°bitos de los consumidores. La cafetera que nombr√°bamos antes no s√≥lo puede comenzar a preparar caf√© a golpe de despertador, sino que revelar√≠a valiosa¬†informaci√≥n acerca de a qu√© hora prefiere nuestra muestra beber caf√©, cu√°l es su variedad favorita o con qu√© frecuencia automatiza este proceso.

Si esa misma persona decide coger el coche, incluir un sensor en su veh√≠culo nos dar√≠a datos¬†sobre cu√°l es su consumo medio, sus rutas m√°s habituales o, incluso, d√≥nde y con qu√© criterios decide repostar. Como √©stas, son muchas las potenciales oportunidades del IoT para la investigaci√≥n de mercados, que podr√≠an ser implementadas en los pr√≥ximos a√Īos. Todas ellas, sin embargo, requieren la aceptaci√≥n expl√≠cita del consumidor para garantizar un uso apropiado¬†de¬†sus datos.

Retos a la vista

Pero, ¬Ņhasta qu√© punto el Internet de las Cosas nos hace la investigaci√≥n m√°s f√°cil? ¬ŅCu√°les son los riesgos y dificultades a los que nos enfrentamos ante una red tan extensa¬†de dispositivos interconectados? Es cierto que el IoT¬†abre la puerta a multitud de posibilidades pero tambi√©n plantea unos cuantos retos a tener en cuenta antes de comenzar a automatizar procesos y conectar tecnolog√≠as.

La seguridad es el primer gran obst√°culo a tener en cuenta cuando tratamos con billones de objetos simult√°neamente conectados. Hay que asegurar que la informaci√≥n transferida no caiga en malas manos y sea objeto de hacking -un punto especialmente importante para grandes compa√Ī√≠as que manejan gran volumen de datos, contrase√Īas e informaci√≥n confidencial.

El segundo gran punto es el de la privacidad y la forma en que se comparten datos; es un tema de candente actualidad hoy en día y cuya importancia podría verse incrementada exponencialmente cuando hablamos de millones de usuarios y dispositivos continuamente intercambiando datos personales.

* * *

En resumidas cuentas, el impacto del Internet of Things sobre nuestras vida plantea¬†una oportunidad √ļnica para el investigador a medida que¬†m√°s y m√°s dispositivos empiecen a interactuar diariamente con nosotros. Sin embargo, antes de aventurarnos a crear ciudades interactivas y adelantar futuros acontecimientos deberemos valorar cuales son las posibilidades reales que este fen√≥meno aporta¬†sin olvidar los costes y los riesgos que la conectividad en masa entra√Īa.

Categoría: Innovaci√≥n | internet Trackback | Comentarios (1)

La escala de Likert: qué es y cómo utilizarla

Escrito por Oriol Llauradó el 12 de diciembre 2014

¬ŅQu√© es?

La escala de Likert tiene el honor de ser uno de los ítems más populares y utilizados en las encuestas.

A diferencia de las preguntas dicotómicas con respuesta sí/no, la escala de Likert nos permite medir actitudes y conocer el grado de conformidad del encuestado con cualquier afirmación que le propongamos.

Resulta especialmente √ļtil emplearla en situaciones en las que queremos que la persona matice¬†su opini√≥n. En este sentido, las categor√≠as de respuesta nos servir√°n¬†para¬†capturar la intensidad de los sentimientos del encuestado hacia dicha¬†afirmaci√≥n.

Ser√≠a un ejemplo de Likert la afirmaci√≥n¬†‚ÄúEstoy satisfecho con los¬†productos¬†de la empresa LexCorp‚ÄĚ y la escala de valoraci√≥n:

(1) Totalmente en desacuerdo

(2) En desacuerdo

(3) Ni de acuerdo ni en desacuerdo

(4) De acuerdo

(5) Totalmente de acuerdo

 

√ćtem de Likert vs escala de Likert

Estrictamente hablando, la pregunta anterior es un ítem Likert. Mientras que si presentamos varios ítems Likert y sumamos las valoraciones del encuestado a cada uno de ellos, obtendremos como resultado una escala de Likert. Importante: solo debemos sumar las valoraciones de aquellos ítems cuyo contenido sea similar entre sí.
sabias_que

 

Tipos de ítem Likert

Podemos utilizar el ítem Likert para medir diferentes actitudes de un encuestado. Por ejemplo, podemos emplearlo para descubrir:

  • El nivel de acuerdo con una afirmaci√≥n.
  • La frecuencia con la que se realiza cierta actividad.
  • El nivel de importancia que se atribuye a un determinado factor.
  • La valoraci√≥n de un servicio, producto, o empresa.
  • La probabilidad de realizar una acci√≥n futura.

 

¬ŅCu√°ntos niveles¬†debe tener el √≠tem?

Entre los investigadores no hay un consenso claro al respecto. Probablemente el √≠tem m√°s utilizado sea el de 5 niveles, pero tambi√©n se utilizan de 4, 7, o 10. Lo que sabemos¬†es que a√Īadir niveles redunda en la obtenci√≥n de unas valoraciones m√°s diversas. Por ejemplo, en un √≠tem de solo 5 puntos, los encuestados suelen evitar las 2 opciones extremas, obteniendo muy poca variaci√≥n (es el conocido como¬†central tendency bias).

Por otro lado, hay estudios que concluyen que, a partir de 8 niveles, los resultados obtenidos son los mismos que con 8,¬†con lo que a√Īadir niveles no redundar√° en una mayor variaci√≥n en los resultados. Parece pues que lo √≥ptimo son los √≠tems con 7 u 8 niveles.

 

¬ŅC√≥mo tratar los resultados?

Una vez terminado el cuestionario, cada √≠tem puede ser analizado separadamente o bien, en determinados casos, las respuestas de un conjunto de √≠tems Likert pueden sumarse¬†y obtener¬†un valor total. El valor asignado a cada posici√≥n es arbitrario y lo determinar√°¬†el propio investigador/dise√Īador de la encuesta. Dado¬†este valor, podremos calcular la media, la mediana, o la moda. La mediana y la moda son las m√©tricas m√°s interesantes, dado que hacer una interpretaci√≥n de la media num√©rica si manejamos¬†categor√≠as como “de acuerdo” o “en desacuerdo”, no nos aportar√° mucha informaci√≥n.

Normalmente, en investigaci√≥n comercial, los datos obtenidos los trataremos como un intervalo, no como datos ordinales, si bien cabe¬†se√Īalar que en la literatura cient√≠fica hay¬†un amplio debate¬†metodol√≥gico al respecto.

 

Ventajas del ítem Likert

  • Desde el punto de vista del dise√Īo del cuestionario, es una escala f√°cil de construir.
  • Desde el punto de vista del encuestado, le ofrecemos la facilidad de poder¬†graduar su opini√≥n ante afirmaciones¬†complejas.
  • En Internet funciona especialmente bien: es muy visual, el encuestado puede realizar comparaciones entre √≠tems, as√≠ como modificar y ajustar su respuesta f√°cilmente, tal y como podemos ver en este ejemplo.

 

Inconvenientes del ítem Likert

  • Por un lado, dos personas pueden obtener el mismo valor en la escala Likert, habiendo realizado elecciones diferentes.
  • Es dif√≠cil tratar¬†las respuestas neutras, del tipo “ni de acuerdo ni en desacuerdo”.
  • Los encuestados tienden a estar de acuerdo con las afirmaciones presentadas. Es¬†el fen√≥meno que conocemos como¬†acquiescence bias.


Te recomendamos

  • Una buena escala de Likert debe ser sim√©trica, es decir, debe tener el mismo n√ļmero de categor√≠as positivas y negativas.
  • Es recomendable que la escala incluya un punto medio, para que los encuestados puedan seleccionar esa opci√≥n en caso de indecisi√≥n o neutralidad.
  • Si utilizamos varias escalas a lo largo del cuestionario, es interesante que sean iguales o muy parecidas entre s√≠, es decir, que las valoraciones positivas siempre est√©n en la misma zona, y que siempre tengamos el mismo n√ļmero de niveles, para evitar¬†confundir al¬†participante.
  • Algunos investigadores se√Īalan¬†que la escala Likert no es la mejor forma de conocer una opini√≥n, ya que √©sta puede estar situada justo en el espacio¬†que hay entre dos de las opciones presentadas. En este sentido, una soluci√≥n que nos permite la tecnolog√≠a online es que la valoraci√≥n se realice mediante un¬†control deslizante (slider), de forma que el respondiente pueda expresar¬†su opini√≥n de una forma mucho m√°s fina, como puedes ver en este ejemplo.
  • Finalmente, como alternativa a la escala Likert, proponemos el uso de las escalas espec√≠ficas, que presentan una mayor validez y calidad estad√≠sticas.

 

¬ŅCu√°l es tu experiencia utilizando ¬†la escala de Likert? ¬ŅQu√© ventajas o desventajas piensas¬†que ¬†presenta?¬†Te animo a seguir¬†la conversaci√≥n¬†en los comentarios.

Si quieres ampliar tus conocimientos, te recomendamos leer:

Wikipedia – Likert scale (ENG)

The likert scale por Ray Poynter

How to Do a Likert Rating

La escala de Likert por Antz Research (PDF)

Four things you probably didn¬īt know about Likert scales

 

Categoría: Encuestas Online | Investigacion de Mercados Trackback | Comentarios (1)

C√°psula 6: Dise√Īo experimental y estrategias para encontrar un buen dise√Īo

Escrito por Carlos Ochoa el 11 de diciembre 2014

En el √ļltimo post vimos c√≥mo debe ser un buen dise√Īo experimental Conjoint. Tambi√©n vimos c√≥mo calcular una medida que permite comparar dise√Īos: la eficiencia. En este post veremos c√≥mo construir un dise√Īo que se ajuste a nuestros criterios (n√ļmero de sets, alternativas por sets, etc.) y que sea eficiente.

¬ŅY si lo dejamos al azar?

Un buen dise√Īo, en realidad, es un dise√Īo perfectamente aleatorio. Queremos que todos los niveles aparezcan por igual, que todas las comparaciones de niveles aparezcan un n√ļmero similar de veces‚Ķ si generamos el dise√Īo estrictamente al azar, dando la misma probabilidad de inclusi√≥n a todos los niveles, deber√≠amos lograr nuestro objetivo. Es lo que se conoce como dise√Īo aleatorio.

Bien, lo anterior no es del todo cierto. Dejar las cosas al azar tiene sus riesgos. Si la muestra fuese muy grande, con una gran cantidad de sets mostrados, seguramente dejar las cosas al azar funcionaría. Pero la realidad es que la muestra es costosa y no podemos permitirnos muestras de miles de personas para todos los estudios.

Por ello es m√°s conveniente fijar un dise√Īo concreto, especialmente pensado para un tama√Īo de muestra prefijado, de forma que aseguremos que el dise√Īo va a estar equilibrado. Esta estrategia se conoce como dise√Īo planificado.

Dise√Īos planificados predefinidos

plan-dise√Īo-conjoint

 

Como puedes imaginar, no vas a ser el primero que necesite crear un dise√Īo para un experimento Conjoint. Muchos otros investigadores han pasado por ello. ¬ŅNo existir√°n ya dise√Īos hechos que puedan resultar de utilidad?

Efectivamente, existen dise√Īos predefinidos. Para ciertas combinaciones de n√ļmero de atributos y niveles por atributo, existen dise√Īos ideales ‚Äď perfectamente balanceados y ortogonales ‚Äď que podemos usar para nuestro estudio. Estos dise√Īos ideales se construyen mediante un instrumento matem√°tico conocido ‚Äúarrays ortogonales‚ÄĚ. A continuaci√≥n ver√°s algunas de las combinaciones de atributos y niveles para los que existen estos dise√Īos ideales. El dise√Īo se muestra en formato matriz. Cada fila es un producto mostrado, cada columna es el nivel de atributo correspondiente.

Dise√Īo para 3 atributos, con 2 niveles por atributo (se suele expresar como 2x2x2 o 23)

1 1 1

2 1 2

1 2 2

2 2 1

Dise√Īo para 2 atributos, uno con 2 niveles y otro con 3 (2131)

1 1

1 2

1 3

2 1

2 2

2 3

Dise√Īo para 7 atributos de 2 niveles (27)

1 1 1 1 1 1 1

2 1 2 1 2 1 2

1 2 2 1 1 2 2

2 2 1 1 2 2 1

1 1 1 2 2 2 2

2 1 2 2 1 2 1

1 2 2 2 2 1 1

2 2 1 2 1 1 2

 

El problema es que no siempre vamos a encontrar un dise√Īo pre-establecido que se ajuste a nuestro problema real. En general, rara vez podremos aprovechar estos dise√Īos. Necesitamos una soluci√≥n alternativa para generar dise√Īos a medida de nuestro problema de investigaci√≥n.

Creaci√≥n de dise√Īos a medida

Para crear dise√Īos a medida necesitamos usar un algoritmo de b√ļsqueda. Existen diferentes algoritmos. Para ilustrar c√≥mo son estos algoritmos, explicaremos el que usa Netquest para construir los dise√Īos de los estudios Conjoint solicitados por sus cliente. Este algoritmo se basa en el mecanismo propuesto por primera vez por Warren F. Kuhfeld en 1994, inspirado a su vez por un algoritmo propuesto por Federov.

La idea es la siguiente:

  1. Elaboramos una lista de candidatos: son todos los posibles productos que puede incluir el Conjoint. Estos productos son todas las combinaciones posibles de los niveles de los atributos que hayamos definido.
  2. Ordenamos la lista aleatoriamente.
  3. Se crea un primer dise√Īo mediante una selecci√≥n aleatoria de los posibles productos.
  4. Evaluamos la eficiencia-D normalizada del dise√Īo aleatorio inicial.
  5. Reemplazamos el primer producto incluido en el dise√Īo por cada uno de los productos de la lista de candidatos.
  6. Evaluamos para cada reemplazo si la eficiencia-D mejora o empeora. Si mejora aceptamos el cambio, si empeora lo rechazamos.
  7. Repetimos la operaci√≥n (5) y (6) para todos los productos del dise√Īo.
  8. Una vez hemos tratado de reemplazar todos los productos del dise√Īo, volvemos a empezar: tratamos nuevamente de reemplazar todos los productos.
  9. Este algoritmo se lanza m√ļltiples veces, empezando cada vez con un dise√Īo inicial aleatorio diferente. Nos quedamos con el dise√Īo resultante que mejor eficiencia haya obtenido.

El algoritmo descrito es especialmente √ļtil para proyectos Conjoint reales, en los que el n√ļmero de atributos y la cantidad de niveles de cada atributo no se ajustan a un patr√≥n pre-establecido. Otra ventaja es la posibilidad de incluir en el algoritmo lo que se conoce como restricciones de dise√Īo.

Restricciones de dise√Īo

Un Conjoint permite estudiar diferentes tipos de productos: coches, seguros, tarjetas de crédito, contratos de telefonía… Cada tipología de producto tiene características propias. Los atributos y la forma en que se combinan para crear productos, varía mucho de un sector a otro. En ocasiones, el responsable de producto que está detrás de un estudio Conjoint quiere imponer ciertas restricciones a los productos que vamos a mostrar en la encuesta.

Una restricci√≥n muy habitual es la de definir productos prohibidos, combinaciones de atributos que nunca deben mostrarse. Por ejemplo, en un estudio Conjoint sobre coches, podr√≠a darse el caso de que una de las marcas estudiadas no ofrezca coches de un color determinado y otra no ofrezca motores di√©sel. Si ejecutamos un algoritmo de creaci√≥n de dise√Īos est√°ndar, estas combinaciones aparecer√≠an.

dise√Īo-conjoint-problemas

 

Otra restricci√≥n frecuente es la de definir comparaciones prohibidas, productos que no deber√≠an aparecer dentro de un set. Por ejemplo, podemos querer impedir comparaciones de productos dominantes. Se dice que un producto domina a otro cuando el primero es objetivamente mejor a otro. Imaginemos en nuestro estudio de coches dos productos id√©nticos en todos los atributos (misma marca, misma potencia, mismo color) pero uno tiene¬†un precio inferior a otro. Cualquier respondiente racional seleccionar√° el producto de precio inferior. Incluir esta pregunta en el estudio no producir√≠a ning√ļn problema, incluso nos permitir√≠a detectar respuestas incoherentes, pero no nos aportar√≠a informaci√≥n relevante.

Algoritmos personalizados

La buena noticia es que el algoritmo descrito anteriormente puede personalizarse a medida de un problema de investigaci√≥n concreto. Por ejemplo, el problema de los productos prohibidos se resuelve eliminando dichos productos de la lista de candidatos a partir de la cual se crean los dise√Īos. Las combinaciones prohibidas pueden controlarse a√Īadiendo un paso al algoritmo, de manera que antes de incluir o reemplazar un producto en el dise√Īo, verifique que ese producto puede convivir con los que est√°n ya en el set de destino.

La mala noticia es que en ocasiones las reglas que definen los productos y comparaciones prohibidas no son simples. Podemos enfrentarnos a restricciones totalmente personalizadas para un problema concreto, por lo que necesitaremos que un programador reformule el algoritmo de b√ļsqueda de dise√Īos eficientes.

Otro problema de la (excesiva) personalizaci√≥n de los dise√Īos es el efecto que pueden tener sobre la eficiencia. Ya hemos explicado que un dise√Īo eficiente est√° balanceado y es ortogonal, lo que equivale a decir que es un dise√Īo idealmente aleatorio, sin correlaciones entre atributos. Imponer reglas sobre c√≥mo se combinan atributos, en el fondo, est√° imponiendo correlaciones y por lo tanto reduce la eficiencia del dise√Īo.

Por lo tanto, debemos usar las restricciones lo menos posible. Que una combinación de atributos no exista en el mercado, no significa que no debamos incluirla en el experimento. Estamos tratando de medir cómo valora el consumidor cada atributo, y esas combinaciones inexistentes pueden darnos mucha información. Por ejemplo, aunque una marca de coches no comercialice vehículos en color rojo, nada impide medir qué respuesta generaría esta propuesta a los clientes.

 

Con esta capsula ponemos fin a la extensa explicaci√≥n sobre c√≥mo debemos dise√Īar experimentos Conjoint. En la pr√≥xima c√°psula abordaremos c√≥mo debe programarse un cuestionario Conjoint, para pasar en siguientes posts a un aspecto clave de estos estudios: el an√°lisis.

Categoría: conjoint Trackback | Comentarios (1)

Predecir lo que no sabes que existe

Escrito por Carlos Ochoa el 9 de diciembre 2014

Uno de los cap√≠tulos m√°s interesantes de la Se√Īal y el ruido de Nate Silver es el titulado “Lo que no conoces puede hacerte da√Īo”.

A lo largo de su obra, Silver nos detalla todo tipo de problemas predictivos. Documenta casos de éxito (como la predicción meteorológica), fracasos (como las predicciones económicas) y áreas en las que ni siquiera hay una esperanza razonable de llegar a tener éxito (como la predicción de seísmos).

En este cap√≠tulo el autor se centra en una cuesti√≥n a√ļn m√°s compleja: las predicciones que fallan porque ni siquiera se buscaba en el lugar adecuado.

 

Pearl Harbor, un ataque inesperado

Para ilustrar el problema, Silver recurre a un episodio tr√°gico de la historia de Estados Unidos: el ataque de la armada japonesa a la base militar de Pearl Harbor.

 

pearl-harbor

Exist√≠an m√ļltiples indicios que pod√≠an hacer pensar en ese ataque. Las relaciones de ambos pa√≠ses se hab√≠an deteriorado mucho en 1941. Los movimientos de tropas y se√Īales hostiles hab√≠an sido numerosas durante el periodo previo al ataque. De hecho, Estados Unidos hab√≠a desplazado gran parte de su marina a Pearl Harbor como medida de precaucaci√≥n.

Sin embargo, el ataque japon√©s pill√≥ totalmente desprevenida a la flota norteamericana. ¬ŅC√≥mo pudo fallar de forma tan estrepitosa la inteligencia militar estadounidense? Las razones son una buena ense√Īanza para cualquier investigador.

La primera raz√≥n es que la inteligencia norteamericana trabajaba casi exclusivamente con la hip√≥tesis de un sabotaje, no de un ataque directo. En Hawai viven muchos descendientes de japoneses, lo cual aliment√≥ esa teor√≠a. Para poder proteger mejor la aviaci√≥n de un sabotaje, se opt√≥ por aparcar todas las naves agrupadas, lo que hizo m√°s da√Īino el ataque japon√©s.

La segunda raz√≥n, a√ļn m√°s sorprendente, fue el silencio. Los americanos hab√≠an logrado descifrar el c√≥digo de encriptaci√≥n usado por los japoneses en sus comunicaciones diplom√°ticas, pero no el usado en las militares. Aun as√≠, la recepci√≥n de dichas se√Īales facilitaba la localizaci√≥n de la flota japonesa en el Pac√≠fico.

Sin embargo, unos d√≠as antes del ataque, la armada japonesa dej√≥ de emitir se√Īales de comunicaci√≥n. Los americanos interpretaron esa se√Īal como un repliegue de la flota, lo que har√≠a imposible recibir se√Īales. Por el contrario, lo que estaba sucediendo es que la flota avanzaba hacia Pearl Harbor en total silencio, preparando un ataque extremadamente da√Īino.

 

El célebre desconocido desconocido

Muchos a√Īos despu√©s, Donald Rumsfeld, secretario de Defensa del gobierno de George Bush, daba una buena explicaci√≥n a este tipo de fallos predictivos.

 

donald-rumsfeld

Seg√ļn Rumsfeld nos enfrentamos a diferentes tipos de problemas:

  • Los conocidos conocidos (known knowns), problemas que sabemos que existen y que los conocemos suficientemente como para resolverlos.
  • Los conocidos desconocidos (known unknowns), problemas que sabemos que existen pero que no hemos resuelto.
  • Pero sin duda, los peores problemas son los desconocidos desconocidos (unknown unknowns), los problemas que ni siquiera sabemos que existen.

Para Rumsfeld, el ataque de Pearl Harbor era un desconocido desconocido. La inteligencia norteamericana no detect√≥ el ataque porque no contemplaba esa opci√≥n, trabajaba con otros escenarios. Es imposible detectar una se√Īal si ni siquiera la estamos buscando.

La misma teor√≠a de los “unknown unknowns” suele emplearse para explicar los ataques a las torres gemelas el 11-S. Para muchos analistas, estos ataques eran impredecibles. Pero, ¬Ņfue realmente as√≠?

 

La probabilidad de los sucesos poco probables

Silver hace un an√°lisis de hasta qu√© punto estos ataques eran impredecibles desde dos puntos de vista: (1) ¬Ņera esperable un ataque de esta magnitud?, y (2) ¬Ņhab√≠a indicios que, de haberse detectado, podr√≠an haber evitado este ataque concreto?

 

ataque11septiembre2001

Respecto a la primera cuesti√≥n, Silver compara la probabilidad de un ataque terrorista con la de un terremoto. Ambos fen√≥menos¬†tienen una caracter√≠stica com√ļn: la frecuencia con que ocurren es relativamente alta para los fen√≥menos de magnitud peque√Īa y baja para los de magnitud grande. En el mundo se registran centenares de peque√Īos terremotos cada a√Īo, terremotos que pasan pr√°cticamente inadvertidos. Por el contrario, los grandes terremotos de escala 7 u 8, son fen√≥menos raros que ocurren muy ocasionalmente pero que tienen una enorme capacidad de destrucci√≥n.

El terrorismo sigue una pauta similar. Anualmente se registran gran cantidad de actos terroristas, la mayor√≠a de los cuales no ocasiona v√≠ctimas mortales. A medida que estudiamos atentados con mayor n√ļmero de v√≠ctimas, su frecuencia disminuye.

Un atentado como el del 11-S no se hab√≠a observado antes en la historia. Pero, ¬Ņsignifica eso que era totalmente impensable que sucediese? Responder a esta pregunta es equivalente a preguntarse si es posible que suceda un terremoto de 8 puntos en la escala Richter. Y la respuesta, obviamente, es afirmativa. Ambos son sucesos infrecuentes, pero no improbables. Son cosas diferentes. Los grandes terremotos pueden suceder cada 20, 30 o 60 a√Īos. Lo mismo sucede con un gran ataque terrorista.

Ambos fen√≥menos siguen un comportamiento conocido como ley potencial (power law). La frecuencia con que ocurren los fenomenos decrece potencialmente con la magnitud de los mismos. Si trazamos esta relaci√≥n magnitud-frecuencia en el caso del terrorismo con datos anteriores al 11-S, el resultado nos indicar√≠a que la frecuencia esperada de un atentado de esa magnitud era de 1 suceso cada 80 a√Īos. Es poco frecuente, pero est√° lejos de ser imposible.

 

No hay peor ciego que el que no quiere ver

Est√° bien, sabemos que un atentado como el del 11-S no era impensable. Pero detectarlo e impedirlo es una cosa diferente. A fin de cuentas, no somos capaces de anticipar la aparici√≥n de un gran terremoto. ¬ŅPodr√≠a haber evitado la inteligencia norteamericana el 11-s?

La respuesta nos la da nuevamente el famoso “unknown unknowns”. Antes del 11-S se hab√≠an producido atentados de gran magnitud, hab√≠a precedentes de ataques con avionetas e incluso se detuvo poco antes a un sospechoso (Zacarias Moussaoui) por haber solicitado de forma at√≠pica un curso de aviaci√≥n para manejar un Boeing 747 cuando apenas sab√≠a volar. Hubo numerosos indicios, pero nadie mirando en la direcci√≥n correcta. Parad√≥jicamente, al contrario de lo que sucedi√≥ en Pearl Harbor, Estados Unidos contemplaba la posibilidad de un ataque exterior; en ning√ļn caso contempl√≥ el escenario de ser atacado con sus propios aviones provenientes de vuelos dom√©sticos.

 

Ense√Īanzas

La historia de los fen√≥menos infrecuentes¬†nos recuerda la importancia de mantener la mente abierta, de contemplar todas las posibilidades. Es una cualidad imprescindible para un buen investigador. Trabajar con escenarios rupturistas – o catastr√≥ficos – quiz√° podr√≠a haber hecho correr mejor suerte a empresas como Kodak. ¬ŅO acaso no era posible predecir el fin del carrete fotogr√°fico?

Categoría: Predicciones Trackback | Comentarios(0)

Los problemas de Bayes con la justicia

Escrito por Carlos Ochoa el 5 de diciembre 2014

Hace unos días publicábamos un post acerca de la confrontación entre dos formas de entender la estadística: el pensamiento Frecuentista (o clásico) y el pensamiento Bayesiano. Los primeros entienden la probabilidad como el resultado esperado de un experimento repetible, los segundos como el grado de conocimiento que tenemos acerca de la posibilidad de que un evento ocurra.

El pensamiento Bayesiano está en el corazón de muchos de los grandes avances de la estadística moderna. Uno de sus usos más curiosos tiene que ver con la justicia. El teorema de Bayes es una buena manera de valorar objetivamente la culpabilidad de un acusado. Por lo menos, así había sido hasta hace poco.

justicia-bayes

 La sentencia de un juez británico

Hace unos a√Īos salt√≥ una sorprendente noticia¬†sobre el uso de la estad√≠stica en los juicios. Un juez brit√°nico decidi√≥ que el teorema de Bayes, una f√≥rmula frecuentemente empleada para determinar la probabilidad de que un acusado sea culpable, no deb√≠a usarse en casos de homicidio. O por lo menos, no como se ven√≠a haciendo.

Este famoso teorema permite evaluar la probabilidad de un suceso en dos pasos. En primer lugar, parte de una probabilidad a priori, una estimación de que un determinado evento ocurra basándonos en nuestro conocimiento previo del problema. En segundo lugar, una vez hemos podido adquirir nuevos datos que mejoren nuestro conocimiento del problema, calculamos una probabilidad posterior. Esta probabilidad posterior es el resultado de revisar nuestras creencias a priori sobre la base de las evidencias disponibles.

Seg√ļn el juez brit√°nico, cualquier testigo experto que aplique este teorema para evaluar las probabilidades de que un acusado sea culpable, deber√≠a tener una certeza total sobre los datos estad√≠sticos que emplea.Esta decisi√≥n podr√≠a afectar al uso actual de este teorema para determinar coincidencias en rastros de drogas, fibras de tejidos de una prenda de vestir o huellas, quedando √ļnicamente las pruebas de ADN a salvo de esta sentencia.

El detonante de esta decisión judicial es un caso real de asesinato juzgado en Reino Unido. El sospechoso fue condenado después de que se hallase en su domicilio unas zapatillas deportivas Nike que coincidían con unas huellas encontradas en la escena del crimen. El razonamiento bayesiano que el testigo experto realizó en este caso necesitaba asignar una probabilidad al hecho de que una persona cualquiera llevase dicho modelo de zapatillas deportivas. Ante la ausencia de datos precisos por parte del fabricante, el experto empleó una estimación razonable de esta información, una práctica habitual en este tipo de razonamientos. Por lo visto, al juez no le gustó la idea de condenar a alguien con base a una estimación de este tipo.

 

Cómo se usa el teorema de Bayes en los juicios

Veamos cómo se usa el teorema de Bayes en la incriminación de acusados. Empecemos recordando el célebre teorema en su formulación más habitual.

 

teorema de bayes

Extra expresión relaciona la probabilidad de que ocurran dos eventos A y B. Cada elemento de esta fórmula debe entenderse de la siguiente manera:

  • P(A) = Probabilidad de que ocurra un evento A.
  • P(B) = Probabilidad de que ocurra un evento B.
  • P(A|B) = Probabilidad de que ocurra el evento A, sabiendo que ha ocurrido el evento B. Se lee como probabilidad condicionada de A respecto a B.
  • P(B|A) = Probabilidad de que ocurra el evento B, sabiendo que ha ocurrido el evento A. Es decir, probabilidad de B condicionada a A.

La noción de probabilidad condicionada es fundamental en la estadística y nos permite tener en cuenta eventos relacionados entre sí. Por ejemplo, la probabilidad de que un día cualquiera resbale paseando por la calle puede ser de 1 entre 1.000, pero esa misma probabilidad condicionada a que ese día esté lloviendo puede ser de 1 entre 100.

En ocasiones, en lugar de emplear probabilidades, empleamos lo que los ingleses llaman odds, que es el n√ļmero de veces que ocurrir√° un evento respecto al n√ļmero de veces que ocurrir√° otro. Dicho de otra manera, O(A)=P(A)/P(no A).

Supongamos que el evento A es la culpabilidad del acusado (le llamaremos Culp) y el evento B la aparición de una evidencia inculpatoria (E a partir de ahora). En dicho caso, P(Culp|E) debería leerse como la probabilidad de que el acusado sea culpable habiendo observado una evidencia del delito. Teniendo en cuenta este concepto, es frecuente transformar la fórmula anterior de manera más conveniente para nuestro propósito:

 

teorema de bayes para juicios

Debemos leer cada elemento de la fórmula así.

  • O(Culp) = Probabilidad de que¬†el acusado sea culpable respecto a la probabilidad de que sea inocente, antes de observar¬†ninguna prueba o evidencia.
  • O(Culp|E) = Probabilidad de que el acusado sea culpable¬†una vez hemos observado una evidencia E, respecto a la probabilidad de que sea inocente.
  • P(E|Culp) = Probabilidad de que se produzca la evidencia E cuando el sospechoso es culpable.
  • P(E|no Culp) = Probabilidad de que se produzca la evidencia E cuando el sospechoso es inocente.

Lo interesante de la fórmula anterior es que, desde un punto de vista bayesiano, se puede leer como una revisión del grado de conocimiento que tenemos de un problema. Podemos pensar que O(Culp) son las opciones que damos al acusado de ser culpable sin tener ninguna prueba contra él y O(Culp|E) es la revisión de nuestra creencia acerca de su culpabilidad en vista de las evidencias aportadas.

Veamos cómo funciona este razonamiento con un ejemplo.

 

Ejemplo de revisión de probabilidad a priori

Supongamos que investigamos un homicidio en el que tenemos un sospechoso. Supongamos también que el homicida fue herido durante el acto y se han encontrado restos de su sangre en la escena del crimen. Un análisis forense determina que 1 de cada 15.000 personas tienen ese perfil sanguíneo y que coincide con el perfil de nuestro sospechoso. Por lo tanto

 

probabilidad-evidencia-frente-culpabilidad

En la fórmula anterior, usamos probabilidades condicionadas. Si el acusado es culpable, la probabilidad de que la sangre encontrada sea del tipo observado es 1. Si es inocente, la probabilidad es la frecuencia con la que ese tipo de sangre se encuentra en la población general (1 de cada 15.000 veces).

Para poder usar nuestra fórmula, nos falta conocer las opciones de culpabilidad a priori que asignamos al sospechoso, sin tener en cuenta las pruebas de sangre.  Supongamos que estamos en una región de 2.000.000 de personas y aceptamos que el culpable debe vivir necesariamente en ella. Podemos estimar que las opciones de culpabilidad a priori de nuestro acusado son de 1 contra 1.999.999.

Usando el teorema de Bayes revisamos estas opciones de culpabilidad con la evidencia de la prueba sanguínea

 

revision-priori-formula

En el c√°lculo anterior hemos transformado las opciones de culpabilidad en probabilidad directa de culpabilidad, sabiendo que O= P / (1 – P), y por tanto P = O/(1+O).

El resultado puede parecer sorprendente. La prueba de la sangre incrementa por un factor 15.000 las opciones de culpabilidad del acusado, pero como sus opciones a priori eran bajas, sólo logramos tener una certeza de culpabilidad del 7,4%.

Para entender el impacto de la probabilidad a priori, supongamos ahora que el crimen ocurre en una regi√≥n aislada de 2.000 habitantes. ¬ŅC√≥mo afecta este conocimiento a priori a nuestra probabilidad de culpabilidad? Podemos modificar nuestra estimaci√≥n, considerando esta vez que las opciones a priori de culpabilidad son 1 entre 2.000.

 

revision-priori-formula-2

Pasamos a tener una certeza del 88%, muy superior a la anterior.

 

Los jurados nos son matem√°ticos

El razonamiento bayesiano es una herramienta poderosa. Pero, tal y como el juez británico apuntó, es muy sensible a las probabilidades a priori que usamos cuando no tenemos datos sólidos en qué basarnos.

En el fondo de la cuestión está el hecho de que la justicia no se siente cómoda asignando probabilidades a la cuestión de la culpabilidad. Uno de los principios básicos del derecho en la mayor parte de culturas es que no se puede condenar a una persona cuando hay alguna duda de su culpabilidad (in dubio pro reo). Pero en realidad, rara vez podemos tener una certeza total sobre las cosas. El pensamiento Bayesiano pone en evidencia esta realidad. Sin embargo la sociedad necesita dormir tranquila pensando que no enviamos inocentes a la cárcel. El teorema de Bayes es una verdad incómoda para el sistema jurídico.

Asimismo, es importante tener en cuenta cómo se interpretan estos conceptos por parte de un jurado sin perfil estadístico. La prueba sanguínea anteriormente mencionada, que afirmaba que 1 de cada 15.000 personas tiene un perfil sanguíneo similar, puede ser fácilmente mal interpretada. Si invertimos inadecuadamente el razonamiento, podemos pensar que el acusado sólo tiene 1 entre 15.000 opciones de ser inocente. Sin embargo, una cosa no tiene nada que ver con la otra.

Una correcta aplicación del teorema de Bayes proporciona indudables beneficios a la forma en que juzgamos en nuestra sociedad. Sería una pena perderlos.

Categoría: Art√≠culos Trackback | Comentarios (2)

C√°psula 5: Dise√Īo experimental, calidad de un dise√Īo

Escrito por Carlos Ochoa el 4 de diciembre 2014

¬ŅC√≥mo debe ser un buen dise√Īo? ¬ŅC√≥mo debemos elegir qu√© combinaciones de atributos-niveles mostramos a cada respondiente en cada pregunta? Necesitamos saber qu√© hace bueno un dise√Īo. Veremos tres criterios: balance, ortogonalidad y equilibrio posicional. Y veremos c√≥mo combinar estos criterios para obtener una medida objetiva de bondad que nos permita comparar dise√Īos y seleccionar el mejor posible.

Balance

Un dise√Īo est√° balanceado cuando los diferentes niveles de cada atributo se muestran el mismo n√ļmero de veces. En un estudio Conjoint sobre coches en el que hubi√©semos definido un atributo color con los niveles rojo, blanco y negro, significar√≠a que el total de participantes ver√≠an tantos coches de color rojo, como blancos y negros.

Queremos dise√Īos balanceados, o al menos, lo m√°s balanceados posibles. Cada vez que mostramos un producto con un nivel concreto de un atributo, estamos obteniendo informaci√≥n de ese nivel. Si mostramos los niveles un n√ļmero similar de veces, aseguramos que estamos obteniendo una cantidad de informaci√≥n pareja de todos los niveles. Si no lo hacemos as√≠, estaremos estimando la utilidad de unos niveles de forma muy precisa y otros de forma muy imprecisa.

 Ortogonalidad

Un dise√Īo es ortogonal cuando la cantidad de veces que un nivel de un atributo es comparado con los todos los niveles del resto de atributos es igual o proporcional. As√≠, en el ejemplo de los coches, si tenemos un atributo color con 3 niveles (rojo, blanco y negro) y un atributo potencia con dos niveles (80CV, 120CV), nos gustar√≠a que los productos mostrados durante el experimento incluyan el mismo n√ļmero de veces las combinaciones siguientes:

Rojo ‚Äď 80CV
Rojo ‚Äď 120CV
Blanco ‚Äď 80CV
Blanco ‚Äď 120CV
Negro ‚Äď 80CV
Negro ‚Äď 120CV

El criterio de ortogonalidad asegura que no confundimos atributos cuando calculamos las utilidades. Mantener la proporcionalidad en las combinaciones evita la correlaci√≥n entre atributos. En nuestro ejemplo, si siempre que mostramos el color negro lo hacemos junto a la potencia 80CV, cuando un participante escoja un producto con esos atributos, ¬Ņc√≥mo vamos a saber si lo ha escogido por el color o por la potencia?

Queremos por lo tanto dise√Īos lo m√°s ortogonales posibles.

Equilibrio posicional

Durante el experimento mostraremos unos productos (cada uno con su combinaci√≥n de niveles de los diferentes atributos) y pediremos al respondiente que nos diga su opci√≥n preferida. En ocasiones, la respuesta del participante puede verse afectada por el orden en que le mostramos las cosas. Por ejemplo, las opciones mostradas en primera posici√≥n suelen recibir m√°s atenci√≥n del participante y son seleccionadas con m√°s frecuencia. Es el conocido ‚Äúsesgo de orden‚ÄĚ que afecta a cualquier pregunta de una encuesta con opciones de respuesta.

En el caso de Conjoint, queremos evitar que un nivel de un atributo aparezca m√°s veces en primera posici√≥n que otro. Lo ideal es que todos los niveles aparezcan en las diferentes posiciones un n√ļmero similar de veces. Esto se conoce como equilibrio posicional.

El equilibrio posicional tiene un impacto en el an√°lisis de utilidades menor que los otros dos criterios, por lo que suele recibir menor atenci√≥n. De hecho, es habitual no incluir en el dise√Īo las posiciones exactas en que aparecer√°n los atributos-niveles, y dejar que sea el propio software de encuestas el que se ocupe de mostrar en orden aleatorio las alternativas. Este nivel de aleatoriedad es suficiente para evitar el sesgo de orden.

Eficiencia

No siempre es posible obtener un dise√Īo perfectamente balanceado y ortogonal. Dependiendo del n√ļmero de atributos, niveles por atributo, sets por respondiente y alternativas por set, puede no existir ning√ļn dise√Īo perfecto. Pero igualmente querremos obtener el mejor dise√Īo posible: lo m√°s balanceado y ortogonal posible.

Para poder buscar el mejor dise√Īo necesitamos una medida, un n√ļmero que nos diga si un dise√Īo es mejor que otro. Esa medida existe, y se conoce como eficiencia. Un dise√Īo eficiente obtiene mejores datos y permite calcular con mayor precisi√≥n las utilidades de los atributos.

Existen varias formas de calcular la eficiencia. Se trata de un c√°lculo matem√°tico ‚Äď bastante complejo – que desarrollamos al final de este post para no interferir con la explicaci√≥n. Tan s√≥lo te apuntamos aqu√≠ una idea intuitiva de c√≥mo se calcula:

  1. Se calcula una matriz que describe el dise√Īo, es decir, qu√© atributos-niveles se est√°n mostrando y c√≥mo se han combinado.
  2. Se calcula la matriz de informaci√≥n del dise√Īo. Esta matriz nos indica con qu√© frecuencia se est√° repitiendo una combinaci√≥n de niveles.
  3. Calculamos una medida de dispersi√≥n de los valores de la matriz. Queremos que el dise√Īo que muestre todos las combinaciones un n√ļmero similar de veces.

Existen diferentes medidas de eficiencia. La m√°s popular es la eficiencia-D. Esta eficiencia-D puede normalizarse respecto a un dise√Īo ideal (perfectamente balanceado y ortogonal), de forma que si estamos cerca de esta perfecci√≥n, la eficiencia-D normalizada estar√° pr√≥xima al 100%. Por el contrario, si la eficiencia-D resulta 0%, significar√° que la utilidad de alg√ļn nivel de un atributo no puede calcularse debido a que se confunde con otro nivel.

Representaci√≥n de un dise√Īo

Para finalizar este post, te explicamos c√≥mo se suele representar un dise√Īo. Esta representaci√≥n nos ser√° de utilidad tanto para programar el cuestionario online como para calcular la eficiencia del dise√Īo, como explicamos en el anexo de este post.

La forma habitual de representar un dise√Īo es en forma matricial. Esta matriz:

  • Tiene tantas filas como productos se muestran en el dise√Īo.
  • Tiene tantas columnas como atributos tienen los productos, m√°s algunas otras columnas que nos indican la posici√≥n que cada producto ocupa en el experimento.

Veamos con un ejemplo c√≥mo ser√≠a esta matriz. Imaginemos nuevamente nuestro estudio Conjoint sobre coches. Pensemos en un dise√Īo que tiene 2 versiones, 3 sets por respondiente y 3 alternativas por set. El dise√Īo que queremos hacer tendr√° un total de 18 productos: 2 versiones x 3 sets x 3 productos en cada set.

Imaginemos que este estudio Conjoint emplea 3 atributos:

  • color (rojo=1, blanco=2, negro=3)
  • marca (VW=1, Renault=2, Seat=3)
  • precio (10.000$=1, 15.000$=2, 20.000$=3).

Si observas la lista de atributos anterior hemos asignado un código a cada nivel de cada atributo. El rojo tiene el código 1, el blanco el 2, etc. Usando estos códigos, podemos decir que un producto consistente en un coche rojo, Renault y de 15.000$, puede codificarse como 1 2 2. La primera posición de este vector indica el color, la segunda la marca y la tercera el precio.

Usando esta nomenclatura, podemos expresar un dise√Īo con una matriz. Simplemente ponemos los productos en filas, y transformamos los atributos en los c√≥digos correspondientes. Por ejemplo:

matriz-numerica-dise√Īo
 

Ya tenemos una matriz num√©rica que describe el dise√Īo. Toda la informaci√≥n del experimento est√° aqu√≠. Observa que hemos a√Īadido 3 columnas a la matriz. Esas 3 columnas indican para cada producto a que versi√≥n del dise√Īo pertenece, en cu√°l de los 3 sets aparecer√° y qu√© posici√≥n ocupa dentro de cada set.

En el próximo post te explicaremos cómo puede usarse esta medida de eficiencia para buscar buenos algoritmos. Te esperamos.

 


 

Anexo: Sólo para los matemáticos…

Si te interesan las matem√°ticas, te adjuntamos aqu√≠ una peque√Īa explicaci√≥n de c√≥mo calcular la eficiencia de un dise√Īo. Este contenido no es necesario para comprender todos los posts que vienen a partir de ahora.

El punto de partida es la matriz que describe el dise√Īo y que hemos visto en este mismo post. Para el c√°lculo de eficiencia, prescindimos de las columnas que indican versi√≥n, set y alternativa, y nos quedaremos con una matriz simple que s√≥lo contiene los productos. Llamaremos X a esta matriz. Por ejemplo:

matriz-eficiencia
Avancemos un poco m√°s. Cada columna de esta matriz representa un atributo y cada n√ļmero en una columna representa un nivel de ese atributo, de acuerdo a la codificaci√≥n que hemos decidido usar. Pero existen formas de codificaci√≥n alternativas m√°s convenientes para nuestros prop√≥sitos.

Por ejemplo, podemos usar una columna diferente para cada nivel de cada atributo. Un valor 1 en una columna indica que el nivel correspondiente est√° presente y un valor 0 indica que no lo est√°. Seg√ļn esta codificaci√≥n, cada columna de nuestra matriz dar√≠a lugar a 3 columnas.

indicator-coding
Esta forma de codificaci√≥n recibe el nombre de ‚Äúcodificaci√≥n mediante indicadores‚ÄĚ (indicator coding). Existen formas alternativas de codificar la matriz X. De hecho, esta forma no es la mejor, pero nos servir√° para ilustrar la idea de eficiencia.

Calculemos ahora la siguiente expresi√≥n: X‚ÄôX. Esta expresi√≥n, la traspuesta de la matriz que contiene el dise√Īo por la propia matriz, se conoce como matriz de informaci√≥n (information matrix). Y, efectivamente, contiene mucha informaci√≥n.

 

information-matrix


Esta matriz sim√©trica contiene toda la informaci√≥n relativa a qu√© combinaciones de niveles est√°n presentes en el dise√Īo. Tiene un n√ļmero de filas/columnas igual a la suma de niveles de los atributos. Y cada fila/columna tiene informaci√≥n del nivel correspondiente. Nos referiremos a una celda concreta de esta matriz usando un par de n√ļmeros (i,j), donde i es la fila y j la columna.

Veamos con ejemplos qu√© informaci√≥n contiene la matriz. Si queremos ver c√≥mo se est√° combinando el nivel ‚Äúcolor=negro‚ÄĚ con el ‚Äúprecio=20.000$‚ÄĚ, debemos tener en cuenta que el color negro ocupa la posici√≥n 3 dentro de los niveles y el precio 20.000$ la posici√≥n 9. Mirando la celda (3,9) ‚Äď o la (9,3), ya que son iguales – veremos que aparece un valor 1. Significa que en el experimento s√≥lo aparece una vez un coche de color negro a 20.000$. Podemos ver que es correcto: el 6¬ļ producto mostrado en el dise√Īo es el 3 2 3, que corresponde a un coche negro, Renault a 20.000$.

Observa que la diagonal de la matriz de informaci√≥n est√° ocupada por el valor 3. ¬ŅQu√© significa esto? La diagonal recoge las veces que un nivel de un atributo se combina consigo mismo, lo que es equivalente a decir que recoge las veces que aparece un atributo. Por ejemplo, si miramos la celda (4,4), el n√ļmero que encontramos (3) son las veces que la marca VW aparece en el dise√Īo. Mirando directamente el dise√Īo vemos que es cierto, la marca VW aparece en los productos 1,2 y 3.

Observa también que en la matriz de información aparecen algunos ceros. Por ejemplo, la celda (1,2). En este caso, es normal, ya que el atributo en primera posición es el color rojo y en segunda es el color blanco. No puede existir un coche rojo y blanco a la vez. Es por esa razón que en las submatrices que corresponden a los niveles de un mismo atributo, los elementos fuera de la diagonal tienen siempre valor 0. El siguiente diagrama verás ilustrado lo explicado anteriormente

matrix-bayes
 

El dise√Īo que hemos tomado como ejemplo es francamente bueno. Observa que combina todos los niveles de atributos combinables y lo hace el mismo n√ļmero de veces. Veamos un ejemplo del efecto que tiene alterar alguno de los productos del dise√Īo original, en concreto, vamos a cambiar el color del primer producto de rojo (1) a blanco (2). Es decir, cambiamos el producto 1 1 3 por el 2 2 3.Si lo hacemos, calculamos la matriz del dise√Īo y evaluamos la matriz de informaci√≥n, resulta lo siguiente.

imagen-6

 

Observa que las filas (y las columnas) alteradas son la primera y la segunda, ya que hemos suprimido un producto con nivel 1 y lo hemos reemplazado por otro con nivel 2. Observa tambi√©n que la celda (1,1) ha pasado de 3 a 2, y la (2,2) de 3 a 4. Tambi√©n se han producido otras afectaciones. Por ejemplo, la celda (1,9) tiene un 0, indicando que este dise√Īo no combina ni una sola vez el color negro con el precio 20.000$.

Obviamente, este dise√Īo es peor que el anterior. La eficiencia justamente es la medida que nos dice qu√© matriz de informaci√≥n es mejor. Resulta que la matriz de varianza-covarianza de las utilidades que queremos estimar mediante el Conjoint es proporcional a la inversa de esta matriz de informaci√≥n, es decir, a (X‚ÄôX)-1.. En concreto, es ŌÉ2(X‚ÄôX)-1, donde ŌÉ2 es una constante desconocida que depende de los datos que obtengamos en el experimento.

Por lo tanto, la precisi√≥n que obtendremos en nuestras estimaciones depender√° de la dispersi√≥n de opiniones que resulten de las respuestas pero tambi√©n del dise√Īo que empleemos. Y para que el dise√Īo a√Īada la menor desviaci√≥n posible, queremos minimizar (X‚ÄôX)-1.

(X‚ÄôX)-1 es una matriz, no un valor. Tenemos una herramienta matem√°tica que nos permite transformar una matriz, vista como un conjunto de puntos, en unas cantidades que expresan lo grande que es (el espacio que ocupan sus puntos). Estas cantidades son los valores propios de una matriz. Si estos valores son grandes, la matriz es grande. El promedio de los valores propios es por lo tanto una medida resumida del tama√Īo de la matriz y podemos emplearla para medir la eficiencia del dise√Īo. Queremos un promedio de valores propios peque√Īo.

En función del tipo de promedio que hacemos de los valores propios, estaremos hablando de diferentes tipos de eficiencia:

  • Eficiencia-A: Promedio aritm√©tico de valores propios. Se suman valores y se divide por el n√ļmero de valores.
  • Eficiencia-D: Promedio geom√©trico de valores propios. Se multiplican valores y se hace la ra√≠z n-√©sima.

 

Por diversas razones, la Eficiencia-D es la que tiene mejores propiedades. Teniendo en cuenta que el producto de valores propios es igual al determinante de la matriz, esta media geométrica de valores propios podemos expresarla de la siguiente manera

Dise√Īo eficiente : |(X‚ÄôX)-1|1/p m√≠nimo

donde p es la cantidad de utilidades a estimar. Por lo tanto, podemos definir una medida de eficiencia como

Eficiencia-D : 1 / |(X’X)-1|1/p

 

Esta medida cumple la funci√≥n b√°sica que necesitamos. Si un dise√Īo es mejor que otro, tiene Eficiencia-D mayor.

Algunas consideraciones finales:

  1. El c√°lculo de eficiencia que hemos explicado es para un dise√Īo Conjoint general, no para uno basado en elecci√≥n. Para el caso que nos interesa, es necesario hace una simple manipulaci√≥n de las filas de la matriz de dise√Īo X. En concreto, restar a cada fila todas las otras filas presentes en el mismo set multiplicadas dividas por el tama√Īo del set. De esta forma, la matriz X tambi√©n contiene informaci√≥n de c√≥mo se combinan los atributos dentro de un mismo set.
  1. Podemos usar formas de codificaci√≥n alternativas, m√°s adecuadas para calcular la eficiencia. Por ejemplo, en un atributo con 3 niveles, como el color de nuestro ejemplo, en realidad s√≥lo hay 2 niveles independientes. Si el color no es rojo ni blanco, seguro que es negro. Eso nos permite hacer que la matriz de dise√Īo tenga un n√ļmero de columnas igual al n√ļmero de utilidades realmente independientes, que es igual a la suma de todos los niveles menos el n√ļmero de atributos (en nuestro ejemplo 9-3=6).
  1. Si la codificaci√≥n que empleamos, adem√°s, es de tipo ‚Äúortogonal estandarizada‚ÄĚ, un dise√Īo perfectamente balanceado y ortogonal tendr√° una eficiencia igual al n√ļmero de productos incluidos en el dise√Īo. Denominaremos como N esta cantidad. Esto nos permite saber cu√°l es la m√°xima eficiencia que podemos obtener. Si dividimos la eficiencia por esta eficiencia m√°xima que podemos obtener (N) y multiplicamos por 100, tendremos una medida de eficiencia normalizada.

formula-eficiencia
La  eficiencia-D normalizada tiene las siguientes propiedades:

  1. Si el dise√Īo es mejor, la eficiencia-D es mayor.
  2. Si el dise√Īo es √≥ptimo la eficiencia-D es 100%.
  3. Si alguna utilidad no se puede estimar (porque correlaciona totalmente con otra), la eficiencia-D es 0%.
Categoría: conjoint Trackback | Comentarios (1)

5 principios para hacer un buen trabajo de campo

Escrito por Oriol Llauradó el 2 de diciembre 2014

Se acaba de estrenar el documental ‚ÄúLa sal de la tierra‚ÄĚ, dedicado a¬†la vida y obra del fot√≥grafo brasile√Īo¬†Sebastia√Ķ Salgado. El documental lo han co-dirigido su hijo Juliano y el cineasta alem√°n Wim Wenders, y ha sido premiado en los festivales de Cannes y San Sebasti√°n. Vistas¬†en pantalla grande, las fotos de Salgado nos conmueven por su belleza y por su fuerza √©tica.

caption_006

Tras ver el documental, pienso que son muchas las similitudes entre los hábitos de Salgado, y las metodologías que empleamos las empresas de campo y los investigadores.

Os comparto 5 principios sobre los que Salgado ha asentado su obra, y que nos pueden ayudar a realizar un buen trabajo de campo:

  1. S√© paciente:¬†la realidad nunca te defraudar√°. A sus 70 a√Īos, Salgado se nos presenta como un viajero incansable, un explorador que recorre el planeta persiguiendo situaciones¬†invisibles, sin sucumbir ni a la fatiga ni al miedo.
  2. En cada fotograf√≠a, en cada cadena de datos…debemos¬†buscar la historia que los conecta¬†y plantear las acciones que se pueden emprender¬†para cambiarla.
  3. Ac√©rcate al objeto de estudio, pero¬†respeta y celebra su individualidad. No te sit√ļes ni demasiado cerca como para alterarlo, ni demasiado lejos como para no capturar su esencia.
  4. Sumérgete en la realidad, no te aísles: para ser un buen investigador Рy un buen fotógrafo- se requiere una comprensión profunda de la sociedad, una formación humanística, y conocer las dinámicas del mercado. En definitiva: desarrollar un interés genuino por nutrirse de los aportes de diferentes disciplinas.
  5. La tecnología no es un fin en sí mismo, sino un medio para lograr nuestras metas. No encontrarás en todo el documental una sola mención a los píxeles, a los sensores, a las lentes, etc. Conviene que no nos dejemos deslumbrar por las nuevas tecnologías. Lo esencial seguirá siendo nuestra capacidad para conectar e interpretar lo que vemos.

Bonus track: si estás en Barcelona, todavía puedes ir a ver la exposición sobre el proyecto Génesis de Salgado. Estará en Caixaforum hasta el 8 de febrero de 2015.

Categoría: Encuestas Online | Investigacion de Mercados Trackback | Comentarios(0)

C√°psula 4: Dise√Īo experimental, par√°metros de dise√Īo

Escrito por Carlos Ochoa el 27 de noviembre 2014

Tras definir en la entrada anterior las fases que conlleva un Conjoint, pasamos a la acci√≥n. La primera fase de un estudio Conjoint es elaborar un dise√Īo experimental. Y para hacer un buen dise√Īo, debemos fijar algunos par√°metros: n√ļmero de atributos a testar, niveles diferentes de cada atributo, cantidad de preguntas que debe responder cada encuestado,‚Ķ Fijar correctamente estos par√°metros permitir√° obtener resultados fiables. Veamos algunas consideraciones a tener en cuenta.

Definiendo atributos

Vimos en la cápsula I que el objetivo de un Conjoint es medir la utilidad que tiene para el consumidor cada atributo que compone un producto (en un coche, puede ser el color, el precio, la potencia…). En concreto, medimos la utilidad de los posibles niveles de cada atributo (el color verde, un precio de 15.000$, una potencia de 120CV).

El primer paso para hacer un dise√Īo es es identificar atributos. Cualquier producto tiene una enorme cantidad de atributos. En un coche, podemos hablar del tipo de carrocer√≠a, tama√Īo, color, marca, consumo, potencia‚Ķ y podr√≠amos seguir hasta identificar atributos como el color del tap√≥n de la gasolina. La cuesti√≥n es, ¬Ņd√≥nde se acaba esto? ¬ŅPuedo trabajar s√≥lo con unos pocos atributos? ¬ŅCu√°les debo elegir?

Puedo y debo trabajar con unos pocos atributos, relevantes para mi toma de decisiones. Y debo asegurar que el resto de atributos no estudiados no afecten a las respuestas  de los participantes en la encuesta. Para ello, debo indicar al respondiente de la encuesta que asuma que el resto de atributos no mencionados son idénticos para cualquier producto mostrado.

En ocasiones es conveniente ayudar al repondiente fijando expl√≠citamente esos atributos no estudiados. Por ejemplo, supongamos¬† un Conjoint sobre coches en los que queremos estudiar los atributos marca, precio y potencia. Podr√≠a suceder que la marca A tenga mayor tradici√≥n haciendo deportivos y la marca B fabricando veh√≠culos todo terreno. El respondiente, de forma casi insconciente, al¬† elegir un veh√≠culo de la marca A podr√≠a estar manifestando su preferencia por los veh√≠culos deportivos. Para evitar este efecto, podemos incluir un mensaje como ‚Äúcompara los siguientes veh√≠culos suponiendo que todos ellos son coches utilitarios de 5 puertas y 120 CV de potencia‚ÄĚ. De esta forma, evitamos que un atributo no deseado entre en juego.

Por √ļltimo, los atributos deben ser independientes entre ellos. Si no es as√≠, podr√≠as estar contabilizando por duplicado la utilidad de los atributos.

conjoint-diseno

Definiendo niveles

Una vez tenemos claros los atributos, debemos definir qué niveles estudiamos para cada atributo. Los niveles deben ser una lista finita de posibles valores del atributo. Ten en cuenta las siguientes consideraciones para definir tus niveles:

  • Los niveles deben ser mutuamente excluyentes. Por ejemplo, si definimos un atributo ‚Äúequipamiento‚ÄĚ en un Conjoint sobre coches, la lista de niveles no puede ser ‚Äúaire acondicionado‚ÄĚ, ‚Äúairbag‚ÄĚ y ‚Äúabs‚ÄĚ. Un coche podr√≠a tener los 3 niveles simult√°neamente. En un caso as√≠, deber√≠amos crear 3 atributos, cada uno con niveles ‚Äús√≠‚ÄĚ o ‚Äúno‚ÄĚ.
  • Los niveles deben ser frases con un significado concreto y un√≠voco. Evita descripciones gen√©ricas (‚Äúaltas prestaciones‚ÄĚ, ‚Äúbajo consumo‚Ä̂Ķ).
  • Evita usar rangos de valores (‚Äúentre 90CV y 150CV‚ÄĚ), es mejor especificar valores concretos (‚Äú120 CV‚ÄĚ).
  • Trata de usar un n√ļmero similar de niveles entre todos los atributos. Existen estudios que demuestran que los atributos con m√°s niveles tienden a recibir m√°s importancia en los resultados, tanto por un efecto psicol√≥gico del respondiente como por efectos en el propio algoritmo de estimaci√≥n de utilidades.
  • No es necesario que los niveles cubran todos los posibles valores que puede tomar un atributo. Pero debemos tener claro que los resultados que obtendremos reflejar√°n √ļnicamente la variabilidad que hayamos incluido en los niveles.

Veamos un ejemplo de este efecto. Imaginemos que en nuestro Conjoint de coches definimos sólo dos niveles para el atributo potencia: 100CV y 110CV. Por el contrario, definimos gran cantidad de niveles de precio, que van desde 8.000$ a 40.000$. Probablemente la utilidad que resultará para la variación de potencia será mínima frente al precio. Podríamos llegar a la conclusión de que los consumidores no consideran la potencia de un coche en el momento de compra, cuando en realidad lo que hemos medido es que no son sensibles a una diferencia mínima de potencia.

Versiones, sets y alternativas

Un dise√Īo es un conjunto de preguntas o sets. Un set es un conjunto de alternativas de producto, entre las cuales el encuestado debe escoger su opci√≥n preferida. Y cada producto es una combinaci√≥n de niveles concretos de los atributos que estemos estudiando.

En nuestro estudio de coches, podr√≠mos definir un dise√Īo de 10 sets, con 3 alternativas por set. Para cada alternativa de cada set deber√≠amos definir un producto: un VW blanco a 15.000$, un Renault rojo a 20.000$…

En ocasiones, cuando la cantidad de atributos y niveles es grande, hacer un buen dise√Īo requerir√≠a hacer muchas preguntas o sets por respondiente. Pero no es viable hacer a una persona m√°s de 15-20 preguntas repetitivas, la calidad de la informaci√≥n que nos dar√≠a se ver√≠a afectada.

Para sortear esta dificultad se suelen definir varias versiones diferentes del dise√Īo, con productos diferentes. Dividiendo la muestra y asignando cada parte a una versi√≥n diferente, logramos mayor diversidad de informaci√≥n, lo mejora nuestras estimaciones de utilidad.

Recomendaciones generales

A continuación te facilitamos algunos consejos relativos a como dimensionar un estudio Conjoint:

  1. El n√ļmero √≥ptimo de atributos a incluir en un Conjoint es 5, el m√°ximo recomendado es 10.
  2. El n√ļmero de niveles por atributo √≥ptimo es 5, el m√°ximo recomendado es 10.
  3. El n√ļmero de sets por respondiente no deber√≠a ser superior a 20. Para evitar el agotamiento del participante se recomienda emplear entre 10-15.
  4. El n√ļmero de productos mostrados dentro de cada set deber√≠a estar entre 2 y 6. Depender√° de la complejidad de los productos mostrados (con productos m√°s complejos es mejor reducir la cantidad de alternativas a elegir en el set).

Si estamos frente a un estudio Maxdiff (recuerda: mostramos conceptos simples y preguntamos cuál es el peor y cuál es el mejor), deberías respetar estas recomendaciones:

  1. El n√ļmero m√°ximo recomendado de conceptos es 30.
  2. Se recomienda mostrar entre 3 y 6 conceptos por pregunta/set. Algunos expertos consideran que 4 es el n√ļmero √≥ptimo.
  3. El n√ļmero de sets mostrado por respondiente puede estar entre 15 y 20, ya que las preguntas Maxdiff no son tan pesadas como otro tipo de preguntas cl√°sicas.
  4. Si quieres hacer an√°lisis individualizado, es recomendable que cada individuo vea 3 o m√°s veces cada concepto. Si vas analizar los resultados a nivel de grupo, puedes mostrar 1 vez cada concepto a cada individuo, incluso menos (puedes permitir que un individuo no vea algunos conceptos).

estimacion-conjoint

Error de estimación

Cuando estimamos  las utilidades de los diferentes atributos-niveles, como en cualquier estimación estadística, cometemos un error. Este error es la suma de dos errores de naturaleza diferente:

  1. El error muestral: por el hecho de que la encuesta la administramos a una muestra del universo estudiado, y no a la totalidad del mismo, cometemos un error de estimaci√≥n. La forma de calcular este error es la misma de la de cualquier encuesta. Y la forma de reducirlo, incrementar el tama√Īo de la muestra.
  1. El error de medida: es el error cometido por las limitaciones que el propio cuestionario tiene para capturar información de cada individuo en concreto. En el caso de estudios Conjoint tipo CBC, estamos infiriendo unas utilidades a partir de simples comparaciones. Cuando decimos que el producto A es mejor que el B, no sabemos si es mucho mejor o poco. Además, cuando tenemos muchos atributos-niveles, no es viable mostrar todos los posibles productos ni todas las posibles agrupaciones de productos.

La forma de reducir este error es incrementar la cantidad de preguntas que realizamos a cada individuo. Obviamente, esto tiene un límite. Es por ello que te hemos facilitado las recomendaciones anteriores sobre cantidad de atributos, niveles, sets, etc. Si los respetas, sólo deberías preocuparte por el error muestral.

Reglas simples para fijar el tama√Īo de muestra

El an√°lisis Conjoint se basa en un modelo no lineal y eso dificulta el c√°lculo del error m√°ximo de estimaci√≥n que vamos a cometer con un tama√Īo de muestra dado. Ese error depender√° de las propias utilidades que vamos a estimar. Es un pez que se muerde la cola: para calcular el error de estimaci√≥n necesito conocer las utilidades, pero para conocer las utilidades necesito realizar el estudio.

Para resolver este problema, existen algunas reglas simples que nos ayudan¬† fijar el tama√Īo de muestra que necesitamos. La m√°s habitual es la siguiente

N x T x A / C > 1000

Donde:

  • N: Tama√Īo de la muestra
  • T: N√ļmero de sets por respondiente
  • A: N√ļmero de alternativas por set
  • C: El n√ļmero de niveles del atributo que m√°s niveles tiene. Para un maxdiff, C es directamente el n√ļmero de conceptos a evaluar.

Algunas consideraciones finales relativas al tama√Īo de la muestra:

  • En la pr√°ctica, la mayor parte de estudios se realizan con muestras de entre 200 y 1200 personas
  • 300 es un tama√Īo habitual para muestras homog√©neas de personas.
  • Si el objetivo del estudio es comparar utilidades entre grupos y detectar diferencias significativas, deber√≠as tener como m√≠nimo 200 personas en cada grupo.

 

Esperamos que este post te ayude a definir los par√°metros de dise√Īo. En el pr√≥ximo post te explicaremos c√≥mo, una vez hemos fijado los par√°metros de dise√Īo, podemos encontrar un dise√Īo concreto que satisfaga los condicionantes impuestos. Para ello, tendremos que usar una medida que nos permita saber si un dise√Īo es mejor que otro.

Categoría: conjoint Trackback | Comentarios(0)