La importancia de entender una probabilidad condicionada

Siempre me ha llamado la atención el bajo nivel de conocimiento estadístico de la población general. No estoy hablando de hacer regresiones o calcular coeficientes de correlación, hablo de nociones básicas. De hecho, esta carencia de conocimiento estadístico puede extenderse a todo lo que se relaciona con las matemáticas. Al respecto, recomiendo la lectura de El hombre anumérico, de John Allen Paulos, libro en el que el autor describe este analfabetismo matemático muy extendido en la sociedad.

Paulos-matematicas

 

La probabilidad: ese concepto tan mal entendido

Justamente la noción misma de "probabilidad" es una de las peor comprendidas. Un ejemplo proporcionado por el propio Paulos: ante la afirmación de un meteorólogo en TV de que la probabilidad de que lloviese era del 50% para el sábado y del 50% el domingo, un conocido suyo afirmó "entonces la probabilidad de que llueva durante el fin de semana es del 100%"... y seguramente se quedó tan tranquilo.

Lo cierto es que en general las personas no nos manejamos muy bien con este concepto de probabilidad, un concepto de vital importancia pero que en ocasiones puede resultar abstracto. Si los juegos de azar existen, en gran parte es por la pobre comprensión que tenemos de esta idea. Acertar una quiniela futbolística nos parece engañosamente fácil (¡sólo hay que acertar 15 resultados de partidos!) y es habitual que muchos jugadores de sorteos y loterías rechacen números como el 22.222 bajo el argumento de "¡cómo va a resultar ganador un número con todo doses!", cuando en realidad tiene la misma probabilidad de salir premiado que cualquier otro número.

 

Probabilidad condicionada y probabilidad conjunta

De entre todos los conceptos relacionados con la probabilidad, las nociones de probabilidad condicionada y probabilidad conjunta seguramente son algunas de las peor comprendidas. Y de las que peores decisiones nos llevan a tomar. Para explicar ambas nociones voy a usar un ejemplo muy cercano, el ciclismo, un deporte que practico regularmente.

Cualquier habitual de este deporte suele salir a la carretera siendo consciente de que existe la posibilidad de sufrir un pinchazo. Cuando un pinchazo sucede, lo más habitual es cambiar la cámara neumática, una goma inflable que va dentro de la parte visible del neumático (cubierta) y que contiene el aire que mantiene la rueda inflada.

Un ciclista que salga habitualmente uno o dos días por semana, al cabo de un año suele pinchar entre 0 y 5 veces (supongamos 2,5 de media al año). No es mucho, ¿no? De hecho, si tenemos unas pocas nociones estadísticas, podríamos calcular la probabilidad de pinchar un día cualquiera. Veamos cómo.

Supongamos que en un año normal salimos 1,5 días por semana. Un año tiene 52 semanas. Supongamos también que unas 8 semanas al año no salimos en bicicleta por vacaciones y viajes de trabajo. Nos quedan 52-8=44 semanas.

Podemos estimar la probabilidad de sufrir un pinchazo (p1) en un año típico como

P (p1)= 2,5 / (1,5 x 44) = 3,8%

No parece mucho. Basándonos en el cálculo anterior, podríamos optar por ir sin recambios. A fin de cuentas, la probabilidad de pinchar es baja. Sin embargo, las consecuencias de pinchar y no tener recambio son serias. Puedes estar en un lugar incomunicado, en el que tengas que andar muchos kilómetros para llegar a algún medio de transporte alternativo. Si vas acompañado, alguien podrá dejarte un recambio, pero si han optado por tu estrategia (ir sin recambios) no te servirá de mucho.

Parece más lógico llevar al menos un recambio. Con esto estaríamos cubiertos, ¿no? Para saber hasta que punto estamos cubiertos, podríamos calcular la probabilidad de sufrir dos pinchazos el mismo día (p2). Una aproximación directa a este problema sería calcular esta probabilidad como

P(p2) = P (p1) x P (p1) = 3,8% x 3,8% = 0,1%

Es decir, sólo en una de cada 1.000 salidas en bicicleta voy a sufrir dos pinchazos el mismo día. A un ritmo de 1,5 salidas por semana y 44 semanas de actividad al año, esta eventualidad sólo se produciría una vez cada 15 años. Un suceso realmente raro que nos podría llevar a pensar que con un recambio tenemos suficiente.

 

Sucesos independientes

 

probabilidad-condicionada

 

El cálculo anterior conlleva una hipótesis implícita: calcular la probabilidad de que dos cosas sucedan a la vez a través del producto de dos probabilidades. Ese cálculo es correcto si suponemos que son sucesos independientes. Para verlo, recordemos el célebre teorema de Bayes:

p(A y B) = p(A | B) x p(B)

El teorema dice que la probabilidad de que A y B ocurran a la vez, es la probabilidad de que ocurra A habiendo sucedido B, lo que se expresa como P(A|B), por la probabilidad de B.

Si el hecho de que suceda A es independiente de B, la probabilidad de A condicionada a B es simplemente la probabilidad de A, lo que nos daría

p(A y B) = p(A | B) x p(B) = p(A) x p(B)

Pero, ¿qué significa que dos sucesos son independientes? En nuestro ejemplo ciclista, esto vendría a decir que una vez he pinchado, la probabilidad de volver a pinchar sería las misma de antes de sufrir un pinchazo. Es muy habitual encontrar esta independencia entre sucesos consecutivos: por ejemplo, si lanzo un dado y obtengo un 6, al volver a lanzar el dado mi probabilidad de obtener un 6 vuelve a ser la misma de mi primera tirada (probabilidad=1/6).

Sin embargo, la persona media tiende a manejar mal esta independencia entre sucesos, confundiendo la probabilidad de que dos cosas ocurran a la vez (probabilidad conjunta) con la probabilidad de que ocurra una cosa habiendo sucedido otra (probabilidad condicionada). En el ejemplo de los dados, antes de hacer mis dos tiradas, la probabilidad de obtener dos veces un 6 es de 1/6 x 1/6 = 1/36. Sin embargo, una vez he lanzado mi dado y he obtenido un 6, la probabilidad de obtener un segundo 6 es independiente del suceso anterior: es simplemente 1/6. Muchos jugadores tienden a pensar, a veces de forma inconsciente, que una vez he obtenido un 6 mi probabilidad de obtener un segundo 6 se reduce, como si el dado recordase mi primera tirada o como si tuviese una capacidad limitada de generar "seises" y se estuviese agotando.

En nuestro ejemplo ciclista, esta mala interpretación nos haría llegar a la conclusión de que, una vez he pinchado (probabilidad 3,8%), mi probabilidad de sufrir un segundo pinchazo es del 1%, algo bastante remoto. ¡Error! Una vez has pinchado, a tu neumático y a la carretera les importa poco que acabes de gastar tu recambio: el dado vuelve a girar, vuelves a tener un 3,8% de probabilidad de pinchar (quizá algo menos porque te quedan menos kms por recorrer, pero eso no tiene nada que ver con tu primer pinchazo).

Pensar que por haber pinchado una vez ya he cubierto mi cupo de mala suerte es un error como el de aquel hombre que, teniendo miedo a subir en un avión porque había leído que la probabilidad de que hubiese una bomba en un vuelo era de 1 entre 10.000, subía a los aviones con una bomba encima porque así la probabilidad de que hubiese 2 bombas pasaba a ser de 1 entre 100.000.000.

 

Probabilidad condicionada

 

probabilidad-condicionada

 

Hemos visto por lo tanto que haber pinchando una vez no reduce tu riesgo de pinchar de nuevo. Manejar correctamente esta noción de independencia de eventos ya denota un conocimiento razonable del concepto de probabilidad.

Sin embargo, todos aquellos que llevamos años haciendo ciclismo, cada vez optamos más por llevar dos recambios encima. ¿Por qué? Simplemente porque hemos aprendido que la probabilidad de sufrir un segundo pinchazo no sólo no se reduce respecto a la probabilidad del primer pinchazo, sino que... ¡aumenta!.

Puede parecer sorprendente, pero tiene su explicación. Y es algo que sucede en muchas facetas de la vida. El hecho de que un suceso pase, de entrada, es una demostración de que ese suceso puede pasar. Y si ha pasado una vez... no sólo no has cubierto tu cupo de mala suerte, sino que es justo lo contrario: puede haber razones sólidas que hagan que vuelva a suceder, más de lo que pensabas.

En el caso de la bicicleta, cuando pinchamos puede ser pura mala suerte o puede ser que tus neumáticos empiecen a estar desgastados. Si eso está pasando, tu probabilidad de pinchar no es la que probablemente estimabas. De hecho, puede ser que tengas una grieta en la cubierta y justamente estés iniciando una racha de pinchazos sin precedentes. Otro caso habitual es que, al sufrir el primer pinchazo, algún trozo de vidrio o de metal se haya quedado incrustado en la cubierta y que no lo veas fácilmente, con lo que vas a tener un segundo pinchazo garantizado.

Supongamos que gracias a la experiencia estimo que 1 de cada 4 veces en las que sufro un pinchazo, acabo sufriendo un segundo pinchazo. Eso lo podríamos expresar cómo sigue

P (p2 | p1) = 1/4 = 25%

Gracias al teorema de Bayes, puedo  calcular la probabilidad de sufrir dos pinchazos en un mismo día como

P (p2 y p1) = P (p2 | p1) x P (p1) = 25% x 3,8% = 1%

De acuerdo al calculo anterior, no voy a pinchar dos veces seguidas 1 de cada 1.000 días como inicialmente estimaba, sino 1 de cada 100 (10 veces más). Eso sería una vez cada 1,5 años.

Quizá ahora ya no parece tan exagerado ir con dos recambios encima, ¿verdad?

 

¡Suscríbete a nuestro boletín de noticias para recibir actualizaciones exclusivas y las últimas noticias!