El teorema de Bayes es uno de los teoremas más conocidos y más importantes relacionados con probabilidad. Es uno de esos resultados que por su sencillez y su utilidad deberían ser conocidos por todos. ¿Utilidad? Sí, utilidad. Y no me refiero solamente a utilidad dentro de las matemáticas, sino utilidad práctica en nuestra vida. Concretamente vamos a ver que el teorema de Bayes nos ayuda a ser un poco más optimistas en el caso de que cierta prueba diga que es casi seguro que padezcamos una enfermedad seria.
Pero vamos por partes. Creo que para comenzar lo más adecuado es enunciar dicho teorema. Ahí va:
Teorema de Bayes:
Supongamos que nuestro espacio de referencia
puede expresarse como unión de una cierta cantidad de sucesos
que son disjuntos dos a dos (es decir, que ninguna pareja formada con esos conjuntos tiene elementos en común) y tal que la probabilidad de todos ellos es mayor que cero.
Supongamos que dado un suceso cualquiera
conocemos la probabilidad de que suceda
condicionado a que sucede cualquiera de los
, que denotamos por
. Entonces podemos calcular la probabilidad de que suceda cada uno de los
condicionado a que sucede
,
, de la siguiente forma:
La probabilidad de suceso
puede expresarse de la siguiente forma (teorema de la probabilidad total):
Como decía antes, un teorema muy conocido para cualquiera que haya estudiado unos mínimos de probabilidad que Thomas Bayes enunció a mediados del siglo XVIII.
Pero de todas formas puede ser un resultado poco conocido por mucha gente, y, por qué no decirlo, puede echar un poco para atrás su formulación tal cual la hemos planteado. En este momento os pido que no os vayáis, que no os marchéis sin continuar leyendo este post. Que no abandonéis la lectura de estas líneas hasta que no las hayáis terminado todas, porque si os vais no tendrá ningún sentido. Porque lo importante de este post no es lo que llevamos, sino lo que nos queda. Vamos a ver una aplicación de dicho resultado que además nos va a ayudar a ser optimistas ante una aparente mala noticia.
Estos que aparecen en el teorema son un conjunto de partes en las que podemos dividir nuestra situación inicial de forma que dos partes distintas no tienen elementos en común y todas las partes juntas recomponen dicha situación. En nuestro ejemplo de aplicación del teorema, el conjunto inicial van a ser los habitantes de un país y los
van a ser dos: padecer una enfermedad,
(de enfermo), y no padecerla,
(de sano). Está claro que no tienen elementos comunes (no puede haber nadie que padezca y no padezca la enfermedad a la vez) y que si junto a todos los que padecen dicha enfermedad con los que no la padecen obtengo el conjunto de la población.
Supongamos que esta enfermedad es una de esas a las que todos tenemos miedo, de esas que hasta casi nos da miedo pronunciar: cáncer, SIDA, etc. Y supongamos que estamos participando en una campaña de concienciación sobre dicha enfermedad en la que se le va a realizar esta prueba a, digamos, 100000 personas.
Vamos a poner que la prueba es fiable al 95%. ¿Qué significa esto? Pues muy sencillo: que da positivo el 95% de las veces que se la hacemos a alguien enfermo y que da negativo el 95% de las veces que se la aplicamos a alguien sano. Y supongamos también que el porcentaje de personas que la padecen en realidad es el 1%. Es decir, una de cada cien personas tienen realmente dicha enfermedad.
Bueno, con todo esto nos hacemos la prueba…y el resultado es positivo. ¿Debemos venirnos abajo? ¿Debemos pensar que está todo perdido? ¿Cuál es realmente la probabilidad de que padezcamos realmente la enfermedad? La cosa parece muy clara, pero quizás no lo esté tanto.
Vamos a ponerle nombre a todo. Las probabilidades de «enfermo» y de «sano» son las siguientes:
ya que se sabe de antemano (esto suelen ser estimaciones, pero para el caso no es relevante) que el 1% de la población padece realmente la enfermedad.
Si llamamos al suceso «dar positivo en la prueba», tenemos que la probabilidad de dar positivo sabiendo que se está enfermo es:
y que la probabilidad de dar positivo estando sano es
por la fiabilidad de la prueba que teníamos al principio. Por otro lado, la probabilidad de , por lo comentado al final de la formulación del teorema, se puede calcular así:
Recordad que ya nos hemos hecho la prueba, y que el resultado de la misma ha sido positivo. Lo que queremos saber es qué probabilidad hay de que en realidad padezcamos dicha enfermedad a la vista de este resultado de la prueba. Es decir, queremos calcular la probabilidad de padecer la enfermedad condicionada a que el resultado de la prueba ha sido positivo, esto es, . Y para ello utilizamos el teorema de Bayes:
¡¡Un 16%!! Es decir, en un caso como el descrito hay solamente un 16% de posibilidades de padecer la enfermedad habiendo dado positivo en la prueba, porcentaje que choca tremendamente con la fiabilidad inicial de dicha prueba, que recordemos era del 95%.
¿Qué nos debe enseñar esto? Pues que siempre hay que ser cautelosos con los resultados, que no hay que perder la esperanza por algo así, ya que igual no estamos interpretando bien los números que hay detrás de estos estudios. Evidentemente habrá gente que, a la postre, en realidad tenga dicha enfermedad, pero será un pequeño porcentaje (16%) respecto al que en teoría parecía ser (95%). Así que tranquilidad, paciencia y optimismo. Y, eso sí, corriendo al médico a confirmar si padecemos la enfermedad o no, que una cosa no quita a la otra.
Y todo esto, repito, con una prueba cuya fiabilidad es del 95%. Imaginaos qué porcentaje nos saldría si la prueba tiene un 80% de fiabilidad, o un 60%, o menos (que las hay). Y que luego nos quieran vender «la máquina de la verdad» como algo de lo que nos podemos fiar…
Fuente:
- El hombre anumérico, de John Allen Paulos.
¿Te ha gustado la entrada? Puedes invitarme a un café, Gauss te lo agradecerá 😉
Información Bitacoras.com…
Valora en Bitacoras.com: El teorema de Bayes es uno de los teoremas más conocidos y más importantes relacionados con probabilidad. Es uno de esos resultados que por su sencillez y su utilidad deberían ser conocidos por todos. ¿Utilidad? Sí, util……
Muy interesante, aunque me cuesta encontrar referencias a que un 95% de fiabilidad implique lo que se dice, ya que entiendo que la probabilidad de falsos positivos y falsos negativos no tiene por qué ser la misma en este tipo de pruebas (5% en este ejemplo).
Ya sé que esto era sólo un ejemplo, sólo que el sorprendente resultado me ha picado la curiosidad y me he puesto a buscar por ahí cómo se define la fiabilidad de las pruebas y no me ha quedado muy claro.
¡Gracias por el post!
El teorema de Bayes es un resultado que nos ayuda a abordar problemas estadísticos desde una perspectiva distinta, en mi caso lo utilizo en estadística industrial (para evaluar el comportamiento de un proceso sin necesidad de verificar la calidad del producto), con resultados muy confiables
El planteamiento es magnífico para demostrar que la fiabilidad real de ciertas pruebas contradice la realidad en muchos casos. Desafortunadamente muchas enfermedades graves disponen de pruebas cuyo resultado positivo confirma en un 100% la existencia de la enfermedad analizada.
La de discusiones que he tenido por estos asuntos…
Otra aplicación interesante es en los filtros anti-spam.
O el famoso problema del taxi.
Por favor suban más artículos de Estadística, porque la verdad de las cosas es que la estadística es una ciencia en constante evolución, además de que es un tema apasionante.
Lo que me encanta de la estadística es que no es tan exacta como las matemáticas ni tampoco tan subjetiva como la filosofía. Es una alquimia muy curiosa y útil en la vida diaria.
Muy buen artículo
El articulo está muy bien, pero me gustaría comentar una cosa que he leído y que no me ha gustado nado dado que este es un bloc matemático: «Y supongamos también que el porcentaje de personas que la padecen en realidad es el 1%. Es decir, una de cada cien personas tienen realmente dicha enfermedad.» Eso es falso. Quiero decir, se dice muchas veces, en términos coloquiales, pero no deja de ser falso. Una de cada cien personas no tiene porque tener esa enfermedad, pueden ser 2, 3 o ninguna. Me acuerdo como nuestro profesor de estadística nos lo decía,… Lee más »
Esta entrada contiene un error de bulto relacionado con el uso y abuso del teorema de Bayes aplicado a la vida cotidiana. Depende del grupo que elijas para tu P(E), el resultado de P(E|B) será más o menos preciso.
Ya lo comenté detalladamente hace unos días, pero no apareció mi mensaje. A ver si ahora sale éste.
El siguiente artículo parece interesante. Sobre todo por que incluye un nomograma.
http://www.myreckonings.com/modernnomograms/Doc_What_Are_My_Chances_UMAP_32-4-2011.pdf
[…] abril hablamos sobre Bayes y las pruebas de detección de enfermedades, os presentamos a Grace Murray Hopper, la mamá del COBOL y comentamos cosas sobre el teorema de […]
[…] la regla y el compás por piezas de mecano para bisecar ¡y trisecar! ángulos Bayes y las pruebas de detección de enfermedades Grace Murray Hopper, mucho más que la mamá del COBOL ¿Existe algún resultado tipo el teorema de […]
[…] os gusta este tema debéis leer Bayes y las pruebas de detección de enfermedades de gaussianos, y Opiniones, hechos e inferencia bayesiana de Alberto […]
Aceptando los supuestos del ejemplo planteado, y ya que no se ha dicho en ninguno de los comentarios, quiero incluir el dato (para tranquilidad de los que den negativo en una prueba con estas condiciones), de que aplicando Bayes con los correspondientes valores, la probabilidad estar sano es de 0,99946865.
Resumiendo: se pueden esperar 5 individuos sanos entre cada 6 con resultado positivo y 1 enfermo entre cada 2000 con resultado negativo.
Hay que concluir que una prueba con un 95% de fiabilidad no es suficientemente «fiable» para un sujeto concreto, aunque sí sirva e efectos estadísticos.
[…] El interés práctico relacionado con el Ébola es que una tasa de 99% de verdaderos positivos (también conocida como sensibilidad del 99), habla de lo que podría, informalmente llamarse como la “exactitud” de resultado positivos de la prueba; pero de lo que no habla es sobre la probabilidad de que un resultado negativo de la prueba deba ser creído. Para calcular esa probabilidad, la tasa de falsos negativos se debe combinarse con la probabilidad a priori de que la persona examinada no esté afectado (por definición, es el complementario de la probabilidad de que se vean afectados) con la enfermedad, así como con la tasa… Lee más »
¡Me encantó el artículo! Una explicación bastante ligera dirigida al público general desconectado de la estadistica. Denota la abundancia de información estadistica en la vida cotidiana.
El teorema de bayes tiene gran variedad de aplicaciones en áreas tan distantes como diversas. En BI (el área donde tengo competencia) lo usamos para buscar patrones y relaciones cuando la información histórica en las tablas de probabilidades condicionadas es inexacta o en tablas de contingencia donde la evidencia conocida está incompleta. Hasta ahora con resultados óptimos.
[…] Pues bien, esto se aplica en diagnósticos médicos. Se dice que, partiendo de que un porcentaje reducido de la población padece la enfermedad Z (prevalencia), el que alguien dé positivo en un test para detectar Z, sabiendo además que las pruebas no son fiables al 100%, da una probabilidad sensiblemente inferior a 1 de que esa persona tenga realmente Z. Y por ser menor que 1, habrá casos de falsos positivos. […]
[…] Una explicación sencilla de cómo se calcularían de esta forma se puede encontrar en el blog gaussianos. Esa notación puede ser más útil para aplicar probabilidades individuales (ya que la […]
En un concurso de oratoria han pasado a la etapa final 6 estudiantes (2 de 1°, 2 de 2° y 2 de 3°). Si se va sortear el orden de participación para dicha etapa. ¿de cuantas maneras pueden asignarse los turnos si…
A) Se quiere que el primer turno no sea para alguien de 2°?
B) se quiere que el primer turno y el ultimo sean para los de 3°?
C) se quiere que los alumnos de 1 pasen en turnos seguidos?
Os recomiendo un vídeo de YouTube que explica de forma clara y didáctica el planteamiento y la demostración del Toerema de Bayes. Está en una lista de reproducción de varios vídeos con problemas resueltos y muy bien explicados. Saludos.
https://youtu.be/umHy_67FAlw
Como extensión de este excelente artículo, os recomiendo los siguientes vídeos de YouTube, especialmente el primero, en el que destaca el planteamiento la demostración y una representación gráfica muy didática:
https://youtu.be/umHy_67FAlw
https://youtu.be/mIYNaLE_5Ns
Muchas gracias, les echaré un vistazo :).