El teorema de Bayes es uno de los teoremas más conocidos y más importantes relacionados con probabilidad. Es uno de esos resultados que por su sencillez y su utilidad deberían ser conocidos por todos. ¿Utilidad? Sí, utilidad. Y no me refiero solamente a utilidad dentro de las matemáticas, sino utilidad práctica en nuestra vida. Concretamente vamos a ver que el teorema de Bayes nos ayuda a ser un poco más optimistas en el caso de que cierta prueba diga que es casi seguro que padezcamos una enfermedad seria.

Pero vamos por partes. Creo que para comenzar lo más adecuado es enunciar dicho teorema. Ahí va:

Teorema de Bayes:

Supongamos que nuestro espacio de referencia U puede expresarse como unión de una cierta cantidad de sucesos \{A_1,A_2,\ldots,A_n \} que son disjuntos dos a dos (es decir, que ninguna pareja formada con esos conjuntos tiene elementos en común) y tal que la probabilidad de todos ellos es mayor que cero.

Supongamos que dado un suceso cualquiera B conocemos la probabilidad de que suceda B condicionado a que sucede cualquiera de los A_i, que denotamos por P(B|A_i). Entonces podemos calcular la probabilidad de que suceda cada uno de los A_i condicionado a que sucede B, P(A_i|B), de la siguiente forma:

P(A_i|B)=\cfrac{P(B|A_i) \cdot P(A_i)}{P(B)}

La probabilidad de suceso B puede expresarse de la siguiente forma (teorema de la probabilidad total):

P(B)=P(B|A_1) \cdot P(A_1) + P(B|A_2) \cdot P(A_2) + \ldots + P(B|A_n) \cdot P(A_n)

Como decía antes, un teorema muy conocido para cualquiera que haya estudiado unos mínimos de probabilidad que Thomas Bayes enunció a mediados del siglo XVIII.

Pero de todas formas puede ser un resultado poco conocido por mucha gente, y, por qué no decirlo, puede echar un poco para atrás su formulación tal cual la hemos planteado. En este momento os pido que no os vayáis, que no os marchéis sin continuar leyendo este post. Que no abandonéis la lectura de estas líneas hasta que no las hayáis terminado todas, porque si os vais no tendrá ningún sentido. Porque lo importante de este post no es lo que llevamos, sino lo que nos queda. Vamos a ver una aplicación de dicho resultado que además nos va a ayudar a ser optimistas ante una aparente mala noticia.

Estos A_i que aparecen en el teorema son un conjunto de partes en las que podemos dividir nuestra situación inicial de forma que dos partes distintas no tienen elementos en común y todas las partes juntas recomponen dicha situación. En nuestro ejemplo de aplicación del teorema, el conjunto inicial van a ser los habitantes de un país y los A_i van a ser dos: padecer una enfermedad, E (de enfermo), y no padecerla, S (de sano). Está claro que no tienen elementos comunes (no puede haber nadie que padezca y no padezca la enfermedad a la vez) y que si junto a todos los que padecen dicha enfermedad con los que no la padecen obtengo el conjunto de la población.

Supongamos que esta enfermedad es una de esas a las que todos tenemos miedo, de esas que hasta casi nos da miedo pronunciar: cáncer, SIDA, etc. Y supongamos que estamos participando en una campaña de concienciación sobre dicha enfermedad en la que se le va a realizar esta prueba a, digamos, 100000 personas.

Vamos a poner que la prueba es fiable al 95%. ¿Qué significa esto? Pues muy sencillo: que da positivo el 95% de las veces que se la hacemos a alguien enfermo y que da negativo el 95% de las veces que se la aplicamos a alguien sano. Y supongamos también que el porcentaje de personas que la padecen en realidad es el 1%. Es decir, una de cada cien personas tienen realmente dicha enfermedad.

Bueno, con todo esto nos hacemos la prueba…y el resultado es positivo. ¿Debemos venirnos abajo? ¿Debemos pensar que está todo perdido? ¿Cuál es realmente la probabilidad de que padezcamos realmente la enfermedad? La cosa parece muy clara, pero quizás no lo esté tanto.

Vamos a ponerle nombre a todo. Las probabilidades de «enfermo» y de «sano» son las siguientes:

P(E)=\cfrac{1000}{100000}=0.01 \; ; \; P(S)=\cfrac{99000}{100000}=0.99

ya que se sabe de antemano (esto suelen ser estimaciones, pero para el caso no es relevante) que el 1% de la población padece realmente la enfermedad.

Si llamamos B al suceso «dar positivo en la prueba», tenemos que la probabilidad de dar positivo sabiendo que se está enfermo es:

P(B|E)=0.95

y que la probabilidad de dar positivo estando sano es

P(B|S)=0.05

por la fiabilidad de la prueba que teníamos al principio. Por otro lado, la probabilidad de B, por lo comentado al final de la formulación del teorema, se puede calcular así:

P(B)=P(B|E) \cdot P(E) + P(B|S) \cdot P(S)=0.95 \cdot 0.01+0.05 \cdot 0.99=0.059

Recordad que ya nos hemos hecho la prueba, y que el resultado de la misma ha sido positivo. Lo que queremos saber es qué probabilidad hay de que en realidad padezcamos dicha enfermedad a la vista de este resultado de la prueba. Es decir, queremos calcular la probabilidad de padecer la enfermedad condicionada a que el resultado de la prueba ha sido positivo, esto es, P(E|B). Y para ello utilizamos el teorema de Bayes:

P(E|B)=\cfrac{P(B|E) \cdot P(E)}{P(B)}=\cfrac{0.95 \cdot 0.01}{0.059} \approx 0.16

¡¡Un 16%!! Es decir, en un caso como el descrito hay solamente un 16% de posibilidades de padecer la enfermedad habiendo dado positivo en la prueba, porcentaje que choca tremendamente con la fiabilidad inicial de dicha prueba, que recordemos era del 95%.

¿Qué nos debe enseñar esto? Pues que siempre hay que ser cautelosos con los resultados, que no hay que perder la esperanza por algo así, ya que igual no estamos interpretando bien los números que hay detrás de estos estudios. Evidentemente habrá gente que, a la postre, en realidad tenga dicha enfermedad, pero será un pequeño porcentaje (16%) respecto al que en teoría parecía ser (95%). Así que tranquilidad, paciencia y optimismo. Y, eso sí, corriendo al médico a confirmar si padecemos la enfermedad o no, que una cosa no quita a la otra.

Y todo esto, repito, con una prueba cuya fiabilidad es del 95%. Imaginaos qué porcentaje nos saldría si la prueba tiene un 80% de fiabilidad, o un 60%, o menos (que las hay). Y que luego nos quieran vender «la máquina de la verdad» como algo de lo que nos podemos fiar…


Fuente:

  • El hombre anumérico, de John Allen Paulos.
Print Friendly, PDF & Email