Estadística: Probabilidades

Dentro de mi objetivo de estudiar y explicarlo, retomo el blog con una serie sobre estadística bayesiana que quiero repasar, empezando desde conceptos básicos hasta ir entrando en mayor profundidad. Comienzo con la probabilidad hablando de experimentos, sucesos independientes, dependientes, probabilidad conjunta y condicionada. Con ejemplos donde podemos contar con los dedos casos donde ver estos conceptos. También veremos que no siempre es posible conocer de forma directa ni calcular las probabilidades de cualquier suceso, introduciendo así la estadística bayesiana.

Qué quiero explicar

Los conceptos son los siguientes:

  • Qué son las probabilidades
  • Cómo dar un valor numérico a una probabilidad
  • Probabilidad en sucesos no dependientes
  • Probabilidad de sucesos que dependen de otro anterior (probabilidad condicionada)
  • Cálculo de probabilidades de varios sucesos

Probabilidad

La probabilidad es el grado de certeza de que un suceso ocurra.

Podemos dar un valor numérico a esa posibilidad expresado en %, por ejemplo indicando que hay un 90% de probabilidad de lluvia, o que hay un 50% de probabilidad que en un lanzamiento de una moneda salga cara, etc.

Matemáticamente es más práctico trabajar con valores con decimales que van entre 0 (ninguna posibilidad que ocurra) y 1 (con total seguridad que va a ocurrir, es decir el 100% de los casos). Para una moneda o un dado (suponiendo ambos perfectos) sabemos que las probabilidades de cada suceso será de 1/2 y 1/6 respectivamente, o en números reales: 0,5 y 0,16666.

Fijar valores de probabilidad

Para un experimento (así se llama al conjunto de sucesos observados) bien definido y aleatorio donde todos los sucesos tienen la misma posibilidad, podemos utilizar la regla de Laplace:

  • Un suceso seguro su probabilidad es 1
  • Un suceso imposible su probabilidad es 0
  • Y la probabilidad para sucesos equiprobables es \(p = {casosFavorables \over casosPosibles}\)

Ejemplos:

  • En un dado, la probabilidad de que salga cinco es de 1 (el único caso favorable) entre las 6 posibilidades, es decir 1/6.
  • Para el dado, que salga un número par es de 3 favorables entre 6, 3/6 → 1/2.
  • En una canoa de 10 personas con 3 hombres y 7 mujeres, la probabilidad de que escogiendo una persona al azar sea hombre es de 3/10.

También es importante ver que sabiendo las probabilidades exactas de todos los casos posibles de un experimento, la suma de las probabilidades siempre será 1.

En el caso de las monedas: \(1/2 + 1/2 = 1\), o los dados: \(1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1\)

Pero para otros casos en los que no conocemos si los sucesos son equiprobables (igualmente probables cada uno), o no conocemos el total de los sucesos posibles tenemos dos opciones:

Probabilidad frecuentista
Basada en la medición objetiva de la frecuencia de eventos en un experimento.
Ejemplos:

  • Lanzamos un experimento (digamos mil veces un dado) y obtenemos las frecuencias observadas de cada caso.
  • Tenemos un dado trucado, podríamos observar que el 5 sale un 25% de las veces, en lugar del 17% esperado, pero habría que hacer un número muy alto de lanzamientos para corroborarlo.

Pero calcular así las frecuencias de los sucesos podría ser inabordable por la cantidad necesaria de repeticiones, o simplemente porque no es viable hacer experimentos. Como podría ser estimar la efectividad inicial de un medicamento.

Probabilidad subjetiva
Interpretación subjetiva de la probabilidad según el grado de conocimiento que tenemos sobre el proceso en estudio. Cuando no tenemos suficiente información para determinar probabilidades objetivas, estimamos valores de probabilidad de forma subjetiva según nuestro juicio.

Un buen ejemplo se puede encontrar en el campo de la medicina, donde en un nuevo estudio no tenemos toda la información y debemos hacer suposiciones basadas en conocimientos relacionados que no podemos extrapolar directamente. A medida que se van encontrando evidencias en los experimentos, el grado de conocimiento aumenta y refina el valor de probabilidad estimado inicialmente.

Esta es la base de la estadística bayesiana. En lugar de determinar probabilidades basadas únicamente en frecuencias de eventos observados, la inferencia bayesiana nos permite incorporar conocimientos previos para estimar probabilidades aún cuando los datos sean escasos, y luego actualizar estas probabilidades a medida que obtenemos más información.

Probabilidad objetiva vs subjetiva
La probabilidad subjetiva y la inferencia bayesiana permiten estimar y razonar sobre probabilidades cuando no tenemos información frecuentista suficiente. A medida que aprendemos más, refinamos estas probabilidades subjetivas, volviéndose menos subjetivas y más cercanas a la realidad del sistema en estudio.

Probabilidad conjunta de dos eventos independientes (conjunción)

Cuando queremos saber la probabilidad de dos casos independientes, uno no depende del otro, lo que queremos es la probabilidad de que se den esos dos sucesos. Esto nos engaña muchas veces en el cálculo de probabilidades, a nuestra intuición le parece más fácil que lanzando 3 dados salgan exactamente 2, 1 y 4, a que salgan 1, 1, 1. Pero realmente es igual de probable.

Por ejemplo, la probabilidad de lanzar una moneda una vez y salga cara, y que la siguiente vez de nuevo cara:

  • \(P(cara ⋂ cara) = P(cara) \times P(cara) = 1/2 \times 1/2 = 1/4\) (25%)

Si la moneda estuviera trucada y la probabilidad de cara es de 0,6 (3/5) y cruz 0,4 (2/5):

  • \(P(cara ⋂ cara) = P(cara) \times P(cara) = 3/5 \times 3/5 = 9/25\) (36%)

y dos veces cruz de la misma moneda trucada:

  • \(P(cruz ⋂ cruz) = P(cruz) \times P(cruz) = 2/5 \times 2/5 = 4/25\) (16%)

Tenemos que ver que un suceso anterior no condiciona en nada al siguiente, son independientes. Si pensamos lógicamente, la moneda después de haber salido cara no hay razón que haga variar la probabilidad de que después salga una u otra cosa.

Quizás sea más intuitivo ver la probabilidad de eventos independientes como las probabilidades de que los sucesos pudieran ocurrir a la vez, por ejemplo estas son las probabilidades de uno, dos y tres lanzamientos de monedas:

Cara50%
Cruz50%
Cara y cara25%
Cara y cruz25%
Cruz y cara25%
Cruz y cruz25%
Cara, Cara, Cara12,5%
Cara, Cara, Cruz12,5%
Cara, Cruz, Cruz12,5%
Cruz, Cruz, Cruz12,5%
Cruz, Cruz, Cara12,5%
Cruz, Cara, Cara12,5%
Cruz, Cara, Cruz12,5%
Cara, Cruz, Cara12,5%

Probabilidad de dos eventos dependientes (probabilidad condicionada)

Llamamos así a la probabilidad de que ocurra un suceso B dado un suceso previo A. Es decir, sabiendo que ha ocurrido A, cuál es la probabilidad de que se dé B. Al contrario que el ejemplo de la moneda, los sucesos A y B están relacionados. Se expresa:

  • \(P(B | A)\) y veremos que es distinto que \(P(A | B)\), no es conmutativo.

Lo vemos con un ejemplo que podamos contar fácilmente para calcular diferentes probabilidades. Tenemos 32 personas con las siguientes características:

  • 16 mujeres
    • 4 tenistas
    • 8 futbolistas
    • 2 patinadoras
    • 2 esquiadoras
  • 8 hombres
    • 2 tenistas
    • 2 futbolistas
    • 4 patinadores

En esta población de 24 personas, la frecuencia de hombres es de 1/3 y de mujeres 2/3.

La frecuencia según los deportes practicados independiente del sexo, es:

  • Tenista: 6/24 → 1/4
  • Futbolista: 10/24 → 5/12
  • Patinador: 6/24 → 1/4
  • Esquiador: 2/24 → 1/12

Y las frecuencia de los deportes según el sexo:

  • Mujeres:
    • Tenista: 4/16 –> 1/4
    • Futbolista: 8/16 → 1/2
    • Patinadora: 2/16 → 1/8
    • Esquiadora: 2/16 → 1/8
  • Hombres:
    • Tenista: 2/8 → 1/4
    • Futbolista: 2/8 → 1/4
    • Patinador: 4/8 → 1/2
    • Esquiador: 0/8 → 0

Ya vamos intuyendo el porqué de que sea una cosa condicionada a otra.

Al igual que el caso de la moneda y del dado, si sumamos todas las frecuencias de cada grupo obtenemos 1.

Las listas anteriores nos sirven como recuento de casos, que podremos aplicar de forma cuantitativa a las siguientes preguntas, y nos sirve para introducirnos en las variables dependientes de una forma frecuentista (contanto casos).

  1. ¿Cuál es la probabilidad de que escogiendo a alguien al azar sea mujer y futbolista?
    Sabemos que hay 8 futbolistas mujeres del total de 24 personas, esto es 8/24 → 1/3 es decir \(P(M ⋂ F) = 1/3\) eta es la probabilidad.
    Ya no puede ser \(P(M)\times P(F)\) como antes, porque no son independientes. Que sea hombre o mujer es relevante porque según el sexo hay diferente número de practicantes.
    Destacar que en este ejemplo analizamos la probabilidad de un único evento "escoger una persona al azar" y medir esa probabilidad, recordemos que estamos viendo un caso de variables dependientes.

  2. ¿Cuál es ahora la probabilidad de que sabiendo que es mujer ésta sea futbolista?
    Aquí vemos un caso de probabilidad condicionada. Sabemos una información previa, que es mujer, ahora tengo que saber cual es la probabilidad de que sea futbolista. Mirando la lista anterior el valor es 1/2, es decir \(P(F | M) = 1/2\)
    Tenemos dos eventos el primero fue que era mujer, si vemos las listas anteriores tenemos 16 mujeres de las cuales 8 son futbolistas.

  3. ¿Cuál es la probabilidad de que sabiendo que es futbolista ésta sea mujer?
    En este otro ejemplo de probabilidad condicionada contamos todos los futbolistas (10) y después cuántas son mujeres (8): 8/10 → 4/5, \(P(M | F) = 4/5\), mucho mayor probabilidad que el caso anterior.

En los dos últimos ejemplos vemos que la probabilidad condicional no es conmutativa, no es lo mismo la condición en un sentido que en el otro: \(P(M | F) \ne P(F | M)\)