Saltar al contenido principal

Probabilidad

En esta sección explico aspectos básicos sobre la probilidad.

En psicología, entender bien la probabilidad es fundamental, debido a dos motivos.

  • Porque los experimentos están influenciados por aleatoriedad y variabilidad. La aleatoriedad se refiere al hecho de que los resultados dependen del azar. La variabilidad se refiere al hecho de que los fenómenos estudiados son variables. Sin embargo, esto no es una característica especial de la psicología, sino que está presente en muchas ciencias.
  • Porque en psicología las leyes científicas son probabilíticas, en oposición a deterministas.

Sobre el segundo punto, hay que entender que en las ciencias hay dos tipos de leyes:

  1. Leyes deterministas: al repetir un experimento con las mismas condiciones, se obtiene el mismo resultado. Esto es cierto en las ciencias formales, como matemática, física o química. Por ejemplo, dos átomos de hidrógeno (H) y uno de oxígeno (O) forman siempre agua (H2O).
  2. Leyes probabilísticas: al repetir un experimento con las mismas condiciones, se obtienen resultados diferentes. Esto es cierto en las ciencias naturales y sociales, como la medicina o la psicología. Por ejemplo, las personas con alta agresividad tienen mayor probabilidad de cometer un delito.

La psicología pertenece al segundo grupo. Por eso en psicología puedo encontrar tendencias o predecir datos con determinada probabilidad, pero nunca puedo decir con total certeza que algo es de una manera determinada.

Por todo ello, entender cómo funciona la probabilidad es extremadamente relevante. La probabilidad es precisamente la disciplina que estudia las leyes de los experimentos aleatorios. De esta manera, permite predecir sucesos. Es decir, permite hacer predicciones de características de las variables, como la media, la varianza, la correlación, etcétera. Esto es extremadamente relevante, en concreto en la estadística inferencial, cuya función es generalizar esos resultados a la población.

Teoría de la probabilidad

La teoría de la probabilidad fue creada para los juegos de azar. Como ya he explicado, la probabilidad estudia las leyes de los experimentos aleatorios (EA). Es decir: si repetimos un experimento aleatorio un número alto de veces, en las mismas condiciones, observaremos cómo la frecuencia relativa del suceso se estabiliza. Es decir: se puede calcular la probabilidad de ocurrencia.

Por ejemplo, cada vez que se lanza un dado puede salir cualquier de los 6 números. Si repetimos ese experimento 6000 veces, cabría esperar que cada número salga 1000 veces. Esas son las leyes de la probabilidad.

Por otro lado, la teoría de la probabilidad estipula que al hacer experimentos aleatorios, es imposible predecir el resultado.

Conceptualización

La probabilidad de un suceso es un valor numérico entre 0 y 1 que mide el grado de certeza de la ocurrencia de ese suceso.

Se define formalmente como el límite de la frecuencia relativa de dicho suceso en una serie de pruebas que se prolonga indefinidamente, o como una medida asignada en un espacio de probabilidad.

Un suceso con probabilidad 0 se considera imposible, mientras que un suceso con probabilidad 1 se considera seguro o cierto.

En términos prácticos, la probabilidad puede interpretarse como la expectativa o creencia razonada de que un evento particular suceda o no, basada en el conocimiento previo o en la evidencia empírica disponible.

Experimento aleatorio (EA)

Los experimentos aleatorios tienen determinadas propiedades, que son:

  1. Deben ser fenónemos bien delimitados
  2. Se debe poder repetir en las mismas condiciones
  3. En cada ensayo se obtiene un sólo resultado
  4. Es imposible predecir el resultado

Espacio muestral

Los experimentos aleatorios tienen un espacio muestral (EE). El espacio muestral es el conjunto de resultados posibles de un experimento aleatorio.

Por ejemplo, en el caso de un lanzamiento de un dado:

E={1,2,3,4,5,6}E = \lbrace{1, 2, 3, 4, 5, 6}\rbrace

Suceso

Un suceso es cada uno de los posibles resultados de un experimento aleatorio, que tiene una determinada probabilidad.

Por ejemplo, sucesos posibles al lanzar un dado 🎲 sería:

  • Que salga el número 6:
    • A={6}A = \lbrace{6}\rbrace
    • La probabilidad sería: PA=16=0.1667=16.67%P_A = \frac{1}{6} = 0.1667 = 16.67\%
  • Que salga un número par:
    • B={2,4,6}B = \lbrace{2, 4, 6}\rbrace
    • La probabilidad sería:PB=36=0.5=50%P_B = \frac{3}{6} = 0.5 = 50\%
  • Que salga un número menor que 4:
    • C={1,2,3}C = \lbrace{1, 2, 3}\rbrace
    • La probabilidad sería: PC=36=0.5=50%P_C = \frac{3}{6} = 0.5 = 50\%

Tipos de suceso

En teoría de la probabilidad, los sucesos se clasifican en base a su naturaleza y relación con el espacio muestral:

  • Imposible (\emptyset), cuando no puede suceder. Por ejemplo, sacar un 7 en un dado.
  • Unitario o elemental, cuando es un sólo elemento del espacio muestral. Por ejemplo, sacar un 6 en un dado.
  • Seguro, cuando el suceso incluye todo el espacio muestral. Por ejemplo, sacar un número mayor que cero en un dado.

Relación entre sucesos

La relación entre sucesos puede describirse de varias maneras:

  • Complementario (Aˉ\bar{A}): cuando un suceso se realiza sólo si el otro no se ha verificado. Por ejemplo, si el suceso AA es obtener un número par al lanzar un dado; el suceso complementario Aˉ\bar{A} es sacar los números 1, 3 o 5. Es decir Aˉ={1,3,5}\bar{A} = \lbrace{1,3,5}\rbrace.
  • Unión (ABA \cup B): cuando un suceso AA se verifica si se verifica otro suceso BB. Por ejemplo, si el suceso A es obtener un número par y el suceso B es obtener un número inferior a 3, puedo decir que AB={1,2,4,6}A \cup B = \lbrace{1, 2, 4, 6}\rbrace, porque si sale cualquiera de esos valores, los dos sucesos se verifican.
  • Intersección (ABA \cap B): ocurre cuando ambos sucesos AA y BB deben suceder simultáneamente para que se verifiquen. Siguiendo con el ejemplo anterior, si AA es obtener un número par y BB es obtener un número menor que 3, entonces AB={2}A \cap B = \lbrace{2}\rbrace, ya que 2 es el único número que es a la vez par y menor que 3.
  • Incompatibles (también llamados disjuntos o excluyentes): dos sucesos son incompatibles si no pueden ocurrir al mismo tiempo, es decir, su intersección es el suceso imposible (AB=A \cap B = \emptyset). Por ejemplo, en el lanzamiento de un dado, los sucesos sacar un número par y sacar un número impar son incompatibles, ya que no hay ningún número que sea a la vez par e impar.
Ejercicio práctico

Dada la siguiente población: P={ENE, FEB, MAR, ABR, MAY, JUN, JUL, AGO, SEP, OCT, NOV, DIC}P = \{\text{ENE, FEB, MAR, ABR, MAY, JUN, JUL, AGO, SEP, OCT, NOV, DIC}\}.

Calcula los sucesos:

  1. S1=S1 = Primer mes del año.
  2. S2=S2 = Primeros tres meses del año.
  3. S3=S3 = Últimos tres meses del año.
  4. S4=S1S2S4 = S1 \cup S2 (unión).
  5. S5=S1S2S5 = S1 \cap S2 (intersección).
  6. S6=S2S1S6 = S2 - S1.
  7. S1=S3ˉS1 = \bar{S3} (complementario).

Resultado

  1. S1=ENES1 = {\text{ENE}}
  2. S2=ENE, FEB, MARS2 = {\text{ENE, FEB, MAR}}
  3. S3=OCT, NOV, DICS3 = {\text{OCT, NOV, DIC}}
  4. S4=S1S2=ENE, FEB, MARS4 = S1 \cup S2 = {\text{ENE, FEB, MAR}}
    • Nota: S1 está incluido en S2, por lo que la unión es igual a S2.
  5. S5=S1S2=ENES5 = S1 \cap S2 = {\text{ENE}}
    • Nota: S1 es un subconjunto de S2, por lo que la intersección es S1.
  6. S6=S2S1=FEB, MARS6 = S2 - S1 = {\text{FEB, MAR}}
    • Nota: Quitamos ENE de S2S2 ya que S1S1 solo contiene ENE.
  7. El complementario de S3S3, el cual incluye todos los meses del año excepto los últimos tres, sería S3ˉ=ENE, FEB, MAR, ABR, MAY, JUN, JUL, AGO, SEP\bar{S3} = {\text{ENE, FEB, MAR, ABR, MAY, JUN, JUL, AGO, SEP}}.

Cálculo de probabilidades

La probabilidad de un suceso se obtiene calculando la frecuencia relativa de ocurrencia de cada suceso elemental, resultado de repetir un experimento aleatorio un gran número de veces bajo las mismas condiciones.

La probabilidad de un suceso es siempre un valor entre 0 y 1. Y evidentemente, la suma de las probabilidades de todos los sucesos del espacio muestral es 1. Asimismo, se que los sucesos tienen relaciones, como de complementariedad, de unión, de intersección o de incompatibilidad.

Con esto en mente, puedo expresar los sucesos de forma matemática para calcular las probabilidades despejando incógnitas en una ecuación.

Probabilidad relativa: P(A)

P(A)=nanP(A) = \frac{n_a}{n}

Donde:

  • nan_a es el número de casos favorables
  • nn es el número de casos posibles

Por ejemplo, al lanzar un dado 🎲, la probabilidad del suceso de que salga el número 6, sería PA=16=0.1667=16.67%P_A = \frac{1}{6} = 0.1667 = 16.67\%

Probabilidad condicionada: P(A|B)

Es la probabilidad de un suceso AA, en base a la información de un suceso BB ya verificado.

Es decir, P(AB)P(A|B) se puede leer como probabilidad de A, dado B.

La fórmula es:

P(AB)=P(AB)P(B)P(A|B)=\frac{P(A \cap B)}{P(B)}

Es decir, la probabilidad de que suceda A dado B, se calcula dividiendo la probabilidad de la intersección de ambos sucesos, entre la probabilidad del suceso B.

Por ejemplo: dado el siguiente conjunto de datos:

SexoEdad
Varón18
Mujer20
Varón21
Mujer19
Mujer20
Mujer22

¿Cuál es la probabilidad de que una persona sea mujer, dado que tenga menos de 21 años?

P(AB)=P(AB)P(B)P(A|B)=\frac{P(A \cap B)}{P(B)}
  • P(A)P(A): Probabilidad de ser mujer
  • P(B)P(B): Probabilidad de tener menos de 21 años
  • P(AB)P(A|B): Probabilidad de ser mujer dado que tenga menos de 21 años
  • P(AB)P(A \cap B): probabilidad de que los sucesos A y B sucedan simultáneamente, es decir: intersección.

Empezamos calculando la probabilidad del suceso B (P(B)P(B)). En total hay 6 personas, de las cuales 4 tienen menos de 21 años.

SexoEdad
Varón18 👈
Mujer20 👈
Varón21
Mujer19 👈
Mujer20 👈
Mujer22

Es decir:

P(B)=46=0.6667P(B) = \frac{4}{6} = 0.6667

Ahora calculo P(AB)P(A \cap B), es decir: la probabilidad de que se den A y B al mismo tiempo. Mirando la tabla, vemos que hay 3 mujeres que sean menores de 21 años.

SexoEdad
Varón18
Mujer20 👈
Varón21
Mujer19 👈
Mujer20 👈
Mujer22

Por lo tanto:

P(AB)=36=0.5P(A \cap B) = \frac{3}{6} = 0.5

Y finalmente puedo aplicar la fórmula:

P(AB)=P(AB)P(B)=0.50.6667=0.75P(A|B)=\frac{P(A \cap B)}{P(B)} = \frac{0.5}{0.6667} = 0.75

Es decir, la probabilidad de que una persona de esa muestra sea mujer dado que la persona tiene menos de 21 años es del 75%.

Propiedades de la probabilidad condicionada
  • Independencia: cuando los sucesos A y B son independientes, P(AB)=P(A)P(A|B) = P(A). Por ejemplo, si tienes dos lanzamientos de una moneda, el resultado del primer lanzamiento no afecta el resultado del segundo lanzamiento. Es decir, la probabilidad de A es la misma independientemente de lo que haya salido antes.
  • Dependencia: si los sucesos A y B son dependientes, P(AB)P(A)P(A|B) \neq P(A). Por ejemplo, si tienes una baraja de cartas y sacas una carta sin devolverla, la probabilidad de sacar una segunda carta de un tipo específico cambia en función de la carta que ya se ha retirado.

Por otro lado, la Ley Multiplicativa de la probabilidad nos dice que, si quiero calcular la probabilidad de que dos eventos, AA y BB, ocurran en secuencia, multiplicamos la probabilidad del primer evento por la probabilidad del segundo evento dado que el primer evento ha ocurrido.

Matemáticamente, esto se representa como:

P(AB)=P(A)×P(BA)P(A \cap B) = P(A) \times P(B | A)

Esta fórmula asume que estamos tratando con eventos dependientes, es decir, que la ocurrencia del evento AA de alguna manera afecta la probabilidad de que ocurra el evento BB.

Sin embargo, si los eventos son independientes, es decir, la ocurrencia de AA no afecta la probabilidad de BB, entonces la ley se simplifica a:

P(AB)=P(A)×P(B)P(A \cap B) = P(A) \times P(B)

Esto se debe a que para eventos independientes, P(BA)=P(B)P(B | A) = P(B), la probabilidad de BB no cambia, independientemente de si AA ha ocurrido o no.

Probabilidad de sucesos complementarios: P(Aˉ)

La probabilidad de que ocurra un suceso complementario se calcula como el complemento de la probabilidad del suceso original. Matemáticamente, si tenemos un suceso AA, el suceso complementario Aˉ\bar{A} (también representado como AcA^c) incluye todos los resultados que no son AA. La probabilidad de Aˉ\bar{A} se expresa como:

P(Aˉ)=1P(A)P(\bar{A}) = 1 - P(A)

Esto se debe a que la probabilidad total del espacio muestral es siempre 1, y AA y Aˉ\bar{A} son colectivamente exhaustivos, cubriendo todo el espacio muestral sin superposición. Por lo tanto, la probabilidad de que ocurra AA más la probabilidad de que ocurra Aˉ\bar{A} debe sumar 1.

Por ejemplo, si la probabilidad de sacar un as en una baraja de cartas estándar es P(A)=452P(A) = \frac{4}{52} ya que hay 4 ases en una baraja de 52 cartas, entonces la probabilidad de no sacar un as es:

P(Aˉ)=1452=4852=1213P(\bar{A}) = 1 - \frac{4}{52} = \frac{48}{52} = \frac{12}{13}

Esto significa que hay una probabilidad de 1213\frac{12}{13} de sacar una carta que no sea un as cuando se selecciona una carta al azar de una baraja completa sin jokers.

Probabilidad de sucesos excluyentes: A ∩ B = ∅

Sucesos excluyentes son aquellos que no pueden suceder simultáneamente. Si dos sucesos AA y BB son excluyentes, entonces la ocurrencia de AA impide la ocurrencia de BB y viceversa.

Matemáticamente, esto se expresa como AB=A \cap B = \emptyset, donde \emptyset representa el conjunto vacío. La probabilidad de que ocurra AA o BB se calcula como la suma de sus probabilidades individuales:

P(AB)=P(A)+P(B)P(A \cup B) = P(A) + P(B)

Esta fórmula es válida solo cuando AA y BB son sucesos mutuamente excluyentes. No se puede aplicar a sucesos que tienen la posibilidad de ocurrir juntos.

Por ejemplo, si lanzamos un dado, la probabilidad de sacar un número par P(A)P(A) o un número impar P(B)P(B) es la suma de las probabilidades de sacar un número par y un número impar, respectivamente. Dado que estos eventos son excluyentes (no puedo sacar un número que sea a la vez par e impar), puedo aplicar la ley de la suma:

P(AB)=P(A)+P(B)=36+36=66=1P(A \cup B) = P(A) + P(B) = \frac{3}{6} + \frac{3}{6} = \frac{6}{6} = 1
Ley de la Suma

La Ley de la Suma nos ayuda a determinar la probabilidad de que ocurra al menos uno de dos eventos, AA o BB. Se expresa de la siguiente manera para eventos mutuamente excluyentes, donde la ocurrencia de uno excluye la ocurrencia del otro:

P(AB)=P(A)+P(B)P(A \cup B) = P(A) + P(B)

Esto refleja el hecho de que al lanzar un dado, siempre obtendremos un número que es o bien par o bien impar.

Probabilidad de sucesos no-excluyentes A ∩ B ≠ ∅

Cuando hablamos de sucesos no excluyentes, nos referimos a eventos que pueden ocurrir al mismo tiempo. Estos sucesos comparten algunos resultados en común, lo que significa que la intersección de los conjuntos AA y BB no es vacía (ABA \cap B \neq \emptyset).

Para calcular la probabilidad de que ocurra el evento AA o el evento BB, o ambos, se utiliza la siguiente fórmula que ajusta la ley de la suma para tener en cuenta la superposición:

P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)

La probabilidad de la intersección P(AB)P(A \cap B) se resta para corregir la sobreestimación que ocurre al sumar directamente P(A)P(A) y P(B)P(B), ya que la probabilidad de la intersección ha sido contada en ambas.

Por ejemplo, imagina que tienes una baraja de cartas y quieres calcular la probabilidad de sacar una carta que sea o un as AA o una carta de corazones BB. Algunas cartas de as también son de corazones, por lo que tienes que ajustar la probabilidad para esta superposición. Si la probabilidad de sacar un as es 452\frac{4}{52} y la de sacar una carta de corazones es 1352\frac{13}{52}, pero hay un as entre las cartas de corazones, la probabilidad de sacar un as o una carta de corazones se calcula como:

P(AB)=P(A)+P(B)P(AB)=452+1352152=1652=413=0.3077P(A \cup B) = P(A) + P(B) - P(A \cap B) = \frac{4}{52} + \frac{13}{52} - \frac{1}{52} = \frac{16}{52} = \frac{4}{13} = 0.3077

Por lo tanto, la probabilidad de sacar un as o una carta de corazones es 0.30770.3077, es decir: del 30,77%.

Experimento Compuesto

Un experimento compuesto se refiere a un proceso que consiste en realizar varios experimentos aleatorios simples de manera secuencial, donde cada experimento tiene su propio espacio muestral y el espacio muestral total del experimento compuesto es el producto cartesiano de los espacios muestrales individuales.

  • Espacio muestral: en el contexto de experimentos compuestos, el espacio muestral está formado por todas las combinaciones posibles de los resultados de cada experimento simple. Por ejemplo, si lanzamos un dado dos veces, el espacio muestral incluiría todas las parejas posibles de números del 1 al 6 para cada lanzamiento.
  • Probabilidad: La probabilidad de un conjunto de sucesos en un experimento compuesto se calcula multiplicando las probabilidades de cada uno de los sucesos individuales, asumiendo que son independientes.

La fórmula general para dos sucesos AA y BB es:

P(AB)=P(A)×P(B)P(A \cap B) = P(A) \times P(B)

Y para tres sucesos independientes AA, BB, y CC sería:

P(ABC)=P(A)×P(B)×P(C)P(A \cap B \cap C) = P(A) \times P(B) \times P(C)

Por ejemplo, la probabilidad de obtener el mismo número en tres lanzamientos consecutivos de un dado sería el producto de la probabilidad de obtener ese número en cada lanzamiento individual. La probabilidad de obtener, por ejemplo, un 3 en cada lanzamiento es 16\frac{1}{6}. Por tanto, la probabilidad de obtener un 3 en tres lanzamientos sería:

P(3 en tres lanzamientos)=(16)×(16)×(16)=0.00463P(\text{3 en tres lanzamientos}) = \left(\frac{1}{6}\right) \times \left(\frac{1}{6}\right) \times \left(\frac{1}{6}\right) = 0.00463

Esto se traduce en una probabilidad de aproximadamente 0.46% de obtener un 3 en los tres lanzamientos.

Leyes de probabilidad

En función del tipo de variable, puedo usar distintos tipos de probabilidades. Recuerda que, en ambos casos, hablamos de variables aleatorias - de lo contrario no deberíamos utilizar probabilidad.

En variables discretas

Una variable aleatoria discreta toma valores específicos y contables. Las probabilidades asociadas con una variable aleatoria discreta pueden ser representadas de dos maneras:

  • Probabilidad puntual: es la probabilidad de que la variable aleatoria tome un valor específico xix_i. Se denota como f(xi)f(x_i) y se define como: f(xi)=P(X=xi)f(x_i) = P(X = x_i). Por ejemplo, la probabilidad de tirar exactamente 5 bolos 🎳 en una jugada de bolos.
  • Probabilidad acumulada: es la probabilidad de que la variable aleatoria tome un valor igual o menor que xix_i. Se denota como F(xi)F(x_i) y se define como: F(xi)=P(Xxi)F(x_i) = P(X \leq x_i). Por ejemplo, la probabilidad de tirar 5 bolos 🎳 o menos en una jugada de bolos.

En variables contínuas

Una variable aleatoria continua puede tomar cualquier valor numérico dentro de un intervalo o conjunto de intervalos. Por ejemplo, la probabilidad de obtener una puntuación específica en un examen o la probabilidad de que la puntuación sea igual o inferior a un valor dado.

Para calcular la probabilidad de que una variable continua tome un valor específico o un conjunto de valores, necesito utilizar funciones de densidad y distribución.

Para estandarizar y comparar resultados de diferentes variables aleatorias continuas, se utilizan Puntuaciones típicas (Z), que son los valores transformados en una distribución normal estándar.

Puntuación típica (Z)

Las puntuaciones típicas (Z), también conocidas como puntuaciones estándar o puntuaciones z, son esenciales en estadística para comparar puntuaciones o valores procedentes de diferentes escalas o distribuciones.

La puntuación Z transforma los datos a una distribución normal estándar, lo que facilita la comparación entre diferentes conjuntos de datos o diferentes variables dentro de un conjunto de datos.

Dicho de otra manera, las puntuaciones típicas (Z) permiten conocer cuantas desviaciones típicas se separa una puntuación de la media.

Fórmula de la puntuación Z

La puntuación Z se calcula con la siguiente fórmula:

Z=xixˉsZ = \frac{x_i - \bar{x}}{s}

O lo que es lo mismo, si hablamos de la población:

Z=xiμσZ = \frac{x_i - \mu}{\sigma}

donde:

  • xix_i es el valor del dato individual.
  • xˉ\bar{x} o μ\mu es la media de la distribución de datos.
  • ss o σ\sigma es la desviación estándar de la distribución de datos.

Una puntuación Z indica cuántas desviaciones estándar un elemento está por encima o por debajo de la media. Esto es particularmente útil porque:

  • Permite comparar valores de diferentes distribuciones.
  • Facilita la identificación de valores atípicos.
  • Convierte diferentes escalas a una escala común sin unidades, lo que facilita la interpretación de los datos.

Por ejemplo, si estamos comparando puntuaciones de exámenes de diferentes años o diferentes clases con diferentes niveles de dificultad, convertir las puntuaciones a puntuaciones Z nos permitirá entender mejor cómo se sitúa un estudiante en relación con el resto de su grupo o con diferentes grupos.

Pregunta

Cuando la media muestral es igual a la media poblacional, el valor z es igual a 0

Diferencia entre cuantiles y puntuaciones Z

Los cuantiles (como percentiles, deciles y cuartiles), dividen los datos en segmentos que representan la proporción de datos por debajo de un punto dado. Aunque son útiles para describir la distribución de los datos, tienen limitaciones:

  • Solo aprovechan la información ordinal.
  • No son muy sensibles a la forma exacta de la distribución de los datos.

La puntuación Z, por otro lado, transforma los datos a una escala estándar con una media de 0 y una desviación estándar de 1. Esto no solo permite comparar puntuaciones entre diferentes distribuciones, sino que también proporciona una medida de cuán inusual es una puntuación dentro de su propia distribución.

Esta estandarización es crucial cuando se realizan pruebas estadísticas o se trabaja en la inferencia estadística, ya que permite calcular la probabilidad de ocurrencia de eventos bajo el modelo de la distribución normal estándar.

Obtención de probabilidad a partir de puntuaciones Z

Una vez que tenemos la puntuación Z, puedo obtener la probabilidad correspondiente utilizando la tabla de distribución normal estándar, que nos proporciona las probabilidades acumuladas para diferentes valores de Z.

La probabilidad para una puntuación Z específica nos indica qué porcentaje de la distribución se encuentra por debajo (o por encima, si busco el complemento) de ese valor Z.

Por ejemplo, si obtenemos una puntuación ZZ de 1.961.96, podríamos utilizar la tabla de distribución normal estándar para encontrar que aproximadamente el 97.5% de los datos en una distribución normal estándar se encuentra por debajo de ese valor. Esto es útil en estadística inferencial, especialmente en la realización de pruebas de hipótesis y la creación de intervalos de confianza.

Tablas de distribución normal estándar

Esta tabla muestra solo algunos valores Z seleccionados y sus probabilidades acumuladas asociadas.

En realidad, una tabla de distribución normal estándar proporciona las probabilidades para una gama mucho más amplia de valores Z, normalmente en incrementos de 0.01, desde alrededor de Z = -3.49 hasta Z=3.49Z = 3.49.

Puntuación ZProbabilidad
0.000.5000
0.010.5040
......
1.000.8413
1.010.8438
1.020.8461
......
2.050.9798
2.330.9901
3.000.9987

Ejercicio práctico

Para comprender cómo la puntuación Z nos permite calcular la probabilidad de obtener ciertas puntuaciones dentro de una distribución normal, consideremos dos ejemplos con variables de altura y edad. Tenemos las medias y las desviaciones típicas de ambas distribuciones y quiero evaluar las puntuaciones de un individuo que mide 178 cm y tiene 29 años.

  1. Altura:

La media (µ) de la altura es de 170 cm y la desviación típica (s) es de 10 cm. Para un individuo que mide 178 cm, la puntuación Z se calcula de la siguiente manera:

Z=xixˉs=17817010=810=0.8Z = \frac{x_{i} - \bar{x}}{s} = \frac{178 - 170}{10} = \frac{8}{10} = 0.8

Esto significa que una altura de 178 cm está 0.8 desviaciones estándar por encima de la media.

  1. Edad:

La media de la edad es de 35 años y la desviación típica es de 5 años. Para un individuo de 29 años, la puntuación Z se calcula como:

Z=xixˉs=29355=65=1.2Z = \frac{x_{i} - \bar{x}}{s} = \frac{29 - 35}{5} = \frac{-6}{5} = -1.2

Una edad de 29 años está 1.2 desviaciones estándar por debajo de la media.

Con estas puntuaciones Z, puedo referirnos a la tabla de distribución normal estándar para determinar la probabilidad de obtener una medida igual o menor que estas puntuaciones. Por ejemplo, una puntuación Z de 0.8 corresponde aproximadamente al percentil 78.81, lo que significa que aproximadamente el 78.81% de la población mide 178 cm o menos. Del mismo modo, una puntuación Z de -1.2 corresponde al percentil 11.54, indicando que aproximadamente el 11.54% de la población tiene 29 años o menos.

Distribución normal (Nx̄;s)

Probablemente te hayas fijado que, al hablar de puntuaciones Z, digo cosas como Tabla de distribución normal estándar. La distribución normal es un concepto muy importante en estadística.

La relevancia de esta curva radica en el hecho de que muchas variables naturales y fenómenos de medición tienden a distribuirse de forma normal (aproximadamente), especialmente cuando el tamaño muestral es grande.

Una variable normal, o una variable con una distribución normal, también conocida como distribución gaussiana, es una distribución simétrica alrededor de la media.

Se expresa de la siguiente manera:

N(μ;σ)N(\mu; \sigma)

O lo que es lo mismo, si hablamos de la muestra:

N(xˉ;s)N(\bar{x}; s)

donde:

  • μ\mu o xˉ\bar{x} : La media poblacional, que indica el centro de la distribución. Es el valor promedio alrededor del cual se agrupan los valores de la variable aleatoria.
  • σ\sigma o ss: La desviación típica poblacional, que mide la dispersión o variabilidad de los datos alrededor de la media. Un σ\sigma más grande indica que los datos están más dispersos.

Por ejemplo, una variable podría ser N(2;5)N(2;5), que significa que tiene una distribución normal, que su media es 2 y que la desviación típica es 5.

En una curva normal, la media, la mediana y la moda coinciden, precisamente porque es perfectamente simétrica. Esto significa que la mayoría de los datos se acumulan alrededor de la media, y a medida que nos alejamos hacia cualquiera de los extremos; hacia las colas de la distribución, los datos se vuelven menos frecuentes.

Distribución normal unitaria

La distribución normal unitaria es un tipo de distribución normal en el que la media está en el valor 0 y la desviación típica es 1. Se expresa con N(0;1)N(0;1). Es una distribución muy útil.

Recuerda: desviación típica

Una desviación típica de 1 significa que el primer 34% de los datos está entre el valor 0 y 1.

Distribución normal y puntuación Z

Las puntuaciones Z convierten cualquier distribución normal a esta escala estándar, lo que permite calcular probabilidades independientemente de la media y la desviación estándar originales de la distribución.

Ejercicios

Los ejercicios pueden ser de los siguientes tipos:

En todos ellos, será necesaria la fórmula de la puntuación Z (Z=XμσZ = \frac{X - \mu}{\sigma}). También será necesario consultar la tabla de frecuencias para convertir el valor Z en la probabilidad (P), y viceversa.

Pero además, en los ejercicios de cálculo de probabilidad, es probable que necesites utilizar la expresión matemática de la relación entre sucesos.

A continuación, mostramos un ejercicio de cada tipo.

Probabilidad de puntuación X

Calcula la puntuación típica de una persona que ha sacado una puntuación directa de 1 en una variable que se distribuye normalmente con valores N(2;5)N(2;5). ¿Cómo de probable es obtener esa puntuación?

La puntuación directa obtenida es X=1X = 1, la media de la distribución es μ=2\mu = 2 y la desviación estándar es σ=5\sigma = 5. La puntuación Z se calcula usando la fórmula:

Z=XμσZ = \frac{X - \mu}{\sigma}

Sustituyendo los valores dados:

Z=125=15=0.2Z = \frac{1 - 2}{5} = \frac{-1}{5} = -0.2

El valor de 0.2-0.2 indica que la puntuación obtenida está a 0.2 desviaciones estándar por debajo de la media de la distribución normal.

Respecto a la probabilidad, se que una puntuación Z de 0 corresponde exactamente al 50% de la probabilidad. Un valor de Z ligeramente negativo como 0,2-0,2 estaría por debajo del 50%, pero no significativamente.

Para saber exactamente cómo de probable es la puntuación, tenemos que mirar las tablas de distribución normal estándar. Si miramos el valor -02 de puntuación Z, vemos que el valor de probabilidad acumulada es 0.4207

Puntuación ZProbabilidad acumulada
......
-0.20.4207 👈
......

Es decir, hay un 42.07% de probabilidad de obtener una puntuación de 1 o menos en una distribución normal con una media de 2 y una desviación estándar de 5.

Probabilidad de puntuación mayor que X

Calcula la probabilidad de obtener una puntuación directa mayor de 1,7 en una variable que se distribuye normalmente con valores N(2;5)N(2;5).

Para calcular la probabilidad de obtener una puntuación directa mayor de 1.71.7 en una distribución normal con media μ=2\mu = 2 y desviación estándar σ=5\sigma = 5, seguimos estos pasos:

Primero, calculo la puntuación Z de obtener el valor 1,7:

Z=Xμσ=1.725=0.06Z = \frac{X - \mu}{\sigma} = \frac{1.7 - 2}{5} = -0.06

Es decir, que la puntuación Z del valor 1,7 es 0.06-0.06.

Pero no quiero esa probabilidad, sino la probabilidad de que sea lo opuesto. Dado que quiero la probabilidad de obtener un valor mayor que 1.71.7.

Por eso, calculo el complemento de la probabilidad.

Recuerda: relación entre sucesos

La relación entre sucesos puede describirse de varias maneras, y una de ellas es la relación complementaria (Aˉ\bar{A}), cuando un suceso se realiza sólo si el otro no se ha verificado.

Es decir, que la suma de la probabilidad de ambos sucesos es 1, porque si no sucede uno, sucede el otro seguro. Por eso, la representación es:

P(Aˉ)=1P(A)P(\bar{A}) = 1 - P(A)

Ahora reemplazamos los valores:

PX>1.7=1PZ0.06P_{X > 1.7} = 1 - P_{Z \leq -0.06}

donde:

  • PX>1.7P_{X > 1.7} representa la probabilidad de que el valor sea mayor que 1,7. Esta es la incógnita que quiero despejar.
  • PZ0.06P_{Z \leq -0.06} representa la probabilidad de que la puntuación Z sea 0,06.

Antes de resolver esa ecuación, tenemos que buscar el valor 0.06-0.06 en la tabla de distribución normal, y vemos que para una puntuación Z de 0,06, la probabilidad acumulada es 0.4761.

Finalmente, resolvemos la ecuación:

PX>1.7=10.4761=0.5239P_{X > 1.7} = 1 - 0.4761 = 0.5239

Por lo tanto la probabilidad de que el valor sea mayor de 1,71,7 es del 52,39%.

Probabilidad de puntuación entre Xi y Xj

Calcula la probabilidad de obtener una puntuación directa entre 5,2 y 0 en una variable que se distribuye normalmente con valores N(2;5)N(2;5).

Primero, calculo las puntuaciones Z de obtener los valores 5,2 y 0. Es decir, tenemos que calculas ZiZ_i y ZjZ_j, utilizando la fórmula de la puntuación Z.

Z=XμσZ = \frac{X - \mu}{\sigma}

Por lo tanto, Zi=5.225=0.64Z_i = \frac{5.2 - 2}{5} = 0.64, mientras que Zj=025=0.4Z_j = \frac{0 - 2}{5} = -0.4

Después, busco en la tabla de distribución normal las probabilidades de ambos.

Zi=0.64    Pi=0.7389Z_i = 0.64 \implies P_i = 0.7389 Zj=0.4    Pj=0.3446Z_j = 0.4 \implies P_j = 0.3446

Sin embargo, no nos están pidiendo la probabilidad de esos valores, sino la probabilidad de una puntuación entre esos valores. Dicho de otra manera, nos están pidiendo la probabilidad de un intervalo. Para un intervalo dado (a,b)(a, b), la probabilidad de que la variable XX caiga dentro de este intervalo es la diferencia entre las probabilidades acumuladas en los puntos bb y aa:

P(a<X<b)=P(Xb)P(Xa)P(a < X < b) = P(X ≤ b) - P(X ≤ a)

En este caso:

P(0<X<5.2)=P(Z0.64)P(Z0.4)P(0 < X < 5.2) = P(Z \leq 0.64) - P(Z \leq -0.4)

Es decir:

P(0<X<5.2)=0.73890.3446=0.3943P(0 < X < 5.2) = 0.7389 - 0.3446 = 0.3943

Por lo tanto, la probabilidad de que una puntuación sea entre 5,2 y 0 es del 39,43%.

Puntuación X dada una probabilidad

calcular el valor de una puntuación directa que tiene asociada una probabilidad menor de 0.95 en una distribución normal con valores N(2;5)N(2;5)

Para calcular el valor de la puntuación directa asociada con una probabilidad acumulada menor de 0.950.95 en una distribución normal N(2;5)N(2; 5), primero tenemos que encontrar la puntuación Z en la tabla de distribuciones.

P=0.95    Z=1.64P = 0.95 \implies Z = 1.64

Como vemos en la tabla, el valor de Z0.95Z_{0.95} es de 1.641.64.

Después, utilizo la fórmula de la puntuación Z:

Z=XμσZ = \frac{X - \mu}{\sigma}

En este caso, conocemos los siguientes valores:

1,64=X251,64 = \frac{X - 2}{5}

Finalmente, despejamos la incógnita:

X=1.645+2=10.2X = 1.64 \cdot 5 + 2 = 10.2

Por lo tanto, el valor de la puntuación directa que tiene asociada una probabilidad acumulada menor de 0.950.95 es 10.210.2.