Saltar al contenido principal

Cuantiles

Enunciado

Dada la siguiente variable:

Xi:1,4,2,3,2,5,2,100X_i: 1,4,2,3,2,5,2,100
  1. Calcula los tres cuartiles.
  2. Calcula la desviación cuartil de X.
  3. Indica cuál es la moda de X.
  4. Calcula la varianza de la variable X.

Desarrollo

1. Calcula los tres cuartiles

El primer paso, casi siempre, consiste en ordenar los datos:

Xi:1,4,2,3,2,5,2,100original1,2,2,2,3,4,5,100ordenadoX_i: \overbrace{1,4,2,3,2,5,2,100}^{\text{original}} \mapsto \overbrace{1,2,2,2,3,4,5,100}^{\text{ordenado}}

También suele ser útil asignar posiciones, para ver claramente cuántos valores hay y cuál está en el medio.

1.º2.º3.º4.º5.º6.º7.º8.º
1222345100

Segundo cuartil

Sé que el segundo cuartil (Q2Q_2) es lo mismo que el percentil 50 (P50P_{50}).

También sé que es lo mismo que la mediana (MdnMdn). Por definición, el segundo cuartil divide un conjunto de datos en dos mitades iguales y se encuentra en la posición que asegura que el 50 % de los datos sea menor o igual a él y el 50 % sea mayor o igual a él. Esta es precisamente la definición de mediana.

Por lo tanto, puedo utilizar la fórmula de la mediana.

Puesto que hay 8 posiciones, no hay posición del medio. Por lo tanto, hago la media con la posición 4.ª y 5.ª, cuyos valores son 2 y 3. La mediana, por tanto, sería Mdn=xˉ=2+32=2,5Mdn = \bar{x} = \frac{2 + 3}{2} = 2,5.

Es decir, la mediana es 2,5 (y el P50P_{50}, y el Q2Q_2).

Solución alternativa

Esto se podría haber hecho también aplicando la fórmula del percentil:

Pk=k(n+1)100P_k = \frac{k \cdot {(n + 1)}}{100}

Sin embargo, me encuentro con el problema de que el resultado tiene decimales:

P50=50(8+1)100=4,5P_{50} = \frac{50 \cdot {(8 + 1)}}{100} = 4,5

Después aplico la fórmula para los cuantiles con decimales:

Pk=(1d)xi+dxi+1P_k = (1- {d} ) \cdot {x_i} + {d} \cdot {x_{i+1}}

Que en este caso es:

P50=(10,5)2+0,53=2,5{P}_{50} = (1-0,5) \cdot 2 + 0,5 \cdot 3 = 2,5

Es decir, el P50P_{50} es 2,5 (y la mediana, y el Q2Q_2), como ya sabía.

Utiliza el valor en la posición

La fórmula del percentil con decimal (Pk=(1d)xi+dxi+1P_k = (1- {d} ) \cdot {x_i} + {d} \cdot {x_{i+1}}) requiere que introduzca valores del conjunto de datos, concretamente: dd, xix_i y xi+1x_{i+1}.

En los valores xix_i y xi+1x_{i+1} hay que poner el valor en la posición, no la posición. Es decir, xi=4x_i = 4, y el valor en la posición 4.ª es 22, por eso pongo 2. Igualmente, xi+1=5x_{i+1} = 5, y el valor en la posición 5.ª es 33, por eso pongo 3.

Primer cuartil

Aquí también tengo dos posibles soluciones:

  1. Calcular la mediana de la primera mitad de los datos.
  2. Aplicar la fórmula del percentil 25 (P25P_{25}).

Si utilizo el primer método, es así de fácil: 2+22=2\frac{2+2}{2}=2. Es decir, el Q1Q_1 es 2.

El primer método no siempre funciona

Aunque calcular Q1Q_1 como la mediana de la primera mitad de los datos ordenados puede ser una aproximación razonable, no siempre coincide exactamente con el valor de Q1Q_1 según diferentes métodos estadísticos.

Si utilizo el segundo método: P25=25(8+1)100=2,25P_{25} = \frac{25 \cdot {(8 + 1)}}{100} = 2,25. Una vez más, como el resultado tiene decimal, tengo que usar la otra fórmula: P25=(10,25)2+0,252=2P_{25} = (1- {0,25} ) \cdot {2} + {0,25} \cdot {2} = 2. Es decir, que el primer cuartil (Q1Q_1) es 2.

Usa el valor en la posición

En los valores xix_i y xi+1x_{i+1} hay que poner el valor en la posición, no la posición. Es decir, xi=2x_i = 2, y el valor en la posición 2.ª es 22, por eso pongo 2. Igualmente, xi+1=3x_{i+1} = 3, y el valor en la posición 3.ª es 22, por eso pongo 2.

Tercer cuartil

Primero, pruebo con la fórmula del percentil: P75=75(8+1)100=6,75P_{75} = \frac{75 \cdot {(8 + 1)}}{100} = 6,75. Una vez más, como el resultado tiene decimal, tengo que usar la otra fórmula: P75=(10,75)4+0,755=4,75P_{75} = (1- {0,75} ) \cdot {4} + {0,75} \cdot {5} = 4,75. Es decir, que el tercer cuartil (Q3Q_3) es 4,75.

En este caso, si pruebo el otro método, veo que el resultado es algo distinto: 4+52=4,5\frac{4+5}{2}=4,5. Es decir, que la mediana (MdnMdn) de la segunda mitad de los datos es 4,5, mientras que el Q3Q_3 es 4,75.

2. Calcula la desviación cuartil

DC=4,7522=1,375DC = \frac{{4,75} - {2}}{2} = 1,375