Saltar al contenido principal

Cuantiles

Enunciado

Dada la siguiente variable

Xi:1,4,2,3,2,5,2,100X_i: 1,4,2,3,2,5,2,100
  1. Calcula los tres cuartiles.
  2. Calcula la desviación cuartil de X.
  3. Indicad cuál es la moda de X.
  4. Calcular la varianza de la variable X

Desarrollo

1. Calcula los tres cuartiles

El primer paso, casi siempre, consiste en ordenar los datos:

Xi:1,4,2,3,2,5,2,100original1,2,2,2,3,4,5,100ordenado X_i: \overbrace{1,4,2,3,2,5,2,100}^{\text{original}} \mapsto \overbrace{1,2,2,2,3,4,5,100}^{\text{ordenado}}

También suele ser útil asignar posiciones, para ver claramente cuántos valores hay y cuál está en el medio.

1222345100

Segundo cuartil

El segundo cuartil (Q2Q_2) se que es lo mismo que el percentil 50 (P50P_{50}).

También se que es lo mismo que la mediana (MdnMdn). Por definición, el segundo cuartil divide un conjunto de datos en dos mitades iguales y se encuentra en la posición que asegura que el 50% de los datos sea menor o igual a él y el 50% sea mayor o igual a él. Esta es precisamente la definición de mediana.

Por lo tanto, puedo utilizar la fórmula de la mediana.

Puesto que hay 8 posiciones, no hay posición del medio. Por lo tanto, hacemos la media con la posición 4º y 5º, cuyos valores son 2 y 3. La mediana, por tanto, sería Mdn=xˉ=2+32=2.5Mdn = \bar{x} = \frac{2 + 3}{2} = 2.5.

Es decir, la mediana es 2,5 (y el P50P_{50}, y el Q2Q_2).

Solución alternativa

Esto se podría haber hecho también aplicando la fórmula del percentil:

Pk=k(n+1)100P_k = \frac{k \cdot {(n + 1)}}{100}

Sin embargo, me encuentro con el problema de que el resultado tiene decimales:

P50=50(8+1)100=4.5P_{50} = \frac{50 \cdot {(8 + 1)}}{100} = 4.5

Después aplicamos la fórmula para los cuantiles con decimales:

Pk=(1d)xi+dxi+1P_k = (1- {d} ) \cdot {x_i} + {d} \cdot {x_{i+1}}

Que en este caso, es

P50=(10.5)2+0.53=2.5{P}_{50} = (1-0.5) \cdot 2 + 0.5 \cdot 3 = 2.5

Es decir, el P50P_{50} es 2,5 (y la mediana, y el Q2Q_2), como ya sabíamos.

Utiliza el valor en la posición

La fórmula del percentil con decimal (Pk=(1d)xi+dxi+1P_k = (1- {d} ) \cdot {x_i} + {d} \cdot {x_{i+1}}) requiere que metamos valores del conjunto de datos, concretamente: dd, xix_i y xi+1x_{i+1}.

En los valores xix_i y xi+1x_{i+1} hay que poner el valor en la posición, no la posición. Es decir, xi=4x_i = 4, y el valor en la posición 4ª es 22, por eso ponemos 2. Igualmente, xi+1=5x_{i+1} = 5, y el valor en la posición 5ª es 33, por eso ponemos 3.

Primer cuartil

Aquí también tenemos dos posibles soluciones:

  1. Calcular la mediana de la primera mitad de los datos
  2. Aplicar la fórmula del percentil 25 (P25P_{25})

Si utilizas el primer método, es así de facil: 2+22=2\frac{2+2}{2}=2. Es decir, el Q1Q_1 es 2.

El primer método no siempre funciona

Aunque calcular Q1 como la mediana de la primera mitad de los datos ordenados puede ser una aproximación razonable, no siempre coincide exactamente con el valor de Q1 según diferentes métodos estadísticos.

Si utilizas el segundo método: P25=25(8+1)100=2.25P_{25} = \frac{25 \cdot {(8 + 1)}}{100} = 2.25. Una vez más, cómo el resultado tiene decimal, tenemos que usar la otra fórmula: P25=(10.25)2+0.252=2P_{25} = (1- {0.25} ) \cdot {2} + {0.25} \cdot {2} = 2. Es decir, que el primer cuartil (Q1Q_1) es 2.

Usa el valor en la posición

En los valores xix_i y xi+1x_{i+1} hay que poner el valor en la posición, no la posición. Es decir, xi=2x_i = 2, y el valor en la posición 2ª es 22, por eso ponemos 2. Igualmente, xi+1=3x_{i+1} = 3, y el valor en la posición 3ª es 22, por eso ponemos 2.

Tercer cuartil

Primero, probamos con la fórmula del percentil: P75=75(8+1)100=6.75P_{75} = \frac{75 \cdot {(8 + 1)}}{100} = 6.75. Una vez más, cómo el resultado tiene decimal, tenemos que usar la otra fórmula: P75=(10.75)4+0.755=4.75P_{75} = (1- {0.75} ) \cdot {4} + {0.75} \cdot {5} = 4.75. Es decir, que el tercer cuartil (Q3Q_3) es 4,75.

En este caso, si probamos el otro método, vemos que el resultado es algo distinto: 4+52=4.5\frac{4+5}{2}=4.5. Es decir, que la mediana (MdnMdn) de la segunda mitad de los datos es 4.5, mientras que el Q3Q_3 es 4,75.

2. Calcula la desviación cuartil.

DC=4.7522=1.375DC = \frac{{4.75} - {2}}{2} = 1.375