Saltar al contenido principal

Variabilidad

Índices que reflejan la variabilidad

La variabilidad en los datos se mide con los Índices de dispersión, como la Varianza, la Desviación típica, o el Coeficiente de Variación de Pearson. Hay Otros índices descriptivos como la Amplitud que también reflejan la dispersión de los datos.

Enunciado

Hemos realizado un experimento de atención en el que se ha medido el tiempo de reacción (TR) en segundos y el número de aciertos de los participantes.

Los resultados para 6 participantes son los siguientes:

ParticipanteTiempo de reacción (TRi{TR}_i)Aciertos (AiA_i)
135
213
324
436
552
622
  1. ¿Podríamos afirmar que el TR presenta más variabilidad que los Aciertos?
  2. ¿Qué variable posee mayor amplitud?

Tenemos más datos, de otro estudio.

  1. Data la siguiente variable Xi:0,3,1,a,2X_i: 0, 3, 1, a, 2, si la varianza vale 20 y el coeficiente de variación centrado en la media vale 100, ¿cuánto valdría el valor a de la variable XX?

  2. Dada la siguiente variable Wi:0,4,2,4,2,5,2,1,3,1,3,3W_i: 0, 4, 2, 4, 2, 5, 2, 1, 3, 1, 3, 3 , calcular los valores de amplitud y el coeficiente de variación.

Desarrollo

1. ¿Podríamos afirmar que el TR presenta más variabilidad que los Aciertos?

Lo que está preguntando es cuánto es la varianza. La varianza es la medida estadística de dispersión que refleja la variabilidad de la distribución. Es el grado en el que los datos se distancian de la media, también llamado concentración.

La fórmula de la varianza (s2s^2 o σ2\sigma^2) es:

s2=(xixˉ)2n1s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}

Como puedo ver, para aplicar la fórmula necesito la media (xˉ\bar{x}) de cada uno. La calculo:

xˉTR=3+1+2+3+5+26=2.66{\bar{x}}_{TR} = \frac{3+1+2+3+5+2}{6} = 2.66 xˉA=5+3+4+6+2+26=3.66{\bar{x}}_{A} = \frac{5+3+4+6+2+2}{6} = 3.66

Ahora puedo calcular la varianza de ambas, utilizando la fórmula que hemos visto al principio:

Varianza del Tiempo de reacción (TRi{TR}_i)

Primero aplicamos la fórmula:

s2TR=(32.66)2+(12.66)2+(22.66)2+(32.66)2+(52.66)2+(22.66)261=1.8667{s^2}_{TR} = \frac{(3 - 2.66)^2+(1 - 2.66)^2+(2 - 2.66)^2+(3 - 2.66)^2+(5 - 2.66)^2+(2 - 2.66)^2}{6 -1} = 1.8667

Como está al cuadrado (s2s^2), aplicamos la raíz cuadrada

sTR=1.8667=1,3662s_{TR} = \sqrt{1.8667} = 1,3662

Varianza de Aciertos (AiA_i)

Primero aplicamos la fórmula:

s2A=(53.66)2+(33.66)2+(43.66)2+(63.66)2+(23.66)2+(23.66)261=2.6667{s^2}_{A} = \frac{(5 - 3.66)^2+(3 - 3.66)^2+(4 - 3.66)^2+(6 - 3.66)^2+(2 - 3.66)^2+(2 - 3.66)^2}{6 -1} = 2.6667

Como está al cuadrado (s2s^2), aplicamos la raíz cuadrada

sA=1.8667=1.633s_{A} = \sqrt{1.8667} = 1.633

Es decir, la varianza del tiempo de reacción s2TR{s^2}_{TR} es 1,3662, mientras que la varianza de los aciertos s2A{s^2}_{A} es 1,633. Por lo tanto, no: la varianza de los aciertos s2A{s^2}_{A} es mayor que la varianza del tiempo de reacción s2TR{s^2}_{TR}.

Es decir: s2A=1,633>s2TR=1,3662{s^2}_{A} = 1,633 > {s^2}_{TR} = 1,3662

2. ¿Qué variable posee mayor amplitud?

La amplitud (AiA_i) es la forma más simple de conocer la dispersión de los datos. En esencia, muestra cuántos posibles valores hay. Es la medida de dispersión que se define por la diferencia entre el valor máximo y el valor mínimo de la distribución de valores ordenados.

Es decir: Ai=Valor maxiValor miniA_i = {Valor\ \max}_i - {Valor\ \min}_i

Primero, veamos los datos de cada variable, ordenados de mayor a menor:

Amplitud del Tiempo de reacción (TRi{TR}_i)
122335
ATR=62=4{A}_{TR} = 6 - 2 = 4
Amplitud de Aciertos (AiA_i)
223456
AA=51=4{A}_{A} = 5 - 1 = 4

Por lo tanto, ambas variables tienen la misma amplitud de 4.

3. ¿Cuánto vale el valor a de la variable Xi?

Tenemos una serie de números que representan una variable Xi:0,3,1,a,2X_i: 0, 3, 1, a, 2. El ejercicio nos pide determinar el valor desconocido aa en la serie numérica, sabiendo que la varianza es 20 y que el coeficiente de variación es del 100.

Lo que se es:

  • La varianza (s2s^2 o σ2\sigma^2) es 20. Es decir, que la dispersión de estos números respecto a su media es considerable.
  • El coeficiente de variación (CVCV) es del 100.

Con esa información, se cuál es la desviación típica.

s=s2s = \sqrt{s^2}

Puesto que s2=20s^2 = 20, la desviación típica es:

s=20=4,4721 s = \sqrt{20} = 4,4721

Con esa información, se cuál es la media.

CV=sxxˉ×100CV = \frac{s_x}{\bar{x}} \times 100

Puesto que CV=100CV = 100 y s=4,4721 s = 4,4721, puedo deducir la media:

100=4,4721xˉ×100    100/100×xˉ=4,4721    xˉ=4,4721100 = \frac{4,4721}{\bar{x}} \times 100 \implies 100 / 100 \times \bar{x} = 4,4721 \implies \bar{x} = 4,4721

Esto no debería ser sorprendente, porque un CV del 100% significa que la desviación estándar es igual a la media. Recuerda que el CV genera un valor que indica, precisamente, cuánto mayor o menor a la media es la desviación estándar. Si fuera menor que 100%, significa que la desviación estándar es menor que la media. Si fuera mayor al 100%, significa que la desviación estándar es mayor que la media. Siendo 100% significa que es exactamente igual que la media.

Ahora puedo aplicar la fórmula de la media para (xˉ\bar{x}) para extraer la incógnita:

xˉ=i=1nxin\bar{x} = \frac{\sum_{i=1}^n x_i}{n}

En este caso:

4,4721=0+3+1+a+25    4,4721×5=6+a    a=16,36054,4721 = \frac{0 + 3 + 1 + a + 2}{5} \implies 4,4721 \times 5 = 6 + a \implies a = 16,3605

Es decir, que el valor de a es 16,3605, y la serie completa es Xi:0,3,1,16,2X_i: 0, 3, 1, 16, 2

4. Amplitud y variación de la variable Wi

Teniendo la variable Wi:0,4,2,4,2,5,2,1,3,1,3,3W_i: 0, 4, 2, 4, 2, 5, 2, 1, 3, 1, 3, 3 , calcular el valor de amplitud es sencillo. Basta con encontrar la diferencia entre el valor más alto y el más bajo.

Aw=50    Aw=5A_w = 5 - 0 \implies A_w = 5

Es decir, que la amplitud es 5.

El coeficiente de variación (CVCV) es ligeramente más complicado. La fórmula es:

CV=sxxˉ×100CV = \frac{s_x}{\bar{x}} \times 100

Es decir, que necesito averiguar la media (xˉ\bar{x}) y la desviación típica (sxs_x). Empezamos calculando la media:

xˉ=i=1nxin=0+4+2+4+2+5+2+1+3+1+3+312=2.5\bar{x} = \frac{\sum_{i=1}^n x_i}{n} = \frac{0 + 4 + 2 + 4 + 2 + 5 + 2 + 1 + 3 + 1 + 3 + 3}{12} = 2.5

Ahora que se que la media (xˉ\bar{x}) es 2.5, puedo ir a por la desviación típica (ss).

s=1n1i=1n(xixˉ)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2}

s=(02.5)2+(42.5)2+(22.5)2+(42.5)2+(22.5)2+(52.5)2+(22.5)2+(12.5)2+(32.5)2+(12.5)2+(32.5)2+(32.5)2121s = \sqrt{\frac{(0-2.5)^2+(4-2.5)^2+(2-2.5)^2+(4-2.5)^2+(2-2.5)^2+(5-2.5)^2+(2-2.5)^2+(1-2.5)^2+(3-2.5)^2+(1-2.5)^2+(3-2.5)^2+(3-2.5)^2}{12-1}}

s=2311=2.09=1.4457s = \sqrt{\frac{23}{11}} = \sqrt{2.09} = 1.4457

Es decir, que la desviación típica (ss) es 1.4457.

Sólo nos queda el coeficiente de variación:

sxxˉ×100    1.44572.5×100=57.828\frac{s_x}{\bar{x}}\times100 \implies \frac{1.4457}{2.5}\times100 = 57.828

Es decir, que el coeficiente de variación (CVCV) es 57.828.