Saltar al contenido principal

Crea una tabla de frecuencias

Enunciado

Preguntamos a una muestra representativa de 40 personas que indique el número de libros que ha leído en los últimos meses. A continuación se ofrecen las respuestas de estas personas:

4131021211
1140132140
2310533421
1201311030

Con estos datos, debes:

  1. Construir la distribución de frecuencias: absolutas, acumuladas, relativas y relativas acumuladas.
  2. Hacer la representación gráfica de barras de las frecuencias absolutas.
  3. ¿Cuál es la cantidad de libros más frecuentes que leen los encuestados?
  4. ¿Qué porcentaje de personas dicen haber leído 2 libros?
  5. ¿Cuántos libros dicen haber leído el 70% de los que menos han leído?
  6. ¿Cuántas personas han leído menos de 5 libros?

Desarrollo

Los datos mostrados arriba sería más sensato verlos asignando un ID a cada participante, y su respuesta:

ID del participanteRespuesta
14
21
33
[...][...]
380
393
400

Sin embargo, no quiero ordenar los datos en función de los participantes, sino en función de los valores. Viendo la tabla, vemos que los valores van del 0 al 5. Por eso, vamos a crear una tabla donde las filas son los 5 valores, y vamos también a contar las veces que aparece cada valor - es decir: la frecuencia absoluta (nin_i).

Valor (xix_i)Frecuencia absoluta (nin_i)
07
115
26
37
44
51

Con esta información, también puedo facilmente crear un gráfico de barras:

3. ¿Cuál es la cantidad de libros más frecuentes que leen los encuestados?

Sólo con disponer los datos de esta manera, ya vemos que la respuesta más habitual es que los participantes hayan leído sólo un libro. Es decir, el valor más frecuente es 1, con 15 instancias.

Ahora, añadamos la frecuencia acumulada (nan_a), la frecuencia relativa (pip_i) y la frecuencia relativa acumulada (pap_a).

xix_inin_iFrecuencia acumulada (nan_a)Frecuencia relativa (pip_i)Frecuencia relativa acumulada (pap_a)
0770.17500.1750
115220.37500.5500
26280.15000.7000
37350.17500.8750
44390.10000.9750
51400.02501.0000

Ahora se responder, de forma sencilla, a las demás preguntas planteadas al principio:

4. ¿Qué porcentaje de personas dicen haber leído 2 libros?

Lo que está preguntando es el porcentaje relativo del valor 2. Es decir, el %2\%_2.

La frecuencia relativa (pip_i) del valor 2 es 0.15000.1500. Es decir: p2=0.1500p_2 = 0.1500.

La fórmula para calcular el porcentaje relativo (%i) a partir de la frecuencia relativa es bastante sencilla; sólo hay que multiplicar por 100.

Fórmula para el cálculo de porcentaje relativo
%i=pi×100\%_i = p_i \times 100

Por lo tanto:

%2=0.1500×100=15\%_2 = 0.1500 \times 100 = 15%

5. ¿Cuántos libros dicen haber leído el 70% de los que menos han leído?

Lo que está preguntando es el valor del percentil 70%. Es decir, el P70P_{70}.

Fórmula para el cálculo de percentil
Pk=k(n+1)100P_{k} = \frac{k \cdot {(n + 1)}}{100}

Donde:

  • nn es la cantidad total de la muestra
  • kk es el percentil en cuestión

Si quiero calcular el percentil 70 (P70P_{70}), la fórmula sería:

P70=70(40+1)100=28,7P_{70} = \frac{70 \cdot {(40 + 1)}}{100} = 28,7

El resultado es 28,7. Es decir, el percentil 70% se compone de las primeras 28,7 que menos libros ha leído. Y si recordamos los valores, vemos que las primeras 28 personas que menos han leído, han leído 2 libros. Sin embargo, 28,7 es más de 28, lo que nos llevaría al rango de 3 libros:

xix_inin_iFrecuencia acumulada (nan_a)
2628
3735

Es decir, que el percentil 70% habrá leído un número con decimales.

Fórmula de percentil con decimales
Pk=(1d)×Xi+(d)×xi+1P_k = (1-d) \times X_i + (d) \times x_{i+1}

Donde:

  • El símbolo dd representa el decimal del percentil
  • XiX_i es el valor menor del intervalo entre el que se encuentra ii
  • Xi+1X_{i+1} es el valor mayor del intervalor, que es ii, sumado un número (i+1i+1).

Es decir, P70=(10.7)×2+(0.7)×3=2.7P_{70} = (1-0.7) \times 2 + (0.7) \times 3 = 2.7

Y por fin puedo responder que, el 70% de los que menos libros han leído, han leído 2,7 libros o menos.

6. ¿Cuántas personas han leído menos de 5 libros?

El valor por debajo de 5 es 4.

La frecuencia relativa acumulada (pap_a) del valor 4 es 0.97500.9750.

La frecuencia absoluta acumulada (pap_a) del valor 4 es 3939.

Es decir, 39 personas, el 97,5% del total, han leído menos de 5 libros.