Crea una tabla de frecuencias
Enunciado
Preguntamos a una muestra representativa de 40 personas que indique el número de libros que ha leído en los últimos meses. A continuación se ofrecen las respuestas de estas personas:
4 | 1 | 3 | 1 | 0 | 2 | 1 | 2 | 1 | 1 |
1 | 1 | 4 | 0 | 1 | 3 | 2 | 1 | 4 | 0 |
2 | 3 | 1 | 0 | 5 | 3 | 3 | 4 | 2 | 1 |
1 | 2 | 0 | 1 | 3 | 1 | 1 | 0 | 3 | 0 |
Con estos datos, debes:
- Construir la distribución de frecuencias: absolutas, acumuladas, relativas y relativas acumuladas.
- Hacer la representación gráfica de barras de las frecuencias absolutas.
- ¿Cuál es la cantidad de libros más frecuentes que leen los encuestados?
- ¿Qué porcentaje de personas dicen haber leído 2 libros?
- ¿Cuántos libros dicen haber leído el 70% de los que menos han leído?
- ¿Cuántas personas han leído menos de 5 libros?
Desarrollo
Los datos mostrados arriba sería más sensato verlos asignando un ID a cada participante, y su respuesta:
ID del participante | Respuesta |
---|---|
1 | 4 |
2 | 1 |
3 | 3 |
[...] | [...] |
38 | 0 |
39 | 3 |
40 | 0 |
Sin embargo, no quiero ordenar los datos en función de los participantes, sino en función de los valores. Viendo la tabla, vemos que los valores van del 0 al 5. Por eso, vamos a crear una tabla donde las filas son los 5 valores, y vamos también a contar las veces que aparece cada valor - es decir: la frecuencia absoluta ().
Valor () | Frecuencia absoluta () |
---|---|
0 | 7 |
1 | 15 |
2 | 6 |
3 | 7 |
4 | 4 |
5 | 1 |
Con esta información, también puedo facilmente crear un gráfico de barras:
3. ¿Cuál es la cantidad de libros más frecuentes que leen los encuestados?
Sólo con disponer los datos de esta manera, ya vemos que la respuesta más habitual es que los participantes hayan leído sólo un libro. Es decir, el valor más frecuente es 1
, con 15 instancias.
Ahora, añadamos la frecuencia acumulada (), la frecuencia relativa () y la frecuencia relativa acumulada ().
Frecuencia acumulada () | Frecuencia relativa () | Frecuencia relativa acumulada () | ||
---|---|---|---|---|
0 | 7 | 7 | 0.1750 | 0.1750 |
1 | 15 | 22 | 0.3750 | 0.5500 |
2 | 6 | 28 | 0.1500 | 0.7000 |
3 | 7 | 35 | 0.1750 | 0.8750 |
4 | 4 | 39 | 0.1000 | 0.9750 |
5 | 1 | 40 | 0.0250 | 1.0000 |
Ahora se responder, de forma sencilla, a las demás preguntas planteadas al principio:
4. ¿Qué porcentaje de personas dicen haber leído 2 libros?
Lo que está preguntando es el porcentaje relativo del valor 2. Es decir, el .
La frecuencia relativa () del valor 2
es . Es decir: .
La fórmula para calcular el porcentaje relativo (%i) a partir de la frecuencia relativa es bastante sencilla; sólo hay que multiplicar por 100.
Por lo tanto:
5. ¿Cuántos libros dicen haber leído el 70% de los que menos han leído?
Lo que está preguntando es el valor del percentil 70%. Es decir, el .
Donde:
- es la cantidad total de la muestra
- es el percentil en cuestión
Si quiero calcular el percentil 70 (), la fórmula sería:
El resultado es 28,7
. Es decir, el percentil 70% se compone de las primeras 28,7 que menos libros ha leído. Y si recordamos los valores, vemos que las primeras 28 personas que menos han leído, han leído 2 libros. Sin embargo, 28,7 es más de 28, lo que nos llevaría al rango de 3 libros:
Frecuencia acumulada () | ||
---|---|---|
2 | 6 | 28 |
3 | 7 | 35 |
Es decir, que el percentil 70% habrá leído un número con decimales.
Donde:
- El símbolo representa el decimal del percentil
- es el valor menor del intervalo entre el que se encuentra
- es el valor mayor del intervalor, que es , sumado un número ().
Es decir,
Y por fin puedo responder que, el 70% de los que menos libros han leído, han leído 2,7 libros o menos.
6. ¿Cuántas personas han leído menos de 5 libros?
El valor por debajo de 5
es 4
.
La frecuencia relativa acumulada () del valor 4
es .
La frecuencia absoluta acumulada () del valor 4
es .
Es decir, 39 personas, el 97,5% del total, han leído menos de 5 libros.