Ejercicios
Parte 1: Comparación de dos grupos dependientes
1.1. Estudio sobre CI
Premisa
Una investigadora quiere conocer si la inteligencia (cociente intelectual; CI) de los alumnos de una clase de primaria aumenta tras aplicar en el aula un entrenamiento en razonamiento abstracto y matemático. Para ello, evalúa la inteligencia de toda su clase con un cuestionario de CI al inicio del curso y al final de éste.
Datos
Haz click para ver toda la base de datos
Alumno CI_Inicio_Curso CI_Fin_Curso 1 90,00 97,00 ... ... ...
Base de datos completa:
Alumno | CI_Inicio_Curso | CI_Fin_Curso |
---|---|---|
1 | 90,00 | 97,00 |
2 | 90,00 | 97,00 |
3 | 112,50 | 113,00 |
4 | 75,00 | 82,00 |
5 | 97,50 | 104,50 |
6 | 97,50 | 104,50 |
7 | 105,00 | 112,00 |
8 | 67,50 | 74,50 |
9 | 75,00 | 82,00 |
10 | 82,50 | 89,50 |
11 | 82,50 | 89,50 |
12 | 82,50 | 89,50 |
13 | 90,00 | 97,00 |
14 | 97,50 | 97,50 |
15 | 105,00 | 112,00 |
16 | 105,00 | 112,00 |
17 | 127,50 | 134,50 |
18 | 120,00 | 127,00 |
19 | 112,50 | 119,50 |
20 | 120,00 | 127,00 |
21 | 112,50 | 119,50 |
22 | 67,50 | 74,50 |
23 | 75,00 | 75,00 |
24 | 82,50 | 89,50 |
25 | 90,00 | 97,00 |
26 | 97,50 | 104,50 |
27 | 105,00 | 112,00 |
28 | 112,50 | 82,50 |
29 | 120,00 | 127,00 |
30 | 67,50 | 74,50 |
31 | 75,00 | 82,00 |
32 | 82,50 | 89,50 |
33 | 90,00 | 97,00 |
34 | 97,50 | 104,50 |
35 | 105,00 | 112,00 |
36 | 112,50 | 119,50 |
37 | 120,00 | 127,00 |
38 | 127,50 | 134,50 |
39 | 135,00 | 142,00 |
40 | 60,00 | 60,00 |
41 | 112,50 | 119,50 |
42 | 105,00 | 112,00 |
43 | 120,00 | 127,00 |
44 | 135,00 | 142,00 |
45 | 112,50 | 119,50 |
46 | 127,50 | 134,50 |
47 | 105,00 | 112,00 |
48 | 112,50 | 119,50 |
49 | 97,50 | 104,50 |
50 | 112,50 | 119,50 |
51 | 97,50 | 104,50 |
52 | 127,50 | 134,50 |
53 | 105,00 | 112,00 |
54 | 112,50 | 119,50 |
55 | 97,50 | 104,50 |
56 | 127,50 | 134,50 |
57 | 120,00 | 127,00 |
58 | 120,00 | 127,00 |
59 | 120,00 | 127,00 |
60 | 120,00 | 127,00 |
61 | 120,00 | 127,00 |
62 | 120,00 | 127,00 |
63 | 127,50 | 134,50 |
64 | 127,50 | 134,50 |
65 | 127,50 | 134,50 |
66 | 127,50 | 134,50 |
67 | 127,50 | 134,50 |
68 | 127,50 | 134,50 |
69 | 135,00 | 142,00 |
70 | 135,00 | 142,00 |
71 | 135,00 | 142,00 |
72 | 135,00 | 142,00 |
73 | 135,00 | 142,00 |
74 | 135,00 | 142,00 |
75 | 135,00 | 142,00 |
76 | 135,00 | 142,00 |
77 | 135,00 | 142,00 |
78 | 135,00 | 142,00 |
79 | 135,00 | 142,00 |
80 | 135,00 | 142,00 |
El programa SPSS genera también una pestaña llamada Variable view
que muestra un resumen de las variables.
Name | Type | Width | Decimals | Label | Values | Columns | Measure |
---|---|---|---|---|---|---|---|
Alumno | Numeric | 8 | 0 | Alumno | None | 13 | Nominal |
CI_Inicio_Curso | Numeric | 8 | 2 | CI al inicio del curso | None | 16 | Scale |
CI_Fin_Curso | Numeric | 8 | 2 | CI al final del curso | None | 14 | Scale |
Son tres variables:
Alumno
CI_Inicio_Curso
: coeficiente intelectual al inicio del cursoCI_Fin_Curso
: coeficiente intelectual al final del curso
Fundamentos del estudio
¿Cuál es la hipótesis nula y la alternativa?
- Hipótesis nula (): No hay diferencia en las medias de CI antes y después del curso; es decir:
- Hipótesis alternativa (): Hay una diferencia en las medias de CI antes y después del curso; es decir:
¿Cuántas veces se mide la variable dependiente en este estudio?
- Variable independiente: El entrenamiento en razonamiento abstracto y matemático.
- Variable dependiente: coeficiente intelectual, es decir
CI
, que tiene dos niveles:CI_Fin_Curso
yCI_Inicio_Curso
.
La variable dependiente se ha medido dos veces en cada sujeto; al inicio y al final del curso. Por lo tanto, es un análisis de muestras dependientes o relacionadas.
Resultados
Comprobación visual del efecto
Primero, presento gráficamente las dos medias, incluyendo las barras de error:
Basado en el gráfico, diría que hay un muy pequeño incremento en el CI. Es decir, observo un aumento en la media del CI al final del curso en comparación con el inicio.
Comprobación mediante prueba estadística
Para escoger la prueba estadística adecuada, el primer paso es comprobar si se cumplen los supuestos.
Mediante un simple histograma, puedo ver que no se cumple el principio de normalidad.
Puesto que se trata de una prueba para muestras relacionadas (o dependientes) pero no se cumple el principio de normalidad, la prueba estadística adecuada es la prueba W de Wilcoxon.
Con SPSS, abro la barra de herramientas Analizar > Pruebas no paramétricas > Cuadros de diálogo antiguos > 2 muestras relacionadas
. Ahí, selecciono prueba de rangos con signo de Wilcoxon.
Esto crea dos tablas. La segunda tabla se llama Estadísticos de prueba y contiene los valores necesarios para el contraste de hipótesis. Aquí encuentro el valor y la significación. Esta segunda es la que utilizo para comparar contra el nivel de significancia, que asumo que es 0.05.
Test Statisticsa | |
---|---|
Z | -8.224b |
Asymp. Sig. (2-tailed) | <.001 |
a Wilcoxon Signed Ranks Test b Based on negative ranks. |
Ahora que sé que el valor de significación resultante de la prueba de Wilcoxon es , procedo al contraste de hipótesis.
- , acepto la hipótesis nula.
- , rechazo la hipótesis nula.
Puesto que , significa que la diferencia es suficientemente significativa como para rechazar la hipótesis nula y concluir que hay un efecto. Es decir, que la intervención tiene un efecto significativo sobre el CI.
Y además, gracias a la prueba de signo, también puedo comprobar si el efecto es positivo o negativo gracias a la tabla de rangos con signo de Wilcoxon, que muestra la cantidad de veces en los que el segundo ensayo fue mayor, menor o igual al primero.
Wilcoxon Signed Ranks Test | ||||
---|---|---|---|---|
Ranks | N | Mean Rank | Sum of Ranks | |
CI al final del curso - CI al inicio del curso | Negative Ranks a | 1 | 77.00 | 77.00 |
Positive Ranks b | 76 | 38.50 | 2926.00 | |
Ties c | 3 | |||
Total | 80 | |||
a CI al final del curso < CI al inicio del curso |
La suma de los rangos positivos es , mientras que la suma de los rangos negativos es . Puesto que , concluyo que el efecto es positivo.
En esencia, puedo decir que la intervención ha tenido un efecto positivo sobre el CI. Sin embargo, aún no sé cómo de grande o pequeño ha sido ese efecto.
Calcula el tamaño del efecto
Para medir el tamaño del efecto, utilizo la prueba de Cohen.
Para ello, primero genero en SPSS la media, desviación estándar y tamaño muestral:
N | Mean | Std. Deviation | Minimum | Maximum | |
---|---|---|---|---|---|
CI al inicio del curso | 80 | 109.7813 | 20.53938 | 60.00 | 135.00 |
CI al final del curso | 80 | 115.9750 | 21.33309 | 60.00 | 142.00 |
La fórmula para calcular la d de Cohen es:
Donde:
- es la media del primer grupo
- es la media del segundo grupo
- es la varianza del primer grupo
- es la varianza del segundo grupo
- es la desviación estándar agrupada ()
En este caso
También puedo utilizar herramientas online como la calculadora del efecto online.
Ahora, comparo el valor con los valores estandarizados del estadístico :
- Efecto muy bajo o trivial:
- Efecto bajo: 👈
- Efecto medio:
- Efecto alto:
- Efecto muy alto:
Por lo tanto, concluyo que, aunque la intervención ha tenido un efecto y este efecto ha sido positivo, el tamaño del efecto es bajo.
1.2. Estudio sobre depresión
Premisa
Un psicólogo recibe a 6 personas con síntomas de depresión a lo largo de una semana. Aprovechando esta inusual ocasión, decide estudiar si su terapia cognitivo-conductual es eficaz para el tratamiento de la depresión. Para ello, aplica un cuestionario de depresión a cada persona durante la primera sesión, y el mismo cuestionario pasados unos meses tras el fin de la terapia. Los datos se presentan en la siguiente tabla:
Datos
Paciente | Sesión inicial | Sesión final |
---|---|---|
1 | 18 | 16 |
2 | 20 | 17 |
3 | 17 | 15 |
4 | 19 | 16 |
5 | 20 | 18 |
6 | 19 | 16 |
Los valores de cada sesión corresponden a la puntuación en un cuestionario de depresión, por lo que un valor mayor corresponde a una mayor depresión
Resultados
Calcula la cantidad de variación sistemática entre las sesiones
La variación sistemática refleja los cambios debidos a la intervención. Se mide a través de la varianza () de las diferencias, con la siguiente fórmula.
donde:
- : Diferencias
- : Media de las diferencias
- : Varianza de las diferencias
Es decir, para aplicar la fórmula, debo calcular tres cosas:
- Calcular las diferencias () de puntuación para cada paciente.
- Calcular la media de estas diferencias ().
Que finalmente me da la varianza de las diferencias (), que representa la variación sistemática.
Diferencias
Primero, voy a calcular las diferencias (). Para ello, he creado una columna que contiene la diferencia entre las puntuaciones de ambos ensayos.
Paciente | Sesión inicial | Sesión final | Diferencias () |
---|---|---|---|
1 | 18 | 16 | -2 |
2 | 20 | 17 | -3 |
3 | 17 | 15 | -2 |
4 | 19 | 16 | -3 |
5 | 20 | 18 | -2 |
6 | 19 | 16 | -3 |
Media de las diferencias
Después, calculo la media de las diferencias (), utilizando la fórmula de la media aritmética.
La media de las diferencias de 2.5 indica que, en promedio, las puntuaciones de depresión disminuyeron en 2.5 puntos entre la sesión inicial y la final después de la terapia. Esto sugiere una mejora en los síntomas de depresión en los pacientes tras recibir la terapia cognitivo-conductual.
Varianza de las diferencias
Finalmente, calculo la varianza de las diferencias () para medir la variación sistemática:
La varianza de las diferencias de 0.25 es una medida de la variabilidad de estas diferencias de puntuación. Una varianza relativamente baja indica que la cantidad de cambio en las puntuaciones entre las dos sesiones fue bastante consistente entre los pacientes.
Calcula la cantidad de variación no-sistemática
La cantidad de variación no-sistemática se refiere a la variabilidad en las puntuaciones que no se puede explicar por la intervención. Esta variabilidad puede ser resultado de errores de medición, variabilidad individual en la respuesta al tratamiento, u otros factores no controlados en el estudio.
Se calcula como la diferencia entre la suma de cuadrados total () y la suma de cuadrados del modelo ().
Es decir, debo realiar tres pasos:
- Calculo la suma de los cuadrados total ()
- Calculo la suma de los cuadrados del modelo ()
- Calculo la suma de los cuadrados residual (), que representa la variación no-sistemática.
Si buscas en internet, verás que hay disparidad sobre cómo llamar a las sumas de cuadrados. Yo voy a utilizar la convención de la primera columna, pero es muy probable que encuentres otros términos equivalentes:
Convención | Equivalente |
---|---|
total () | total () |
del modelo () | entre los grupos () |
residual () | del error () |
Mientras que gran parte de la literatura coincide en que el primero se llama Suma de cuadrados total, hay disparidad en los otros dos.
Suma de los cuadrados total
- es la media total, calculada usando la fórmula de la media
- es cada una de las puntuaciones observadas
La media general es la suma de todos los valores () dividida entre el total de valores .
Después, calculo cada desviación al cuadrado. Para ello, con cada valor, resto la media general () y elevo el resultado al cuadrado.
- Sesión Inicial
- Sesión Final
Finalmente, sumo todas las desviaciones al cuadrado:
Es decir, que la suma de los cuadrados total es 30.92.
Suma de los cuadrados del modelo
Para ello, hay que calcular las medias de cada grupo, o en este caso, cada sesión. Primero calculo la media de la primera sesión, y después de la segunda sesión. Finalmente, aplico la fómula del :
Es decir, que la Suma de los cuadrados del modelo es 18.75.
Suma de los cuadrados residual
Calculo la suma de los cuadrados residual () como la diferencia entre y :
Calcula el valor t
Para calcular el valor de una prueba de Student para muestras relacionadas (en este caso, medidas repetidas sobre los mismos sujetos), utilizo la siguiente fórmula:
Donde:
- es la media de las diferencias
- es el error estándar de la media de las diferencias
Otra forma de verlo sería:
Donde:
- es la media de las diferencias
- es la varianza de las diferencias
- es el tamaño de la muestra
La media de las diferencias la calculé antes: .
El error estándar de las diferencias se calcula con la siguiente fórmula:
La varianza de las diferencias la calculé antes:
Por lo tanto,
El error estándar de las diferencias es 0.204, lo cual indica una precisión razonablemente alta en la estimación de la media de las diferencias.
Finalmente, puedo aplicar la fórmula de :
Determina la significancia y contrasta la hipótesis
Para determinar la significancia, contrasto si el valor de es mayor que el valor crítico para estos datos.
Para saber cuál es el valor crítico, consulto la Tabla de valores críticos de la distribución t de Student. Concretamente, tengo que buscar las coordenadas para y .
Conf. Level | 50% | 80% | 90% | 95% | 98% | 99% |
---|---|---|---|---|---|---|
One Tail | 0.250 | 0.100 | 0.050 | 0.025 | 0.010 | 0.005 |
Two Tail | 0.500 | 0.200 | 0.100 | 0.050 | 0.020 | 0.010 |
gl (grados de libertad) | ||||||
4 | 0.741 | 1.533 | 2.132 | 2.776 | 3.747 | 4.604 |
5 | 0.727 | 1.476 | 2.015 | 2.571 | 3.365 | 4.032 |
6 | 0.718 | 1.440 | 1.943 | 2.447 | 3.143 | 3.707 |
Es decir, que el valor crítico para estos datos es 2.015. Con esto en mente, procedo a hacer el contraste de hipótesis
- sí, ha habido un cambio significativo.
- no, no ha habido un cambio significativo.
Es decir, hay evidencia significativa para rechazar la hipótesis nula y concluyo que la terapia cognitivo-conductual es eficaz para el tratamiento de la depresión.
Parte 2: Comparación de dos grupos independientes
Premisa
La misma investigadora del primer ejercicio, tras realizar su primera investigación comparando dos medias dependientes, se da cuenta de que este diseño no permite comprobar de manera objetiva si la inteligencia ha mejorado realmente por el hecho de aplicar las estrategias de entrenamiento.
De este modo, en el siguiente curso, decide realizar un segundo experimento donde utilizará otra novedosa estrategia de entrenamiento de las habilidades de razonamiento. En esta ocasión, divide a la clase en dos grupos: un grupo control (que no recibirá el entrenamiento) y un grupo experimental (que sí se someterá a dicho entramiento). Tras varias sesiones, aplica una sola vez la prueba de inteligencia y compara ambos grupos.
Datos
Haz click para ver toda la base de datos
Grupo CI_Estudio2 1 100,00 ... ...
Base de datos completa:
Grupo | CI_Estudio2 |
---|---|
1 | 100,00 |
1 | 100,00 |
1 | 116,00 |
1 | 100,00 |
1 | 100,00 |
1 | 100,00 |
1 | 100,00 |
1 | 100,00 |
1 | 100,00 |
1 | 92,50 |
1 | 92,50 |
1 | 92,50 |
1 | 100,00 |
1 | 100,50 |
1 | 115,00 |
1 | 115,00 |
1 | 100,00 |
1 | 100,00 |
1 | 100,00 |
1 | 130,00 |
1 | 122,50 |
1 | 77,50 |
1 | 78,00 |
1 | 92,50 |
1 | 100,00 |
1 | 107,50 |
1 | 115,00 |
1 | 85,50 |
1 | 130,00 |
1 | 77,50 |
1 | 85,00 |
1 | 92,50 |
1 | 100,00 |
1 | 107,50 |
1 | 115,00 |
1 | 122,50 |
1 | 130,00 |
1 | 137,50 |
1 | 145,00 |
1 | 100,00 |
2 | 122,50 |
2 | 115,00 |
2 | 130,00 |
2 | 145,00 |
2 | 122,50 |
2 | 137,50 |
2 | 115,00 |
2 | 122,50 |
2 | 107,50 |
2 | 122,50 |
2 | 107,50 |
2 | 137,50 |
2 | 115,00 |
2 | 122,50 |
2 | 107,50 |
2 | 137,50 |
2 | 130,00 |
2 | 130,00 |
2 | 130,00 |
2 | 130,00 |
2 | 130,00 |
2 | 130,00 |
2 | 137,50 |
2 | 137,50 |
2 | 137,50 |
2 | 137,50 |
2 | 137,50 |
2 | 137,50 |
2 | 145,00 |
2 | 145,00 |
2 | 145,00 |
2 | 145,00 |
2 | 145,00 |
2 | 145,00 |
2 | 145,00 |
2 | 145,00 |
2 | 145,00 |
2 | 145,00 |
2 | 145,00 |
2 | 145,00 |
Name | Type | Width | Decimals | Label | Values | Columns | Measure |
---|---|---|---|---|---|---|---|
Grupo | Numeric | 8 | 0 | Grupo | {1, Control} | 13 | Nominal |
CI_Estudio2 | Numeric | 8 | 2 | None | None | 13 | Scale |
Son dos variables:
Grupo
:1
significa Grupo de control, sin visualización de capítulos2
significa Grupo experimental con visualización de capítulos
CI_Estudio2
: coeficiente intelectual en este nuevo experimento
Fundamentos del estudio
¿Cuál es la hipótesis nula y la alternativa?
- Hipótesis nula (): las medias en ambos grupos son iguales; es decir:
- Hipótesis alternativa (): lo contrario; es decir:
Sin embargo, tal vez sea más correcto especificar la hipótesis alternativa como , ya que el estudio parte de la hipótesis de que que el grupo experimental tendrá un CI más alto.
¿Cuántas veces se mide la variable dependiente en este estudio?
- Variable independiente: la pertenencia al grupo que ha recibido el entrenamiento, es decir:
Grupo
. - Variable dependiente: coeficiente intelectual resultante, es decir
CI_Estudio2
.
La variable dependiente se ha medido una vez en cada sujeto. Por lo tanto, es un análisis de muestras independientes.
Resultados
Comprobación visual del efecto
Primero, presento gráficamente las dos medias, incluyendo las barras de error:
Basado en el gráfico, diría que hay un incremento muy claro en el CI. Es decir, observo un aumento en la media del CI en el grupo que ha recibido el entrenamiento.
Comprobación mediante prueba estadística
Primero, tengo que comprobar si se cumplen los supuestos necesarios.
Al ser un análisis de muestras independientes, para poder realizar pruebas paramétricas es necesario que los datos cumplan no sólo el principio de normalidad, sino también el supuesto de homocedasticidad.
En cuanto al supuesto de normalidad: ya lo he analizado anteriormente y sí se cumple. Sin embargo, aún no sé si se cumple el supuesto de homocedasticidad.
Comprueba el supuesto de homocedasticidad
Para comprobar si se cumple el principio de varianzas iguales, utilizo la prueba de Levene.
Levene's Test for Equality of Variances | F | Sig. |
---|---|---|
Equal variances assumed | 1.596 | .210 |
Equal variances not assumed |
La prueba de Levene genera un valor de significancia (). La significancia, como se puede ver en la tabla, es .210
.
En esta prueba, la homocedasticidad de las variables es la hipótesis nula. Por lo tanto:
- acepto la hipótesis nula, por lo que sí hay homocedasticidad.
- rechazo la hipótesis nula y concluyo que no hay homocedasticidad.
Ahora que sé que sí se cumple el supuesto de homocedasticidad, concluyo que puedo realizar pruebas paramétricas. Por lo tanto, la prueba estadística correcta para el contraste de hipótesis es la prueba de Student.
Determina significancia y contrasta hipótesis
Ejecuto la prueba de Student desde SPSS, utilizando un Test para muestras independientes
. El resultado es una tabla con la siguiente información:
Levene's Test for Equality of Variances | t-test for Equality of Means | ||||||
---|---|---|---|---|---|---|---|
F | Sig. | t | df | Significance One-Sided p | Two-Sided p | Mean Difference | Std. Error Difference |
1.596 | .210 | -9.036 | 78 | <.001 | <.001 | -28.43750 | 3.14701 |
Ahora que sé que el valor de significación es <0.001, procedo a hacer el contraste de hipótesis:
- acepto la hipótesis nula, por lo que no hay efecto.
- rechazo la hipótesis nula y concluyo que sí hay efecto.
Es decir, que sí existen diferencias entre el grupo de control y el experimental.
Grupo | N | Mean | Std. Deviation | Std. Error Mean |
---|---|---|---|---|
Control | 40 | 104.3750 | 15.90023 | 2.51405 |
Experimental | 40 | 132.8125 | 11.97202 | 1.89294 |
Además, observando los estadísticos descriptivos, veo que la media del grupo experimental es mayor. Concretamente: . Por lo tanto, concluyo que hay evidencia significativa de un efecto positivo, por el cual el grupo experimental supera al de control.
Calcula el tamaño del efecto
Para calcular el tamaño del efecto (d de Cohen) a mano usando la ecuación proporcionada, sigo los pasos detallados con los estadísticos descriptivos para ambos grupos del estudio.
- Grupo Control:
- Media: 104.3750
- Desviación estándar: 15.90023
- Grupo Experimental:
- Media: 132.8125
- Desviación estándar: 11.97202
Fórmula de la d de Cohen:
Primero, calculo la diferencia de medias
Después, calculo las varianzas de cada grupo
Ahora, calculo la media de las varianzas:
A continuación, calculo la raíz cuadrada de la media de las varianzas
Finalente, puedo calcular la d de Cohen
El valor negativo indica la dirección del efecto, pero al interpretar el tamaño del efecto, me centro en el valor absoluto. Así, el tamaño del efecto calculado es:
Un valor de se considera un efecto muy alto según los criterios de Cohen:
- Efecto muy bajo o trivial:
- Efecto bajo:
- Efecto medio:
- Efecto alto:
- Efecto muy alto:
Por lo tanto, el tamaño del efecto de la intervención sobre el CI en este estudio es muy alto.
Cuestionario
Pregunta 1

Pregunta
En la parte 2: Comparación de dos grupos independientes, ¿qué grupo ha mejorado significativamente su CI?
Pregunta 2

Pregunta
En la prueba t de Student de medidas independientes:
Pregunta 3

Pregunta
En el estudio sobre depresión, el valor t:
Pregunta 4

Pregunta
En el estudio sobre depresión, las hipótesis nula es:
Pregunta 5

Pregunta
En la primera parte, en el estudio sobre CI, el valor del tamaño del efecto es:
Pregunta 6

Pregunta
La prueba t de Student es una prueba paramétrica
Pregunta 7

Pregunta
En la parte 2: Comparación de dos grupos independientes, el valor del tamaño del efecto calculado a mano es:
Pregunta 8

Pregunta
En primer estudio sobre el CI, según el gráfico de barras:
Pregunta 9

Pregunta
¿Cuál de estas afirmaciones es falsa?
Pregunta 10

Pregunta
En la parte 2: Comparación de dos grupos independientes, la hipótesis nula es: