Saltar al contenido principal

Informe de fiabilidad y baremos

Datos de la actividad
  • Asignatura: 14GPSI_10_C_2024-25_Psicometría
  • Actividad: UC 6. Evidencias de validez y Baremos
  • Alumnos:
    • Jahir Falon
    • Taig Mac Carthy (72516712N)
  • Profesor: Ana Hernández Dorado

Validez referida al criterio

Además de los 12 ítems de rasgo, en la construcción del test se han incluído 4 ítems de criterio que miden el rendimiento académico. Estos ítems eran:

EnunciadoMideRango
Nota en la asignatura 'Memoria'Criterio (Rendimiento académico)Del 1 al 10
Nota en la asignatura 'Estadística'Criterio (Rendimiento académico)Del 1 al 10
Nota en la asignatura 'Psicofisiología'Criterio (Rendimiento académico)Del 1 al 10
Nota en la asignatura 'Psicología Social'Criterio (Rendimiento académico)Del 1 al 10

En esencia, se espera que la puntuación del test (variable independiente o predictora) se relacione positivamente con la variable criterio (rendimiento académico). Las hipótesis planteadas son:

  • H0H_0: β=0\beta=0 (el test no predice la nota).
  • H1H_1: β0\beta \neq 0 (el test predice la nota).

Ítems similares se han utilizado en estudios previos para evaluar la relación entre Conscientiousness y el rendimiento académico, como el reciente trabajo de Rodrigues (2024)1. En este estudio, se pidió a los estudiantes que reportasen sus notas en diferentes asignaturas, precisamente de la misma forma que se ha hecho en este test.

Conscientiousness es un rasgo de personalidad que ha demostrado tener una fuerte relación con el éxito en diferentes áreas de la vida, incluyendo el académico. John y Srivastava (1999)2 subrayan que conscientiousness es un predictor clave del comportamiento organizado y el logro de metas. De forma más concreta, Roberts et al. (2009)3 sostienen que conscientiousness predice el éxito académico.

En general, la literatura que relaciona conscientiousness con el rendimiento académico es consistente en señalar que las personas con puntuaciones altas en conscientiousness tienden a tener un mejor rendimiento académico.

En el ya mencionado estudio de Rodrigues (2024)1, se encontró una correlación de Pearson de 0.228, con un p-value <0.01. Por lo tanto, cabría esperar que en el análisis de validez referida al criterio de nuestro test, se encontrase una correlación similar.

Análisis

Para evaluar la validez referida al criterio, hemos realizado un análisis de regresión lineal. En suma, los datos sugieren que el test tiene ubuena validez de criterio: a medida que aumentan las puntuaciones en conscientiousness, aumenta también el rendimiento académico. Esto concuerda con la teoría y con la hipótesis planteada.

De forma más detallada, los resultados obtenidos son los siguientes:

Correlaciones

La correlación entre la puntuación total del test y el criterio es .836.836, muy alta; y estadísticamente significativa (p<.001p < .001). Esto ya sugiere una fuerte relación positiva: a mayor puntuación en el test, mayor puntuación en el criterio. Conceptualmente, se confirma la hipótesis de que las personas más concienzudas (puntajes altos en el test) tienden a obtener mejor rendimiento (criterio más alto).

Total_CriterioTotal_Test
Pearson Correlation
└─ Total_Criterio1.0000.836
└─ Total_Test0.8361.000
Sig. (1-tailed)
└─ Total_Criterio.<.001
└─ Total_Test0.000.
N
└─ Total_Criterio100100
└─ Total_Test100100

Resumen del modelo

R2=.699R^2 = .699 indica que casi el 70% de la variabilidad en el criterio puede ser explicada por la puntuación total del test. Es un porcentaje muy alto, lo que refuerza la idea de que el test es un muy buen predictor del criterio.

ModelRR SquareAdjusted R SquareStd. Error of the Estimate
1.836ᵃ.699.6961.688
  • a. Predictors: (Constant), Total_Test

El Std. Error of the Estimate (1.6881.688) es la desviación típica de los errores de la regresión. Un valor moderado indica que las predicciones no se alejan demasiado de las puntuaciones reales en el criterio.

Analisis de varianza (ANOVA)

El modelo de regresión es estadísticamente significativo (p<.001p < .001).

F(1,98)=227.326,p<.001F(1, 98) = 227.326, p < .001

En otras palabras, la pendiente no es cero y Total_Test predice de forma relevante el Total_Criterio.

ModelSum of SquaresdfMean SquareFSig.
1Regression647.9711647.971227.326<.001ᵇ
Residual279.339982.850
Total927.31099
  • a. Dependent Variable: Total_Criterio
  • b. Predictors: (Constant), Total_Test

Con estos valores, se puede rechazar la hipótesis nula de que la variable no explique el criterio.

Coeficientes

De la tabla de coeficientes, se puede extraer que la ecuación de regresión es la siguiente:

\text{Criterio} = 14.287 + 0.383 \times \text{Total_Test}

donde:

  • El intercepto o constante (14.28714.287) es la puntuación pronosticada en el criterio cuando la variable Total_Test vale 00.
  • La pendiente (0.3830.383) indica que, por cada punto que aumenta Total_Test, el criterio subiría en 0.383 puntos, en promedio.

Por otro lado, el valor p (<.001< .001) y el intervalo de confianza [0.333,0.434][0.333, 0.434] confirman que esta pendiente es significativa y positiva.

Por otro lado, se puede extraer también la ecuación en puntuaciones estandarizadas. La columna Beta (Standardized Coefficients) representa la pendiente en de la ecuación de regresión en puntuaciones típicas (z-scores). Eso significa que por cada +1 desviación típica en 'Total_Test', el criterio aumenta 0.8360.836 desviaciones típicas. Dicho de otro modo, la ecuación en puntuaciones estandarizadas sería aproximadamente:

Z_{\text{Criterio}} = 0.836 \times Z_{\text{Total_Test}}
ModelUnstandardized CoefficientsStandardized Coefficients95.0% Confidence Interval for B
BStd. ErrorBetatSig.Lower BoundUpper Bound
1(Constant)14.2870.88416.161<.00112.53216.041
Total_Test0.3830.0250.83615.077<.0010.3330.434
  • a. Dependent Variable: Total_Criterio

Validez interna

Para analizar la validez de la estructura interna de la prueba, realizamos un Análisis Factorial Exploratorio (AFE). El propósito es confirmar cuántas dimensiones subyacen en los ítems finales.

Al construir el test, explicamos que los componentes de conscientiousness que se evalúan y los ítems que los representan son:

  • Responsabilidad: se mide con ítems 1, 5 y 7
  • Orden: se mide con ítems 2, 4, 8 y 10
  • Autodisciplina: se mide con ítems 3, 9 y 11
  • Persistencia: se mide con ítems 6 y 12

Análisis

Como se muestra a contiuación, se obtienen 4 factores que explican  60~60% de la varianza total. Cada factor agrupa ítems que, en gran medida, concuerdan con las subdimensiones teóricas de conscientiousness planteadas (responsabilidad, orden, autodisciplina y persistencia).

Las correlaciones entre factores son moderadas o bajas, lo que sugiere que cada factor mide un componente específico, si bien todos pertenecen a un marco general (conscientiousness).

En cuando a la bondad de ajuste, el modelo no es perfecto según la Chi-Cuadrado, pero es frecuente en tests de personalidad.

Por lo tanto, sería aceptable puntuar la prueba total como un solo factor, así como usar 4 subescalas separadas para cada faceta.

KMO y Bartlett's Test

El valor de KMO es de 0.6440.644. En la práctica, >0.60> 0.60 suele considerarse aceptable para proseguir con el AFE. Por lo tanto, la muestra es adecuada para realizar un AFE.

Por otro lado, el test de esfericidad de Bartlett muestra que la matriz de correlaciones no es una matriz identidad, por lo que existen suficientes correlaciones significativas para que el análisis factorial tenga sentido.

Kaiser-Meyer-Olkin Measure of Sampling Adequacy0.644
Bartlett's Test of Sphericity
└─ Approx. Chi-Square520.693
└─ df66
└─ Sig.<.001

Estos resultados justifican la realización de un AFE: hay suficientes correlaciones entre los ítems y un tamaño muestral razonable.

Bondad de ajuste

El resultado de X2(24)=70.669,p<.001\Chi^2(24) = 70.669, p < .001 indica que el modelo factorial no es perfecto en términos estadísticos; pero es relativamente común en psicología que el test de bondad de ajuste rechace la hipótesis de ajuste perfecto. Se considera aceptable si las cargas son interpretables y las comunalidades suficientes.

Chi-SquaredfSig.
70.669240.000

Gráfico de sedimentación

El gráfico de sedimentación muestra dos cosas interesantes:

  • Hay un factor que tiene un gran poder explicativo
  • Hay un codo en el factor 4

Esto sugiere que la estructura interna de la prueba se compone de 4 factores, aunque el primer factor es el que tiene un mayor poder explicativo. Esto se puede ver mejor en la tabla de varianza total explicada.

Varianza total explicada

Aparecen 4 factores con autovalores por encima de 1.

  • Factor 1 = 3.968 (33.07 % de varianza inicial)
  • Factor 2 = 1.727 (14.39 %)
  • Factor 3 = 1.612 (13.44 %)
  • Factor 4 = 1.307 (10.89 %)

Sumando estos 4 primeros, se llega a  71.79~71.79% de varianza acumulada, aunque tras la extracción y rotación la varianza explicada suele bajar algo ( 59.54~59.54%).

FactorInitial Eigenvalues (Total)% of VarianceCumulative %Extraction Sums of Squared Loadings (Total)% of VarianceCumulative %Rotation Sums of Squared Loadingsᵃ (Total)
13.96833.07133.0712.84123.67323.6732.938
21.72714.39347.4632.04317.02740.7002.269
31.61213.43560.8991.1199.32450.0242.022
41.30710.89271.7911.1429.51459.5381.233
50.8547.11478.905
60.7175.97684.881
70.4463.71688.597
80.3893.24491.841
90.3703.08494.925
100.2772.30597.230
110.2151.79099.020
120.1180.980100.000
  • Extraction Method: Maximum Likelihood
  • a. When factors are correlated, sums of squared loadings cannot be added to obtain a total variance.

Comunalidades

En la tabla Communalities (initial vs. extraction), se observa que la mayoría están entre 0.400.40 y 0.700.70, lo que indica que los factores consiguen explicar de forma moderada la varianza de cada ítem.

Por ejemplo, Item_3_r tiene una comunalidad final muy alta (0.9990.999).

Item_12 y Item_9_r rondan 0.400.450.40-0.45, algo más bajo pero todavía aceptable.

ItemInitialExtraction
Item_10.6000.726
Item_20.4770.438
Item_3_r0.8020.999
Item_40.6670.686
Item_5_r0.5480.417
Item_60.4850.472
Item_7_r0.5870.592
Item_80.4920.597
Item_9_r0.5530.453
Item_100.4700.707
Item_11_r0.5600.619
Item_120.4030.439
  • Extraction Method: Maximum Likelihood
  • a. One or more communality estimates greater than 1 were encountered during iterations. The resulting solution should be interpreted with caution.

En general, los ítems se explican de manera aceptable por los 4 factores extraídos. No se observan comunalidades demasiado bajas (por debajo de 0.200.20) que sugieran eliminar ítems, aunque alguno es más discreto ( 0.417~0.417).

Matrices Factoriales

Analizando tanto la Pattern Matrix como la Structure Matrix, se pueden observar patrones más concretos.

  • Factor 1: saturan, por ejemplo, Item_3_r (0.961), Item_5_r (0.608), Item_7_r (0.730), Item_9_r (0.496).
  • Factor 2: saturan Item_1 (0.821), Item_2 (0.656), Item_4 (0.569).
  • Factor 3: destaca Item_10 (0.859).
  • Factor 4: saturan Item_6 (0.626) y Item_8 (0.513).

Con esto, se puede inferir que el Factor 1 quizá refleje “Autodisciplina” o “Falta de Procrastinación”. El Factor 2 parece agrupar ítems de “Responsabilidad/Orden” (Item_1, 2, 4). El Factor 3 parece estar muy marcado por el Item_10 (posiblemente “Planificación” o “Persistencia”).

Structure Matrix
Item1234
Item_10.2580.8050.0180.227
Item_20.1580.6570.169-0.082
Item_3_r0.9520.1560.435-0.195
Item_40.5070.7010.486-0.139
Item_5_r0.6330.1960.2270.160
Item_60.1770.2700.0890.621
Item_7_r0.6990.2610.0220.270
Item_80.446-0.0240.4440.508
Item_9_r0.5490.3200.298-0.314
Item_100.2440.0990.837-0.028
Item_11_r0.3980.4040.467-0.525
Item_120.2120.4680.5500.005
Pattern Matrix
Item1234
Item_10.0700.821-0.1570.224
Item_2-0.0320.6560.041-0.069
Item_3_r0.961-0.1410.136-0.242
Item_40.2670.5690.275-0.128
Item_5_r0.6080.0230.0330.128
Item_60.0520.2520.0620.626
Item_7_r0.7300.108-0.2230.215
Item_80.338-0.1930.4080.513
Item_9_r0.4960.1610.082-0.335
Item_10-0.016-0.0710.8590.028
Item_11_r0.2580.2650.295-0.516
Item_12-0.0560.3830.4930.046
  • Extraction Method: Maximum Likelihood
  • Rotation Method: Oblimin with Kaiser Normalization

Correlación entre factores

Los factores no están fuertemente correlacionados; las correlaciones rondan .20.33.20-.33 (Factor 1 con Factor 2 y 3), y valores muy bajos con Factor 4. Esto implica que cada factor mide algo relativamente diferenciado dentro del constructo general, pero siguen existiendo relaciones moderadas (lógico si todas son facetas de “Conscientiousness”).

Factor1234
11.0000.2760.3250.056
20.2761.0000.204-0.014
30.3250.2041.000-0.065
40.056-0.014-0.0651.000
  • Extraction Method: Maximum Likelihood
  • Rotation Method: Oblimin with Kaiser Normalization

Las subdimensiones están relacionadas pero no tan intensamente como para colapsarlas en un único factor. Al no superar .30-.35, podríamos plantear un factor de segundo orden, pero no sería necesario.

Baremos

El Test C12 es un test de rendimiento típico, en oposición a ser de rendimiento óptimo. Eso significa que para interpretar las puntuaciones, es necesario compararlas con una muestra normativa, ya que las puntuaciones no tienen significado inherente.

Gracias a los percentiles y las puntuaciones típicas (zz y TT) obtenidos durante la validación, podemos comparar cualquier puntuación individual con la distribución de la muestra de 100 participantes, y asignar significado a las puntuaciones.

En base a los datos obtenidos, proponemos los siguientes rangos:

  • Contientiousness bajo: entre 12 y 30 puntos.
  • Conscientiousness medio: entre 30 y 37 puntos.
  • Conscientiousness alto: entre 37 y 60 puntos.

Estos valores se basan en los percentiles obtenidos en la muestra. Por ejemplo, una puntuación de 33 puntos se sitúa en el percentil 50, lo que significa que está en la media de la muestra.

Aunque teóricamente el valor mínimo obtenible es 12, y el máximo 60, en la práctica, todas las puntuaciones se encuentran entre 19 y 56 puntos.

Puntuación directaPercentilPuntuación zzPuntuación TT
191.0-2.2727
202.0-2.1229
269.0-1.2238
2710.0-1.0739
2814.0-0.9241
2920.0-0.7742
3033.0-0.6244
3144.0-0.4845
3247.0-0.3347
3350.0-0.1848
3456.0-0.0350
3565.00.1351
3674.00.2853
3777.00.4354
3880.00.5856
3981.00.7357
4086.00.8859
4188.01.0360
4289.01.1862
4395.01.3363
4496.01.4865
5599.03.1281
56100.03.2783

Esta tabla incluye los percentiles, las puntuaciones zz y las puntuaciones TT para cada puntuación directa en una muestra de 100 participantes.

Referencias bibliográficas

Footnotes

  1. Rodrigues, J., Rose, R., & Hewig, J. (2024)._ The Relation of Big Five Personality Traits on Academic Performance, Well-Being and Home Study Satisfaction in Corona Times_. European journal of investigation in health, psychology and education, 14(2), 368-384. 2

  2. In M. R. Leary & R. H. Hoyle (Eds.), Handbook of individual differences in social behavior (pp. 369-381). Guilford Press.

  3. John, O. P., & Srivastava, S. (1999). The Big Five trait taxonomy: History, measurement, and theoretical perspectives. In L. A. Pervin & O. P. John (Eds.), Handbook of personality: Theory and research (pp. 102-138). Guilford Press.