Medidas paralelas
Conceptualización
Medidas paralelas, también llamado formas paralelas, es un procedimiento para estimar la fiabilidad de un test mediante la comparación con otro test paralelo, el cual se construye para medir el mismo constructo y tiene las mismas características psicométricas: misma media, varianza, estructura de ítems, etc.
Este método se basa en los siguientes principios:
- Suposición de equivalencia: las pruebas paralelas son equivalentes en el sentido de que miden el mismo constructo y, por lo tanto, sus puntuaciones verdaderas son idénticas. Esto permite que cualquier diferencia en las puntuaciones entre los tests sea atribuible al error de medida.
- Cálculo de fiabilidad: la fiabilidad de un test se puede estimar calculando la correlación entre las puntuaciones obtenidas en el test original y en el test paralelo. Esta correlación representa el grado de consistencia entre ambas mediciones.
Si la correlación entre las puntuaciones de los dos tests paralelos es alta, se puede concluir que el test es fiable, ya que las mediciones son consistentes y reflejan el mismo constructo sin estar fuertemente influenciadas por el error.
Este enfoque es útil para estimar la fiabilidad sin necesidad de conocer directamente la varianza de la puntuación verdadera , pero requiere diseñar y administrar un test paralelo, lo cual puede ser un proceso costoso y laborioso.
Es decir, primero aplico el test , donde:
Aquí, la puntuación observada () es la suma de la puntuación verdadera () y el error (). Este es el 1º supuesto de la TCT.
Después aplico el tes , que es equivalente y paralelo al anterior, donde:
En este caso, representa la puntuación observada en el segundo test, que también es la suma de la puntuación verdadera () y el error de medición () para esa segunda versión del test.
no cambia entre los dos tests, ya que ambos miden el mismo constructo. Esto es, precisamente, lo que hace que cualquier diferencia en las puntuaciones observadas entre los tests paralelos se debe al error de medida.
La presencia del apóstrofe () indica que se trata de una versión paralela o alternativa del test original. La notación se utiliza para representar la puntuación observada en el segundo test paralelo. Esta notación indica que se trata de una puntuación observada en un test equivalente al original, pero no necesariamente idéntico.
Además, gracias a los supuestos de la TCT, sé que las varianzas de las puntuaciones observadas y las varianzas del error son iguales:
Tambien sé que las medias de las puntuaciones observadas son iguales:
¿Cómo sé que las medias son iguales?
Si tengo dos test, utilizando la notación de la TCT, puedo expresar las medias de las puntuaciones observadas de la siguiente forma:
- t1:
- t2:
Por el 2º supuesto de la TCT, sé que la media del error es cero; por tanto, puedo simplificar las ecuaciones cancelando y .
- t1:
- t2:
Asimismo, puedo cancelar en ambas ecuaciones, ya que se supone que las puntuaciones verdaderas son iguales en ambos tests.
- t1:
- t2:
Por lo tanto, las medias de las puntuaciones observadas en ambos tests son iguales.
Esto garantiza que ambas pruebas son equivalentes en términos de fiabilidad.
Sin embargo, aunque la media y la varianza de las puntuaciones observadas son iguales, los valores de y no son iguales. Es decir, y son medidas independientes.
En el caso de dos versiones paralelas del test ( y ), los supuestos que se manejan son:
-
Las medias de las puntuaciones observadas son iguales:
-
Las varianzas de las puntuaciones observadas son iguales:
-
La varianza de las puntuaciones verdaderas es la misma para ambas versiones del test:
-
La varianza del error es igual en ambas versiones del test:
ρXX' = ρ²XV
Cuando se administran dos tests paralelos ( y ), se cumple que la correlación entre las puntuaciones observadas en ambos tests paralelos () es igual a la correlación entre la puntuación observada y la verdadera ().
En otras palabras, la correlación entre las puntuaciones observadas en los dos tests paralelos sirve como una estimación de la fiabilidad del test original.
Para entender por qué esto ocurre, conviene recordar algunos supuestos clave de la TCT para tests paralelos:
- Las puntuaciones verdaderas () son idénticas en ambos tests.
- Los errores de medida en y son independientes y no están correlacionados con la puntuación verdadera .
Dado que ambas versiones del test miden el mismo constructo con errores independientes, la correlación entre las puntuaciones observadas en ambos tests paralelos () representa la proporción de varianza compartida por las puntuaciones verdaderas, que es precisamente la fiabilidad del test.
Cuando los errores son independientes y se cumplen los supuestos de tests paralelos, la correlación refleja el grado en que las puntuaciones verdaderas () explican la varianza en ambas versiones del test. Por lo tanto, esta correlación es una estimación directa de la fiabilidad del test original, o dicho de otra manera:
Este resultado es central en la TCT, ya que permite estimar la fiabilidad sin necesidad de conocer directamente , lo cual, como explico antes, es inobservable en la práctica.
Error Estándar de Medición (σE)
El Error Estándar de Medición ( ó ), también llamado Error Estándar o Error Típico, es una medida de la cantidad de error en las puntuaciones observadas de un test. Se denota como y se puede calcular mediante la siguiente fórmula:
Donde:
- es el error estándar.
- es la desviación típica de las puntuaciones observadas.
- es la fiabilidad del test, calculada como la correlación entre medidas paralelas.
¿De dónde procede la fórmula?
Esta fórmula se deriva a partir de la relación entre la varianza de los errores y la fiabilidad. A continuación explico el razonamiento paso a paso.
En primer lugar, sé por la 3ª deducción de la TCT que la varianza de la puntuación observada es la suma de la varianza verdadera y la varianza del error:
Por otro lado, sé que la fiabilidad del test, denotada como (o ), representa la proporción de la varianza total de las puntuaciones observadas () que es explicada por la varianza verdadera (). Esto se expresa matemáticamente como:
Puedo despejar de la definición de fiabilidad:
Ahora que tengo una nueva forma de expresar , vuelvo a la 3º deducción de la TCT y lo sustituyo por esta nueva expresión:
Como lo que me interesa es calcular el error, aíslo :
Finalmente, factorizo en el lado derecho de la ecuación. Factorizar consiste en sacar el término común (en este caso, ) fuera de los paréntesis. Esto permite simplificar la ecuación:
Así obtengo la fórmula deseada para la varianza del error. Sin embargo, no quiero la varianza del error, sino el error estándar. Por tanto, tomo la raíz cuadrada de la varianza del error para obtener el error estándar:
Relación entre σE y fiabilidad
Como norma general, cuanto menor sea el error estándar (), mayor es la fiabilidad del test.
Sin embargo, un mayor error estándar no implica automáticamente que un test sea menos fiable que otro. La fiabilidad depende también de la desviación típica de las puntuaciones observadas () y de la correlación entre las puntuaciones verdaderas y observadas ( o en el caso de medidas paralelas).
El siguiente ejemplo muestra los valores de , y para dos test:
Test | Interpretación | |||
---|---|---|---|---|
t1 | 20 | 21 | 0.05 | Baja fiabilidad |
t2 | 25 | 200 | 0.97 | Alta fiabilidad |
En este ejemplo:
- El primer test tiene un error típico de 20 y una desviación típica de 21 con una correlación de 0.05, lo que indica baja fiabilidad.
- El segundo test tiene un error típico de 25, pero una desviación típica mucho mayor (200) y una correlación de 0.97, lo que indica una alta fiabilidad.
Lo importante es considerar el tamaño relativo del error típico con respecto a la desviación típica de las puntuaciones observadas y cómo se correlacionan estas puntuaciones con las puntuaciones verdaderas. Cuanto mayor sea la correlación (), mayor será la fiabilidad, independientemente de que el valor de sea mayor o menor.
Esto se debe a que cuando el error típico de medida es bajo, las puntuaciones observadas son más precisas y están más cerca de las puntuaciones verdaderas.
Limitaciones
El procedimiento de medidas paralelas es limitado en la práctica porque es muy dificil obtener realmente dos tests paralelos. Por tanto, aunque es un método útil para estimar la fiabilidad, su aplicación es limitada por la necesidad de contar con dos tests equivalentes y paralelos.