Estimación de puntuación verdadera
Conceptualización
La puntuación verdadera () es el valor real o ideal del constructo. A diferencia de la puntuación observada (), la puntuación verdadera no se puede medir, sino que se debe estimar.
Por eso, la estimación de la puntuación verdadera es un procedimiento que permite obtener una aproximación de a partir de la puntuación observada en un test.
Como explico en los supuestos de la TCT, la puntuación verdadera () de un individuo en un test se puede estimar a partir de su puntuación observada (). La relación fundamental que expresa este modelo es:
donde:
- : Puntuación observada del individuo .
- : Puntuación verdadera, que representa el valor real o ideal de la habilidad o característica que el test pretende medir.
- : Error de medida, que incluye cualquier fuente de variabilidad que no esté relacionada con la puntuación verdadera.
Existen dos métodos principales para estimar la puntuación verdadera:
- Estimación puntual: obtengo un valor específico de a partir de sin considerar un rango de posibles valores. Este método es útil para reflejar la incertidumbre asociada al error de medida ().
- Estimación por intervalos: construyo un intervalo de confianza alrededor de , proporcionando un rango dentro del cual es probable que se encuentre .

Pregunta
Según la Teoría Clásica de los Tests una persona que ha obtenido en tres aplicaciones las siguientes puntuaciones: 2, 1, 2, 3, tendría una puntuación en el rasgo de:
Estimación puntual
La estimación puntual de la puntuación verdadera () se realiza a partir de un valor observado (). En este contexto, considero que es un estimador puntual de .
Para estimar , me baso en el 2º supuesto de la TCT, que establece que la media de las puntuaciones observadas () es igual a la media de las puntuaciones verdaderas ():
Posteriormente, utilizo la fórmula de la regresión lineal de Kelly. Según Kelly (1927), la puntuación verdadera estimada () de un individuo se calcula combinando la puntuación observada () y la media general (), ponderadas por el coeficiente de fiabilidad ():
donde:
- : Coeficiente de fiabilidad del test.
- : Puntuación observada del sujeto.
- : Media de las puntuaciones observadas en la población.
El subíndice indica que se trata de una puntuación específica correspondiente al sujeto .
Este método permite ajustar en función de y , minimizando el efecto del error de medida para obtener una estimación más precisa de .
- Si , depende principalmente de .
- Si , se aproxima a .
Estimación por intervalos
La estimación por intervalos proporciona un rango dentro del cual es probable que se encuentre el valor verdadero (), teniendo en cuenta la incertidumbre asociada al error de medida (). Este enfoque es útil porque, debido a los errores de medición, no podemos garantizar que el valor observado () coincida exactamente con .
La fórmula general para el intervalo de confianza () es:
Esto proporciona:
- Límite inferior:
- Límite superior:
donde:
- : Puntuación observada del sujeto.
- : Valor crítico correspondiente al nivel de confianza deseado.
- : Error estándar de medición.
El valor de depende del nivel de confianza (). Por ejemplo:
- : para un nivel de confianza del 95%.
- : para un nivel de confianza del 99%.
El se calcula como:
donde:
- : Desviación estándar de las puntuaciones observadas.
- : Fiabilidad del test.
La fórmula completa para el intervalo es:
Ejemplo: Si , , , y :
Por lo tanto:
- Límite inferior:
- Límite superior:
El intervalo de confianza sería .

Pregunta
Los intervalos obtenidos por dos sujetos al aplicar una prueba han sido los siguientes: A = [3, 6], B = [2, 5]:
Intervalo de confianza y precisión
La amplitud del intervalo de confianza (IC) y la precisión tienen una relación inversa directa. Un intervalo de confianza más amplio refleja menos precisión en la estimación. Esto significa que:
- Cuanto más amplio es el intervalo de confianza, menor es la precisión.
- Cuanto más estrecho es el intervalo de confianza, mayor es la precisión.
La precisión en este caso se refiere a qué tan estrecho es el rango del IC y, por lo tanto, qué tan cerca está el valor estimado de la puntuación verdadera ().
La siguiente imagen muestra los intentos de un arquero por disparar en el centro de la diana:
Baja fiabilidad
Baja precisión
Baja validez
Alta fiabilidad
Baja precisión
Baja validez
Alta fiabilidad
Alta precisión
Baja validez
Alta fiabilidad
Alta precisión
Alta validez
En el primer intento, es evidente que el arquero está fallando. Pero está fallando de dos maneras: tiene baja fiabilidad, porque no dispara siempre al mismo sitio, y además no acierta en el centro de la diana, lo que indica baja validez.
En la segunda, el arquero sí dispara de manera consistente, pero no acierta en el centro de la diana. Es decir: tiene alta fiabilidad, pero baja validez. Sin embargo, los disparos podrían estar más cerca entre sí, por lo que tiene baja precisión.
En el tercero, se reduce la distancia entre los disparos. Es decir, aumenta la precisión, pero sigue sin acertar en el centro de la diana.
Finalmente, en el cuarto cuadro, el arquero dispara de forma consistente, los disparos están muy cerca y además acierta en la diana. Es decir: tiene alta fiabilidad, alta precisión y alta validez.
Relación entre precisión y fiabilidad
Un test puede ser fiable pero no preciso, pero no puede ser preciso sin ser fiable. Esto se debe a que la precisión depende directamente de la fiabilidad del test. Esto se refleja en el cálculo del error estándar de medición (), que incluye la fiabilidad del test ().
- Alta fiabilidad implica un bajo, lo que produce intervalos más estrechos y por tanto mayor precisión.
- Baja fiabilidad implica un alto, lo que produce intervalos más amplios y menor precisión.
A medida que aumenta el nivel de confianza, el intervalo se ensancha, reflejando mayor incertidumbre.