Saltar al contenido principal

Estimación de puntuación verdadera

Conceptualización

La puntuación verdadera (VV) es el valor real o ideal del constructo. A diferencia de la puntuación observada (XX), la puntuación verdadera no se puede medir, sino que se debe estimar.

Por eso, la estimación de la puntuación verdadera es un procedimiento que permite obtener una aproximación de VV a partir de la puntuación observada en un test.

Como explico en los supuestos de la TCT, la puntuación verdadera (VV) de un individuo en un test se puede estimar a partir de su puntuación observada (XX). La relación fundamental que expresa este modelo es:

Xi=Vi+EiX_i = V_i + E_i

donde:

  • XiX_i: Puntuación observada del individuo ii.
  • ViV_i: Puntuación verdadera, que representa el valor real o ideal de la habilidad o característica que el test pretende medir.
  • EiE_i: Error de medida, que incluye cualquier fuente de variabilidad que no esté relacionada con la puntuación verdadera.

Existen dos métodos principales para estimar la puntuación verdadera:

  • Estimación puntual: obtengo un valor específico de VV a partir de XX sin considerar un rango de posibles valores. Este método es útil para reflejar la incertidumbre asociada al error de medida (EE).
  • Estimación por intervalos: construyo un intervalo de confianza alrededor de XX, proporcionando un rango dentro del cual es probable que se encuentre VV.

Pregunta

Según la Teoría Clásica de los Tests una persona que ha obtenido en tres aplicaciones las siguientes puntuaciones: 2, 1, 2, 3, tendría una puntuación en el rasgo de:

Estimación puntual

La estimación puntual de la puntuación verdadera (VV) se realiza a partir de un valor observado (XX). En este contexto, considero que XX es un estimador puntual de VV.

Para estimar VV, me baso en el 2º supuesto de la TCT, que establece que la media de las puntuaciones observadas (μxi\mu_{x_i}) es igual a la media de las puntuaciones verdaderas (μvi\mu_{v_i}):

μxi=μvi\mu_{x_i} = \mu_{v_i}

Posteriormente, utilizo la fórmula de la regresión lineal de Kelly. Según Kelly (1927), la puntuación verdadera estimada (VsV^{\prime}_s) de un individuo se calcula combinando la puntuación observada (XsX_s) y la media general (μx\mu_x), ponderadas por el coeficiente de fiabilidad (ρXX\rho_{XX^{\prime}}):

Vs=ρXXXs+(1ρXX)μxV^{\prime}_s = \rho_{XX^{\prime}} \cdot X_s + (1 - \rho_{XX^{\prime}}) \cdot \mu_x

donde:

  • ρXX\rho_{XX^{\prime}}: Coeficiente de fiabilidad del test.
  • XsX_s: Puntuación observada del sujeto.
  • μx\mu_x: Media de las puntuaciones observadas en la población.
Subíndice ss

El subíndice ss indica que se trata de una puntuación específica correspondiente al sujeto ss.

Este método permite ajustar XsX_s en función de ρXX\rho_{XX^{\prime}} y μx\mu_x, minimizando el efecto del error de medida para obtener una estimación más precisa de VsV_s.

  • Si ρXX1\rho_{XX^{\prime}} \to 1, Vs\quad V^{\prime}_s depende principalmente de XsX_s.
  • Si ρXX0\rho_{XX^{\prime}} \to 0, Vs\quad V^{\prime}_s se aproxima a μx\mu_x.

Estimación por intervalos

La estimación por intervalos proporciona un rango dentro del cual es probable que se encuentre el valor verdadero (VV), teniendo en cuenta la incertidumbre asociada al error de medida (EE). Este enfoque es útil porque, debido a los errores de medición, no podemos garantizar que el valor observado (XX) coincida exactamente con VV.

La fórmula general para el intervalo de confianza (ICIC) es:

ICV=X±Zα/2EEM\text{IC}_{V} = X \pm |Z_{\alpha/2}| \cdot EEM

Distribución normal de un
estadístico

Esto proporciona:

  • Límite inferior: XZα/2EEMX - |Z_{\alpha/2}| \cdot EEM
  • Límite superior: X+Zα/2EEMX + |Z_{\alpha/2}| \cdot EEM

donde:

  • XX: Puntuación observada del sujeto.
  • Zα/2Z_{\alpha/2}: Valor crítico correspondiente al nivel de confianza deseado.
  • EEMEEM: Error estándar de medición.

El valor de Zα/2Z_{\alpha/2} depende del nivel de confianza (α\alpha). Por ejemplo:

  • Zα/2=1.96Z_{\alpha/2} = 1.96: para un nivel de confianza del 95%.
  • Zα/2=2.58Z_{\alpha/2} = 2.58: para un nivel de confianza del 99%.

El EEMEEM se calcula como:

EEM=sX1ρXXEEM = s_X \cdot \sqrt{1 - \rho_{XX^{\prime}}}

donde:

  • sXs_X: Desviación estándar de las puntuaciones observadas.
  • ρXX\rho_{XX^{\prime}}: Fiabilidad del test.

La fórmula completa para el intervalo es:

ICV=X±Zα/2sX1ρXX\text{IC}_{V} = X \pm |Z_{\alpha/2}| \cdot s_X \cdot \sqrt{1 - \rho_{XX^{\prime}}}

Ejemplo: Si X=80X = 80, Zα/2=1.96Z_{\alpha/2} = 1.96, sX=5s_X = 5, y ρXX=0.8\rho_{XX^{\prime}} = 0.8:

ICV=80±1.96510.8\text{IC}_V = 80 \pm 1.96 \cdot 5 \cdot \sqrt{1 - 0.8} ICV=80±1.9650.2\text{IC}_V = 80 \pm 1.96 \cdot 5 \cdot \sqrt{0.2} ICV=80±1.962.236\text{IC}_V = 80 \pm 1.96 \cdot 2.236 ICV=80±4.38\text{IC}_V = 80 \pm 4.38

Por lo tanto:

  • Límite inferior: 804.38=75.6280 - 4.38 = 75.62
  • Límite superior: 80+4.38=84.3880 + 4.38 = 84.38

El intervalo de confianza sería [75.62,84.38][75.62, 84.38].

Pregunta

Los intervalos obtenidos por dos sujetos al aplicar una prueba han sido los siguientes: A = [3, 6], B = [2, 5]:

Intervalo de confianza y precisión

La amplitud del intervalo de confianza (IC) y la precisión tienen una relación inversa directa. Un intervalo de confianza más amplio refleja menos precisión en la estimación. Esto significa que:

  • Cuanto más amplio es el intervalo de confianza, menor es la precisión.
  • Cuanto más estrecho es el intervalo de confianza, mayor es la precisión.

La precisión en este caso se refiere a qué tan estrecho es el rango del IC y, por lo tanto, qué tan cerca está el valor estimado de la puntuación verdadera (VV).

La siguiente imagen muestra los intentos de un arquero por disparar en el centro de la diana:

Baja fiabilidad

Baja precisión

Baja validez

Alta fiabilidad

Baja precisión

Baja validez

Alta fiabilidad

Alta precisión

Baja validez

Alta fiabilidad

Alta precisión

Alta validez

En el primer intento, es evidente que el arquero está fallando. Pero está fallando de dos maneras: tiene baja fiabilidad, porque no dispara siempre al mismo sitio, y además no acierta en el centro de la diana, lo que indica baja validez.

En la segunda, el arquero sí dispara de manera consistente, pero no acierta en el centro de la diana. Es decir: tiene alta fiabilidad, pero baja validez. Sin embargo, los disparos podrían estar más cerca entre sí, por lo que tiene baja precisión.

En el tercero, se reduce la distancia entre los disparos. Es decir, aumenta la precisión, pero sigue sin acertar en el centro de la diana.

Finalmente, en el cuarto cuadro, el arquero dispara de forma consistente, los disparos están muy cerca y además acierta en la diana. Es decir: tiene alta fiabilidad, alta precisión y alta validez.

Relación entre precisión y fiabilidad

Un test puede ser fiable pero no preciso, pero no puede ser preciso sin ser fiable. Esto se debe a que la precisión depende directamente de la fiabilidad del test. Esto se refleja en el cálculo del error estándar de medición (EEMEEM), que incluye la fiabilidad del test (ρXX\rho_{XX^{\prime}}).

  • Alta fiabilidad implica un EEMEEM bajo, lo que produce intervalos más estrechos y por tanto mayor precisión.
  • Baja fiabilidad implica un EEMEEM alto, lo que produce intervalos más amplios y menor precisión.

A medida que aumenta el nivel de confianza, el intervalo se ensancha, reflejando mayor incertidumbre.