Saltar al contenido principal

Validez

Conceptualización

La forma de medir las evidencias de validez ha cambiado a lo largo del tiempo. Además, hay distintas dimensiones de validez. Sin embargo, es un concepto unitario. Es decir, todos los tipos de validez se refieren a la misma cosa: la capacidad de un test para medir lo que pretende medir.

La validez es la propiedad psicométrica más importante en psicometría. Si las puntuaciones de un test no tienen evidencias de validez, no importa cuán fiable sean. Además, si las puntuaciones de un test tienen validez, también tendrán fiabilidad; pero pueden tener fiabilidad sin tener validez.

De acuerdo al Standards for Educational and Psychological Testing (1999), la validez se define como:

Grado en que la teoría y los datos apoyan la interpretación de las puntuaciones de un test para un uso concreto

Como se puede ver, la validez no es una propiedad de un test, sino de las puntuaciones de un test. Es decir: lo que es más o menos válido no es el test, sino a la interpretación de sus puntuaciones.

La validez es un proceso acumulativo de evidencias para las puntuaciones de un test.

Por otro lado, la validez es específica del contexto y de la muestra con la que se haya validado el test. Por ejemplo, un test validado sólo en una muestra de estudiantes universitarios no se puede considerar válido para una población geriátrica. Por tanto, la validez es específica de la muestra y del contexto.

Relación con la fiabilidad

La siguiente imagen muestra los intentos de un arquero por disparar en el centro de la diana:

Baja fiabilidad

Baja precisión

Baja validez

Alta fiabilidad

Baja precisión

Baja validez

Alta fiabilidad

Alta precisión

Baja validez

Alta fiabilidad

Alta precisión

Alta validez

En el primer intento, es evidente que el arquero está fallando. Pero está fallando de dos maneras: tiene baja fiabilidad, porque no dispara siempre al mismo sitio, y además no acierta en el centro de la diana, lo que indica baja validez.

En la segunda, el arquero sí dispara de manera consistente, pero no acierta en el centro de la diana. Es decir: tiene alta fiabilidad, pero baja validez. Sin embargo, los disparos podrían estar más cerca entre sí, por lo que tiene baja precisión.

En el tercero, se reduce la distancia entre los disparos. Es decir, aumenta la precisión, pero sigue sin acertar en el centro de la diana.

Finalmente, en el cuarto cuadro, el arquero dispara de forma consistente, los disparos están muy cerca y además acierta en la diana. Es decir: tiene alta fiabilidad, alta precisión y alta validez.

Proceso de validez

La validez se puede entender como un proceso.

  1. Primero, tengo que definir una matriz de especificaciones, que es una lista de las cosas que quiero medir. La matriz de especificaciones recoge los componentes del constructo. Es, por tanto, una red nomológica que indica las relaciones con otros constructos.
  2. Después, debo generar hipótesis rivales para refutar la hipótesis de que el test mide el constructo. Estas hipótesis suelen ser dos:
    1. que el constructo está infra-representado; es decir, que el test no recoge todos los aspectos del constructo
    2. que la varianza del constructo está contaminada por otros factores, es decir: que las puntuaciones varían por factores no relacionados con el constructo.
  3. Por último, debo hacer una revisión continua de la validez del test. La validez no es algo que se establece una vez y ya está. La validez es un proceso acumulativo de evidencias.

Dimensiones de validez

La validez es un concepto unitario. Es decir, todos los tipos de validez se refieren a la misma cosa: la capacidad de un test para medir lo que pretende medir. Sin embargo, hay distintas dimensiones de validez.

  • Validez de constructo: se refiere a la capacidad de un test para medir un constructo teórico. La validez de constructo es la más importante de todas las dimensiones de validez. De hecho, esta dimensión de validez incluye todas las demás.
  • Validez de contenido: se refiere a la representatividad de los ítems del test con respecto al constructo que se pretende medir. Es decir, mide si los ítems cumplen con los objetivos del test.
  • Validez externa: se refiere a la capacidad de las puntuaciones de un test para asociarse con otras pruebas que miden el mismo constructo. Estas pruebas pueden ser test psicométricos o cualquier otra medida de resultados (pruebas fisiológicas, historial académico, etc.). La validez externa puede ser de dos tipos:
    • Validez de convergencia: se refiere a la capacidad de un test para coincidir con otros test que miden el mismo constructo.
    • Validez de discriminación: se refiere a la capacidad de un test para diferenciarse de otros test que miden constructos distintos.
    • Validez referida a un criterio: se refiere a la capacidad de un test para predecir un criterio externo. Dicho de otra manera, mide hasta qué punto las puntuaciones de un test se relacionan con conductas reales. Se puede dividir en:
      • Validez predictiva: se refiere a la capacidad de un test para predecir un criterio futuro.
      • Validez concurrente: se refiere a la capacidad de un test para predecir un criterio presente.
      • Validez retrospectiva: se refiere a la capacidad de un test para predecir un criterio pasado.
  • Validez interna: se refiere a la consistencia interna de un test. Es decir, mide hasta qué punto los ítems de un test miden el mismo constructo. Esta métrica coincide con la fiabilidad.
  • Validez consecuencial: se refiere a las consecuencias de un test. Es decir, mide hasta qué punto las puntuaciones de un test tienen consecuencias negativas o positivas para los evaluados.
  • Generalización: se refiere a la capacidad de un test para generalizarse a otras poblaciones, contextos o momentos. Es decir, mide hasta qué punto las puntuaciones de un test son válidas en otros contextos.