Saltar al contenido principal

Validez de contenido

Se refiere a la representatividad de los ítems del test con respecto al constructo que se pretende medir. Es decir, mide si los ítems cumplen con los objetivos del test.

Evidencias de validez relacionadas

La validez de contenido se relaciona con otras dimensiones de validez:

  • Validez curricular: grado en que los ítems del test son relevantes para estudiar el currículo académico.
  • Validez instruccional: grado en que el test refleja lo que los alumnos han aprendido de los contenidos de clase.
  • Validez aparente: hasta qué punto el test aparenta medir lo que mide. Por ejemplo, si las preguntas son transparentes respecto a lo que está midiendo. Esto es importante para motivar a los sujetos durante la evaluación.

Procedimiento

Para el análisis de evidencia de validez de contenido, es crucial que el dominio esté bien definido y los conceptos bien acotados.

Por ejemplo, la siguiente tabla muestra la distribución porcentual de ítems en una prueba diseñada para evaluar distintos contenidos psicológicos en relación con tres tipos de procesos psicológicos relacionados con la ansiedad:

ContenidosActivaciónPensamientoCompulsión
Cognitivo7%21%6%
Fisiológico25%3%5%
Motor8%9%16%
  • Procesos psicológicos: Activación, Pensamiento y Compulsión, que son los aspectos generales que se quieren medir.
  • Contenidos psicológicos: Cognitivo, Fisiológico y Motor, que representan las áreas específicas de los ítems.

Cada celda indica el porcentaje de ítems que evalúan una combinación específica de contenido y proceso. Por ejemplo:

  • El 7% de los ítems evalúan procesos de activación con contenido cognitivo.
  • El 16% de los ítems evalúan procesos de compulsión con contenido motor.

Para este análisis, es necesario contar con un panel de expertos que evalúe la representatividad de los ítems. Es decir, expertos en el dominio que juzguen si los ítems del test son representativos del constructo que se pretende medir.

El cálculo de las evidencias de validez de contenido se puede hacer de dos maneras:

  • Índice de congruencia ítem-objetivo: un panel de expertos evalúa cada ítem y juzga si refleja cada uno de los objetivos del test. Es procedimiento es complejo y largo, porque implica evaluar cada ítem con respecto a cada objetivo.
  • Emparejamiento: un panel de experto juzga qué objetivo mide cada ítem. Es decir, cada ítem se asocia con un objetivos. Este procedimiento es más sencillo y rápido, pero menos preciso.

Limitaciones

Las limitaciones de esta dimensión de validez es que es posible que el constructo esté infra-representado. Para evitar esto, se debe hacer un esfuerzo al elaborar la matriz de especidicaciones para que no falte ningún aspecto del constructo.

Por otro lado, es posible que haya una varianza en las puntuaciones que no sea debida al constructo. Es decir, que las puntuaciones varíen por factores no relacionados con el constructo. Esto puede ser por dos motivos:

  • Dificultad alta irrelevante: es decir, que los ítems sean dificiles en una medida que no refleja realmente el constructo. Por ejemplo, en un test de matemáticas, una redacción linguísticamente compleja.
  • Dificultad baja irrelevante: es decir, que algunos ítems sean fáciles sin relación con el constructo. Por ejemplo, un ítem cuya pregunta aporta pistas sobre la respuesta sólo a personas que conozcan previamente cierta historia.