Ítems
Opciones de respuesta
Al construir un test, debo decidir qué tipo de respuesta quiero obtener del evaluado. La elección del formato de respuesta depende del constructo que quiero medir y de la información que necesito recopilar.
Como ya he explicado, los test de rendimiento óptimo suelen tener opciones cerradas de respuestas.
Para test de rendimiento óptimo
- Respuesta seleccionada
- Elección binaria: "sí" o "no", "verdadero" o "falso".
- Elección múltiple: el evaluado elige una opción entre varias.
- Emparejamiento: el evaluado debe relacionar elementos de dos columnas.
- Respuesta construida
- Construir una frase: el evaluado debe completar una frase o responder a una pregunta abierta.
- Respuesta corta: el evaluado debe responder a una pregunta con una o dos palabras.
- Respuesta larga (elaborada): el evaluado debe responder a una pregunta con una respuesta más extensa.
Para test de rendimiento típico
- Elección binaria: seleccionar acuerdo o desacuerdo con una afirmación.
- Escala de categorías ordenadas: el evaluado elige una respuesta en una escala graduada. También conocida como escala de Likert.
- Adjetivos bipolares: se presentan pares de adjetivos que representan un continum, de manera que el evaluado elige la posición que mejor responde la pregunta.
A la hora de utilizar escalas de categorías graduadas tipo Likert es aconsejable utilizar 5 categorías. Cinco optiones es un número suficiente para capturar la variabilidad de las respuestas sin ser excesivo, sin complicar la elección del evaluado ni abrumarlo con demasiadas opciones.
Sin embargo, en algunos casos es mejor utilizar una escala con número par, como 4 o 6, para evitar la tendencia a elegir la opción central. En estos casos, no hay una opción neutral, lo que obliga al evaluado a tomar una posición clara. Esto aumenta las diferencias entre los evaluados y facilita la interpretación de los resultados.
Redacción de ítems
La redacción de los ítems es un paso crucial en la construcción de un test. Los ítems deben ser claros, precisos y relevantes para el constructo que quiero medir. Además, deben ser equilibrados y no sesgados, para garantizar que todos los evaluados tengan la misma oportunidad de responder correctamente.
A continuación, presento algunas pautas generales para redactar ítems efectivos.
Para test de rendimiento óptimo
- La idea principal del ítem debe estar clara en el enunciado.
- Utilizar un lenguaje simple y directo en el enunciado.
- Evitar el uso de conocimientos excesivamente triviales o "rebuscados".
- No incluir información irrelevante en el enunciado.
- Evitar dar pistas o indicios que ayuden a deducir la respuesta correcta.
- No hacer preguntas sobre opiniones o percepciones subjetivas.
- Incluir dos distractores y tres alternativas de respuesta en total.
- Mantener la longitud de las alternativas de respuesta similar entre sí.
- Evitar ítems con más de una respuesta correcta.
- No utilizar alternativas del tipo: "todas las respuestas son correctas" o "ninguna respuesta es correcta".
- No encadenar unos ítems con otros; cada ítem debe ser independiente.
- Anticipar la dificultad del test e incluir ítems de todo rango de dificultad.
- La dificultad debe estar en el contenido del ítem, no en la comprensión del enunciado.
- Minimizar el tiempo de lectura del ítem.
- Evitar el uso de negaciones, y si son necesarias, subrayarlas para mayor claridad.
- Corregir errores gramaticales y ortográficos rigurosamente.
- Balancear la posición de la alternativa correcta.
- Seleccionar los distractores basándose en los errores comunes de las personas que no conocen la respuesta.
- El número de ítems debe ser proporcional a la importancia de cada tema evaluado.
- Cuantos más ítems, mejor, siempre que se mantenga la calidad de los ítems.
Para test de rendimiento típico
- El contenido debe relacionarse claramente con el rasgo que se quiere medir.
- Utilizar contenido claro, evitando excesiva generalidad. Las frases deben ser cortas y simples. Utilizar el tiempo presente.
- En escalas de actitudes, no plantear la existencia o no de hechos, sino el posicionamiento personal sobre la afirmación. Los ítems deben discriminar entre actitudes positivas y negativas.
- Evitar dobles negaciones (por ejemplo, "no", "ninguno", "nunca") y el uso de términos universales (por ejemplo, "todo", "siempre", "nada").
- Para minimizar la aquiescencia, redactar ítems tanto de modo directo como inverso.
- Minimizar la deseabilidad social en los ítems.
- Emplear cinco categorías en las respuestas, ya que más categorías no ofrecen mejores resultados y menos dificultan la medición del rasgo.
Cuantificar respuestas
Una vez que tengo los ítems y las respuestas de los evaluados, debo cuantificar esas respuestas para poder analizarlas y compararlas. La cuantificación de las respuestas es un paso fundamental en la construcción de un test, ya que me permite obtener datos numéricos que puedo analizar estadísticamente.
La forma de cuantificar respuestas depende del formato de respuesta que he elegido. A continuación, presento algunas pautas generales para cuantificar respuestas en tests psicométricos.
Para test de rendimiento óptimo
Cuando se tratan de preguntas con respuesta seleccionada, depende de la naturaleza de la pregunta; pero generalmente trato de asignar valores númericos a las respuestas. Por ejemplo:
- Elección binaria: 1 para "sí" o "verdadero" y 0 para "no" o "falso".
- Elección múltiple: asigno un valor numérico a cada respuesta (por ejemplo, 1 para la respuesta correcta y 0 para las incorrectas).
- Emparejamiento: asigno un valor numérico a cada respuesta correcta.
En un test de rendimiento óptimo utilizo el método de puntuación directa, donde asigno un valor numérico a cada respuesta y sumo los valores para obtener la puntuación total. Este método es sencillo y fácil de interpretar, ya que la puntuación final refleja el número de respuestas correctas. Es decir, la puntuación directa es simplemente el número de respuestas correctas.
Si el test ofrece múltiples opciones de respuesta, se puede aplicar una fórmula para corregir por respuestas al azar. Esta fórmula ajusta la puntuación directa teniendo en cuenta la probabilidad de acertar respuestas al azar en ítems con varias opciones:
Donde:
- es el número de respuestas correctas (aciertos).
- es el número de respuestas incorrectas (errores).
- es el número de opciones de respuesta para cada ítem.
Para test de rendimiento típico
En el caso de las escala de categorías ordenadas, hay tres formas de proceder:
- Asigno un valor numérico a cada categoría de la escala (por ejemplo, de 1 a 5; o viceversa de 5 a 1). La alternativa con mayor valor debe indicar el mayor nivel de rasgo.
- Puedo asignar valores negativos o positivos a las categorías, según la dirección de la escala.
Muy desacuerdo | Bastante desacuerdo | Neutral | Bastante de acuerdo | Muy de acuerdo |
---|---|---|---|---|
1 | 2 | 3 | 4 | 5 |
5 | 4 | 3 | 2 | 1 |
2 | 1 | 0 | -1 | -2 |