Saltar al contenido principal

Supuestos para pruebas paramétricas

La palabra supuestos se refiere a condiciones previas necesarias para la aplicación correcta de diversos métodos estadísticos. Por lo tanto, son supuestos de la metodología estadística o supuestos para el análisis estadístico.

Las pruebas estadísticas, como la prueba tt de Student, sólo son válidas dadas unas condiciones. Es decir, para que los resultados sean válidos y confiables, los datos analizados deben cumplir con ciertas condiciones preestablecidas para esa prueba. Estos supuestos son comunes a todas las pruebas paramétricas.

Los supuestos para realizar una prueba paramétrica, como la prueba tt de Student, son:

  • Normalidad: los datos deben distribuirse normalmente. Esto significa que se asume que los datos están distribuidos de acuerdo con una distribución normal, también conocida como distribución gaussiana. Este supuesto es especialmente crucial cuando el tamaño de la muestra es pequeño.
  • Igualdad de varianzas (homocedasticidad): se refiere a la suposición de que las varianzas (si2s_i^2) en los grupos que se comparan son iguales. Es decir, que la dispersión en los grupos debe ser similar. Si las varianzas son significativamente diferentes (heterocedasticidad), entonces las pruebas estadísticas pueden dar resultados inexactos.
  • Independencia: las observaciones deben ser independientes entre sí. Es decir: que el valor de una observación no está influenciado por los valores de otras observaciones. Esto a menudo se logra a través de la asignación aleatoria en grupos. Además, la independencia sólo se logra si cada variable se ha medido sólo una vez en un mismo sujeto.
  • Continuidad de la variable dependiente: la variable dependiente debe ser continua. Es decir, la variable dependiente debe representar un continum constante, de manera que puede tomar cualquier valor numérico, incluyendo decimales. No importa si es de intervalo (como la temperatura) o de razón (como el tiempo o la altura), siempre que sea continua.

Pregunta

Para averiguar si mi perro prefiere su pienso de salmón o pollo, le he metido una mezcla de ambos en su cuenco. ¿Cumple este diseño experimental con el supuesto de independencia de las variables?

Comprobación del supuesto de normalidad

La normalidad es uno de los supuesto para tests paramétricos. Para comprobar que el supuesto de normalidad se cumple, puedo seguir tres estrategias:

  • Estimación visual
  • Puntuación Z de asimetría y curtosis
  • Pruebas estadísticas
Hay que utilizar varias simultáneamente

Todas las estrategias tienen sus limitaciones. Por eso, es necesario combinar varias estrategias para determinar que la distribución de los datos es normal.

Comprobación mediante estimación visual

Para comprobar si los datos de una variable siguen una distribución normal, evalúo de forma visual si la distribución tiene forma de campana de gauss.

Consiste en evaluar de forma visual y subjetiva la normalidad de los datos. Para ello, se puede utilizar gráficos como, por ejemplo:

  • Histograma: Un gráfico que muestra la distribución de frecuencias puede dar una indicación visual de si los datos se distribuyen normalmente.
  • Diagrama de caja (Boxplot): Puede ayudar a identificar simetría y la presencia de valores atípicos que podrían afectar la normalidad.

Comprobación mediante puntuación Z de asimetría y curtosis

Para comprobar si los datos de una variable siguen una distribución normal, mido la asimetría y la curtosis de la distribución.

Consiste en calcular los descriptivos de asimetría y de curtosis para comprobar que la simetría es simétrica y que la curtosis es mesocurtica. Para ello, hay que estandarizar los valores utilizando la puntuación Z, que permite determinar cuántas desviaciones estándar se encuentran del valor teórico en una distribución normal. Esto se hace a través de las Puntuaciones Z.

  • Zasimetrıˊa=Asimetrıˊa÷Error EstaˊndarasimetrıˊaZ_{\text{asimetría}} = \text{Asimetría}\div \text{Error Estándar}_{\text{asimetría}}
  • Zcurtosis=Curtosis÷Error EstaˊndarcurtosisZ_{\text{curtosis}} = \text{Curtosis}\div \text{Error Estándar}_{\text{curtosis}}

Comprobación mediante pruebas estadísticas

Para comprobar si los datos de una variable siguen una distribución normal puedo utilizar pruebas estadísticas creadas precisamente para este fin. Para ello, hay que considerar que la normalidad de la variable es la hipótesis nula (H0H_0), y aplicar las siguientes pruebas:

  • Prueba de Shapiro-Wilk (S-W): es una prueba altamente efectiva para muestras pequeñas y es comúnmente utilizada para evaluar la normalidad de los datos.
  • Prueba de Kolmogorov-Smirnov (K-S) con corrección Lilliefors: esta versión de la prueba de Kolmogorov-Smirnov incluye una corrección para el tamaño de la muestra, lo que la hace más adecuada para evaluar la normalidad en muestras de diversos tamaños.

Ambas pruebas de normalidad generan un valor de significancia pp que se puede comparar con el nivel de confianza (generalmente: α=0.05\alpha = 0.05) para realizar un contraste de hipótesis.

  • Si el valor pp es menor que el nivel de significancia (usualmente establecido en 0.05), se rechaza la hipótesis nula y se concluye que los datos no son normales.
  • Si el valor pp es mayor que el nivel de significancia, no hay suficiente evidencia para rechazar la hipótesis nula, por lo que se puede concluir que los datos sí son normales.

Es decir: si el valor p es mayor que 0.05, no hay suficiente evidencia para rechazar la hipótesis nula, por lo que concluimos que los datos son normales.

Comprobación del supuesto de varianzas iguales

El supuesto de varianzas iguales, técnicamente llamado homocedasticidad o homogeneidad de varianzas, se puede comprobar siguiendo varias estrategias.

Homocedasticidad

La palabra "homocedasticidad", que se usa más comúnmente en inglés como "homoscedasticity" (o "homoskedasticity"), proviene de la combinación de raíces griegas:

  • Homo: que significa "igual" o "mismo".
  • Scedastic: derivado de la palabra griega "σκεδαστικός" (skedastikos), que significa "dispersar".

Por lo tanto, etimológicamente, "homocedasticidad" se refiere a la propiedad de tener "igual dispersión".

Las posibles estrategias para comprobar si las varianzas (si2s_i^2) son iguales son:

  • Estimación visual
  • Pruebas estadísticas, concretamente la prueba de Levene.

Pregunta

Si dos grupos siguen una distribución normal, puedo afirmar que se cumple el supuesto de homocedasticidad.

Comprobación mediante estimación visual

Para comprobar si dos variables tienen una varianzas similares, puedo evaluar de forma visual si la distribución de los valores es similar. Consiste en evaluar de forma visual y subjetiva la similitud entre la varianza de los datos. Para ello, se puede utilizar gráficos como, por ejemplo:

Como se puede ver, los datos están mucho más dispersos en el grupo B. Por lo tanto, en ese caso puedo estimar visualmente que no se cumple el supuesto de homocedasticidad.

Comprobación mediante pruebas estadísticas (Prueba de Levene)

La prueba de Levene es una prueba estadística utilizada para evaluar la homogeneidad de las varianzas, también conocida como homocedasticidad, entre dos o más grupos.

La prueba de Levene evalúa la igualdad de las varianzas basándose en la idea de que si las varianzas son iguales entre los grupos, entonces las medias de las desviaciones absolutas respecto a la media o la mediana de cada grupo también deberían ser iguales. Esto permite una evaluación robusta frente a desviaciones de la normalidad, especialmente si se opta por centrar en la mediana en lugar de la media.

En la prueba de Levene, la homocedasticidad de las variables es la hipótesis nula (H0H_0), que se puede generalizar para múltiples grupos de la siguiente manera:

  • H0:Varianza Grupo A=Varianza Grupo BH_0: \text{Varianza}_{\text{ Grupo A}} = \text{Varianza}_{\text{ Grupo B}}
  • H1:Varianza Grupo AVarianza Grupo BH_1: \text{Varianza}_{\text{ Grupo A}} \neq \text{Varianza}_{\text{ Grupo B}}

La prueba de Levene genera un valor pp, que está asociado a un estadístico FF. La interpretación del resultado es:

  • Si el valor p<0.05p < 0.05, rechazamos la hipótesis nula y concluimos que no hay homocedasticidad.
  • Si el valor p>0.05p > 0.05, no hay suficiente evidencia para rechazar la hipótesis nula, por lo que se puede concluir que hay homocedasticidad.
En comparaciones con múltiples grupos

La hipótesis nula de la prueba de Levene afirma que todas las varianzas (si2s_i^2) son iguales entre los grupos, no solo entre dos grupos específicos. En el caso de comparaciones que involucran múltiples grupos, se debe generalizar la hipótesis:

  • H0:s12=s22==sk2H_0: s_1^2 = s_2^2 = \dots = s_k^2
  • H1:Al menos una si2 es diferenteH_1: \text{Al menos una } s_i^2 \text{ es diferente}

Donde si2s_i^2 representa la varianza del i-ésimo grupo y kk es el número de grupos comparados.

Por lo tanto, un resultado significativo (donde p<0.05p < 0.05) indica que al menos una de las varianzas de grupo difiere de las otras, proporcionando evidencia contra la hipótesis nula y sugiriendo que las varianzas no son homogéneas; es decir, que la homocedasticidad no se cumple.