Saltar al contenido principal

Contraste de hipótesis

El contraste de hipótesis es un método de toma de decisiones que nos permite decidir si una proposición estadística acerca de una población se mantiene o se rechaza, según los datos empíricos.

Las hipótesis (HH) hacen referencia a valores poblacionales. Las hipótesis se pueden expresar de forma científica y de forma estadística. Las hipótesis científicas proporcionan la base de la investigación y describen la realidad. A partir de ellas, generamos las hipótesis estadísticas, que se refieren a la distribución de la probabilidad y se expresan en términos matemáticos.

Por ejemplo:

Hipótesis científicaHipótesis estadística
Los varones y las mujeres
no difieren en asiedad
μv=μm\mu_v = \mu_m
Mdnv=MdnmMdn_v = Mdn_m
σv=σm\sigma_v = \sigma_m

Hipótesis nula vs. hipótesis alternativa

En investigación científica, tratamos de refutar la hipótesis nula (H0H_0). Si verificamos que la hipótesis nula (H0H_0) no es cierta, entonces tiene que ser lo opuesto: la hipótesis alternativa (H1H_1).

Es decir: la hipótesis nula es aquella que expresa que no hay un efecto, que no hay una correlación; que un fenómeno no se produce. Esa hipótesis se somete a contraste en la investigación. Si la hipótesis nula es refutada, entonces consideramos que la hipótesis alternativa es cierta.

Al analizar la estimación de un parámetro a partir del estadístico de la muestra, vimos el concepto de Intervalo de Confianza (IC), que es el rango calculado a partir de los datos de la muestra que se espera que contenga el parámetro poblacional. Si el valor teórico de la hipótesis nula (H0H_0) está dentro del intervalo de confianza, puedo concluir que la hipótesis nula (H0H_0) es cierta. Es decir: que el contraste no es estadísticamente significativo, que el valor teórico y el poblacional son iguales o que no hay efecto o diferencias.

Por el contrario, si el intervalo de confianza no contiene el valor teórico de la hipótesis nula (H0H_0); es decir, si el valor cae en la zona de rechazo, se rechaza la hipótesis nula, lo que significa que el contraste es estadísticamente significativo, que el valor teórico y poblacional son diferentes y que sí hay un efecto o diferencias.

Al enunciar la hipótesis, en términos de probabilidad, la hipótesis nula y la alternativa son complementarias. Es decir son mutuamente excluyentes y exhaustivas. Esto es lógico, porque la hipótesis alternativa es todo lo que no sea la hipótesis nula.

Hipótesis nula (H0H_0)Hipótesis alternativa (H1H_1)
μvμm\mu_v \le \mu_mμv>μm\mu_v > \mu_m
σvσm\sigma_v \ge \sigma_mσv<σm\sigma_v < \sigma_m
ϕ=0.5\phi = 0.5ϕ0.5\phi \neq 0.5
H0H_0 valores exactos

La hipótesis nula (H0H_0) se expresa de forma estadística con exactitud. Es decir, diciendo que algo es igual a (==), menor que (<\lt) o mayor que (>\gt). Por el contrario, la hipótesis alternativa (H1H_1) se epresa con valores inexactos. Es decir, diciendo que algo es no-igual a (\neq), menor que (\le) o mayor que (\ge).

Haciendolo de esta manera, es siempre cierto que son mutuamente excluyentes y exhaustivas.

Tipos de contraste

Puedo someter la hipótesis a distintos tipos de contraste:

  • Bilateral: no se si el valor teórico será mayor o menor que la media poblacional, por lo que la hipótesis nula sencillamente dice que será igual, por ejemplo μ=0.5\mu = 0.5
  • Unilateral derecho: si asumimos que el valor teórico será superior al valor poblacional, por lo que la hipótesis nula dice que el valor será igual o mayor, por ejemplo μ0.5\mu \ge 0.5
  • Unilateral izquierdo: si asumimos que el valor teórico será menor al valor poblacional, por lo que la hipótesis nula dice que el valor será igual o menor, por ejemplo μ0.5\mu \le 0.5

Pregunta

Asumiendo un alfa = 0.01, puedo llegar a la conclusión de que la zona de rechazo es mayor en un contraste bilateral que en el unilateral derecho

Métodos de contraste de hipótesis

Imagina una investigación en el campo de la psicología que busca estudiar el efecto de tres programas de entrenamiento para mejorar la memoria, que llaman entrenamiento verde, entrenamiento amarillo y entrenamiento azul. Los investigadores han determinado que para la población general, la puntuación media μ\mu es de 200 y la desviación estándar σ\sigma es 100.

Para medir si los programas de entrenamiento han mejorado la memoria, después de implementar los programas de entrenamiento, quieren saber si la puntuación media de los participantes que han completado el programa es significativamente mayor que la puntuación media poblacional, generando éstos resultados:

  • Xˉ=110\bar{X} = 110
  • Xˉ=260\bar{X} = 260
  • Xˉ=320\bar{X} = 320

La hipótesis nula que quiero contrastar es que la media muestral no es significativamente mayor de la media poblacional conocida (μ\mu). Es decir, los investigadotres plantean las siguientes hipótesis:

  • H0:μ=200H_0: \mu = 200 (El programa no tiene efecto en la memoria de trabajo.)
  • H1:μ>200H_1: \mu > 200 (El programa mejora la memoria de trabajo.

Hay dos formas de contrastar la hipótesis: mediante intervalos de confianza, y mediante pruebas de significancia.

Por ejemplo, en la investigación del entrenamiento azul, en el que la media muestral es Xˉ=320\bar{X} = 320, para saber si la puntuación es signicativamente distinta de la población general μ=200\mu = 200, podríamos seguir ambos métodos:

Mediante intervalos de confianzaMediante pruebas de significación
El intervalo de confianza se indica con la caja azul, que se calcula añadiendo un margen de error al valor muestral Xˉ=320\bar{X} = 320 que estamos analizando.La zona de aceptación (caja azul) se calcula utilizando el error estándar del valor poblacional. Las áreas rojas representan las zonas de rechazo para un nivel de significancia (α=0.05\alpha = 0.05).
Como vemos, la media poblacional cae fuera del intervalo de confianza de la muestra. Por eso, podríamos rechazar la hipótesis nula. Es decir, la diferencia entre Xˉ\bar{X} y σ\sigma es significativa.El estadístico cae fuera de la zona de aceptación. Por lo que hay una diferencia significativa y la hipótesis nula se rechaza. No sucede lo mismo para los valores verde y amarillo.

Como vemos, la principal diferencia entre ambos métodos es cómo se calcula el intervalo de confianza:

  • En el método de contraste mediante intervalos de confianza, el IC se calcula a partir del valor muestral, añadiendo un margen de error.
  • En el método de contraste mediante pruebas de significancia, la zona de aceptación se calcula a partir del valor poblacional, en base al error estándar.

Contraste mediante intervalos de confianza

Este método está explicado en el apartado estadística inferencial.

Los ejercicios de contraste de hipótesis son distintos de los de cálculo de intervalo de confianza, aunque el procedimiento sea similar. En los ejercicios de cálculo de hipótesis, el enunciado nos pedita contrastar un valor. Además, los ejercicios de contraste de hipótesis proporcionarán el valor poblacional.

Ejercicio práctico

Contrasta la media muestral de 25 que ha sido obtenida en una muestra de 100 sujetos con una varianza muestral de 16, que pertenece a una población con una media de 26, con α=0.01\alpha=0.01

En este ejercicio, estamos interesados en contrastar la media muestral obtenida con la media poblacional cuando la varianza poblacional es desconocida.

Datos del problema:
  • Media muestral (xˉ\bar{x}): 25
  • Media poblacional hipotética (μ0\mu_0): 26
  • Tamaño de la muestra (nn): 100
  • Varianza muestral (s2s^2): 16
  • Nivel de significancia (α\alpha): 0.01

El primer paso es aclarar cuál es la hipótesis:

  • H0:μ=26H_0: \mu = 26
  • H1:μ26H_1: \mu \neq 26

Para realizar el contraste de la hipótesis, calculo los límites del intervalo de confianza. Como expliqué en el apartado de estadística inferencial, cuando no se la varianza poblacional, tenemos que usar la fórmula de la distribución TT de Student. De lo contrario, usaríamos la puntuación-ZZ

Para el límite inferior (LiL_i):

Li=xˉtα/2,n1×snL_i = \bar{x} - t_{\alpha/2, n-1} \times \frac{s}{\sqrt{n}}

Para el límite superior (LsL_s):

Ls=xˉ+tα/2,n1×snL_s = \bar{x} + t_{\alpha/2, n-1} \times \frac{s}{\sqrt{n}}

Sustituyendo los valores conocidos y el valor crítico t0.01/2,1001t_{0.01/2, 100-1} obtenido de la tabla de distribución T de Student para 99 grados de libertad y α/2=0.005\alpha/2 = 0.005, que es aproximadamente 2.626:

Li=252.626×16100=252.626×410=252.626×0.4=251.05=23.95L_i = 25 - 2.626 \times \frac{\sqrt{16}}{\sqrt{100}} = 25 - 2.626 \times \frac{4}{10} = 25 - 2.626 \times 0.4 = 25 - 1.05 = 23.95 Ls=25+2.626×410=25+1.05=26.05L_s = 25 + 2.626 \times \frac{4}{10} = 25 + 1.05 = 26.05

El intervalo de confianza de 99% para la media muestral va de 23.95 a 26.05. Siendo así, se que la media poblacional hipotética (μ0=26\mu_0 = 26) cae dentro de este intervalo. Por eso, no hay suficiente evidencia para rechazar la hipótesis nula (H0H_0). Por lo tanto, mantenemos H0H_0 y concluimos que no hay evidencia suficiente para afirmar que la media poblacional difiere de 26.

Contraste mediante pruebas de significación

Este método no consiste en crear un intervalo de confianza a partir del parámetro de la población, sino en utilizar el intervalo de confianza para estimar el parámetro de la población a partir de una muestra. Si el valor del parámetro poblacional bajo la hipótesis nula cae fuera del intervalo de confianza, entonces se rechaza la hipótesis nula.

Cómo hacer el contraste mediante pruebas de significación

Los pasos para realizar un contraste de hipótesis son:

  1. Calcular el valor del estadístico de contraste (ZZ o TT de Student).
  2. Determinar los valores críticos que delimitan la zona de aceptación o rechazo de la hipótesis.
  3. Comparar el valor del estadístico de contraste con los valores críticos.

Explico cada paso a continuación.

1. Calcular el valor del estadístico de contraste (ZZ o tt)

El estadístico de contraste es un valor calculado a partir de los datos de la muestra.

El valor del estadístico de contraste dependerá de si conocemos, o no, la varianza poblacional (σ\sigma).

Fórmula del estadístico de contraste con puntuación ZZ
Z=Xˉμσn=XˉμEEZ = \frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}} = \frac{\bar{X} - \mu}{EE}

donde:

  • Xˉ\bar{X} es la media de la muestra,
  • μ\mu es la media poblacional bajo la hipótesis nula,
  • σ\sigma es la desviación estándar poblacional conocida,
  • nn es el tamaño de la muestra.
  • EEEE es el error estándar, cuya fórmula es precisamente σn\frac{\sigma}{\sqrt{n}}
Fórmula del estadístico de contraste con TT de Student
T=XˉμSnnT = \frac{\bar{X} - \mu}{\frac{S_{n}}{\sqrt{n}}}

donde:

  • Xˉ\bar{X} es la media de la muestra,
  • μ\mu es la media poblacional (bajo la hipótesis nula),
  • SnS_{n} es la desviación estándar de la muestra, y
  • nn es el tamaño de la muestra.
2. Determinar los valores críticos

Los valores críticos se obtienen de la distribución de probabilidad del estadístico bajo la hipótesis nula y del nivel de significancia α\alpha elegido. Estos valores delimitan la zona de aceptación o rechazo de la hipótesis nula.

Es decir, utilizando el valor de α\alpha, calculo los límites de la zona de aceptación. A estos límites, los llamamos valores críticos.

Recuerda que el contraste de hipótesis puede ser bilateral o unilateral, en función de si quiero contrastar que el valor es mayor, menor o ambos. Por ejemplo, si quiero contrastar la hipótesis nula μ=0.5\mu = 0.5, necesito un contraste bilateral, porque el valor puede estar por encima o por dejabo. Sin embargo, si la hipótesis nula es μ0.5\mu \ge 0.5, sólo necesito saber si el valor está por debajo; es decir: será un contraste unilateral.

3. Comparar el valor del estadístico de contraste con los valores críticos

Con el valor del estadístico de contraste y los valores críticos, puedo determinar si rechazamos o no la hipótesis nula. Es decir, ahora que tenemos el valor Z o el valor T de Student, y tenemos los valores críticos, realizamos las comprobaciones:

  • Con puntuación ZZ:
    • Para pruebas de dos colas con H1:μμ0H_1: \mu \neq \mu_0, rechazamos la hipótesis nula si ZZα/2Z \leq -Z_{\alpha/2} o ZZα/2Z \geq Z_{\alpha/2}.
    • Para pruebas de una cola con H1:μ>μ0H_1: \mu > \mu_0, rechazamos la hipótesis nula si ZZαZ \geq Z_{\alpha}.
    • Para pruebas de una cola con H1:μ<μ0H_1: \mu < \mu_0, rechazamos la hipótesis nula si ZZαZ \leq -Z_{\alpha}.
  • Con TT de Student:
    • Para pruebas de dos colas con H1:μμ0H_1: \mu \neq \mu_0, rechazamos la hipótesis nula si TT es menor que tα/2,n1t_{\alpha/2, n-1} o mayor que t1α/2,n1t_{1-\alpha/2, n-1}.
    • Para pruebas de una cola con H1:μ>μ0H_1: \mu > \mu_0, rechazamos la hipótesis nula si TT es mayor que t1α,n1t_{1-\alpha, n-1}.
    • Para pruebas de una cola con H1:μ<μ0H_1: \mu < \mu_0, rechazamos la hipótesis nula si TT es menor que tα,n1t_{\alpha, n-1}.

Si el valor del estadístico de contraste cae dentro de la zona de aceptación, entonces no rechazamos la hipótesis nula. Si cae en la zona de rechazo, entonces hay evidencia suficiente para rechazar la hipótesis nula en favor de la alternativa.

Ejercicio práctico con puntuación Z

Contrasta si la media poblacional toma un valor de 25 con una varianza poblacional de 16 para una muestra de 100 sujetos que tiene una media de 24. Asumiendo un α=0.05\alpha=0.05

En este ejercicio, se propone contrastar la hipótesis nula de que la media poblacional μ\mu es igual a 25 frente a la hipótesis alternativa de que la media poblacional es diferente de 25, con una muestra de 100 sujetos y una varianza poblacional de 16. La media muestral obtenida es 24 y se utiliza un nivel de significancia α=0.05\alpha = 0.05.

La hipótesis nula y la hipótesis alternativa se establecen como:

  • H0:μ=25H_0: \mu = 25
  • H1:μ25H_1: \mu \neq 25

Con esto, ya se que tenemos que realizar un contraste bilateral, porque el valor puede estar por encima o por debajo de 25. Es decir, que el intervalo de confianza tendrá un límite inferior y un límite superior.

El primer paso es calcular el estadístico de contraste. En este caso, conocemos la varianza poblacional (σ=16\sigma = 16). Por lo tanto, utilizo la puntuación ZZ como estadístico de contraste:

Z=Xˉμσn=242516100=14/10=10.4=2.5Z = \frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}} = \frac{24 - 25}{\frac{\sqrt{16}}{\sqrt{100}}} = \frac{-1}{4 / 10} = \frac{-1}{0.4} = -2.5

El siguiente paso es determinar los valores críticos que delimitan la zona de aceptación. Para ello, necesito el valor de α=0.05\alpha = 0.05 (el nivel de significancia). Siendo así, la zona de aceptación es:

  • Límite inferior: Zα/2=Z0.05/2=Z0.025Z_{\alpha/2} = Z_{0.05/2} = Z_{0.025}
  • Límite superior: Z1α/2=Z10.05/2=Z0.975Z_{1-\alpha/2} = Z_{1-0.05/2} = Z_{0.975}

Estos valores se pueden encontrar utilizando la tabla de la distribución normal estándar, en la que consulto la puntuación Z para las frecuencia acumuladas 0.025 y 0.975, que son:

  • Límite inferior: Z0.025=1.96Z_{0.025} = -1.96
  • Límite superior: Z0.975=1.96Z_{0.975} = 1.96

Finalmente, comparamos el valor del estadístico de contraste Z=2.5Z = -2.5, con los valores críticos. Vemos que 2.5-2.5 es menor que 1.96-1.96. Es decir, que cae en la zona crítica unilateral izquierda, lo que indica que deberíamos rechazar la hipótesis nula (H0H_0) en favor de la hipótesis alternativa (H1H_1). En otras palabras, hay evidencia suficiente al nivel del 5% para afirmar que la media poblacional no es 25.

Significancia α=0.05\alpha = 0.05

Es muy frecuente en estadística utilizar un nivel de significancia α=0.05\alpha = 0.05. Tanto es así, que es buena idea memorizar los valores 1.96-1.96 y 1.961.96.

En esencia, α=0.05\alpha = 0.05 implica que el 95% de la distribución se encuentra entre entre 1.96-1.96 y 1.961.96. La puntuación ZZ para un nivel de significancia de 0.0250.025 se encuentra en la cola izquierda de la distribución normal estándar y corresponde a un valor que deja a su izquierda el 2.5% del área bajo la curva. La puntuación ZZ para un nivel de 0.9750.975 está en la cola derecha y deja a su izquierda el 97.5% del área bajo la curva.

Ejercicio práctico con T de Student

Contrasta si la media poblacional toma un valor menor de 25 con una varianza muestral de 16 para una muestra de 100 sujetos que tiene una media de 24. Asumiendo un α=0.05\alpha=0.05

quiero contrastar si la media poblacional μ\mu es menor que 25 en una muestra de 100 sujetos con una varianza muestral de 16 y una media muestral de 24, asumiendo un nivel de significancia α=0.05\alpha = 0.05.

Las hipótesis son:

  • Hipótesis nula (H0H_0): μ25\mu \geq 25
  • Hipótesis alternativa (H1H_1): μ<25\mu < 25

Primero calculo el estadístico de contraste utilizando la fórmula para la distribución t de Student. Recuerda que no conocemos la varianza poblacional, sólo la muestral, por eso utilizo la T de Student y no la puntuación Z.

T=XˉμSnnT = \frac{\bar{X} - \mu}{\frac{S_n}{\sqrt{n}}}

Sustituimos los valores conocidos en la fórmula:

T=242516100=10.4=2.5T = \frac{24 - 25}{\frac{\sqrt{16}}{\sqrt{100}}} = \frac{-1}{0.4} = -2.5

Después, determinamos los valores críticos. En este caso, se trata de un contraste unilateral. Concretamente, nos preguntan si la media poblacional toma un valor menor de 25., busco el valor crítico para la zona crítica unilateral izquierda, donde:

Ttα,n1T \leq t_{\alpha, n-1}

Al consultar la tabla de la distribución t de Student, encontramos que para 99 grados de libertad y α=0.05\alpha = 0.05, el valor crítico es aproximadamente -1.984 (el signo negativo indica la cola izquierda de la distribución).

Tt1α,n1=t0.95,99=1.984T \geq t_{1-\alpha, n-1} = t_{0.95, 99} = -1.984

Finalmente, comparamos el estadístico de contraste con el valor crítico:

  • Si Ttα,n1T \leq t_{\alpha, n-1}, rechazamos la hipótesis nula.
  • Si T>tα,n1T > t_{\alpha, n-1}, no puedo rechazar la hipótesis nula.

En este caso, lapuesto que T=2.5T = -2.5, es menor que -1.984, no rechazamos la hipótesis nula. Es decir, el contraste nos lleva a aceptar la hipótesis nula, lo que sugiere no hay suficiente evidencia para afirmar que la media poblacional es menor que 25.

No lo explico aún, pero ten en cuenta

Para el contraste mediante pruebas de significación, tenemos que tener en cuenta la significación estadística y la relevancia práctica. La relevancia práctica hace referencia a la contundencia o el tamaño del efecto.