Contraste de hipótesis
El contraste de hipótesis es un método de toma de decisiones que nos permite decidir si una proposición estadística acerca de una población se mantiene o se rechaza, según los datos empíricos.
Las hipótesis () hacen referencia a valores poblacionales. Las hipótesis se pueden expresar de forma científica y de forma estadística. Las hipótesis científicas proporcionan la base de la investigación y describen la realidad. A partir de ellas, generamos las hipótesis estadísticas, que se refieren a la distribución de la probabilidad y se expresan en términos matemáticos.
Por ejemplo:
Hipótesis científica | Hipótesis estadística |
---|---|
Los varones y las mujeres no difieren en asiedad | |
Hipótesis nula vs. hipótesis alternativa
En investigación científica, tratamos de refutar la hipótesis nula (). Si verificamos que la hipótesis nula () no es cierta, entonces tiene que ser lo opuesto: la hipótesis alternativa ().
Es decir: la hipótesis nula es aquella que expresa que no hay un efecto, que no hay una correlación; que un fenómeno no se produce. Esa hipótesis se somete a contraste en la investigación. Si la hipótesis nula es refutada, entonces consideramos que la hipótesis alternativa es cierta.
Al analizar la estimación de un parámetro a partir del estadístico de la muestra, vimos el concepto de Intervalo de Confianza (IC), que es el rango calculado a partir de los datos de la muestra que se espera que contenga el parámetro poblacional. Si el valor teórico de la hipótesis nula () está dentro del intervalo de confianza, puedo concluir que la hipótesis nula () es cierta. Es decir: que el contraste no es estadísticamente significativo, que el valor teórico y el poblacional son iguales o que no hay efecto o diferencias.
Por el contrario, si el intervalo de confianza no contiene el valor teórico de la hipótesis nula (); es decir, si el valor cae en la zona de rechazo, se rechaza la hipótesis nula, lo que significa que el contraste es estadísticamente significativo, que el valor teórico y poblacional son diferentes y que sí hay un efecto o diferencias.
Al enunciar la hipótesis, en términos de probabilidad, la hipótesis nula y la alternativa son complementarias. Es decir son mutuamente excluyentes y exhaustivas. Esto es lógico, porque la hipótesis alternativa es todo lo que no sea la hipótesis nula.
Hipótesis nula () | Hipótesis alternativa () |
---|---|
La hipótesis nula () se expresa de forma estadística con exactitud. Es decir, diciendo que algo es igual a (), menor que () o mayor que (). Por el contrario, la hipótesis alternativa () se epresa con valores inexactos. Es decir, diciendo que algo es no-igual a (), menor que () o mayor que ().
Haciendolo de esta manera, es siempre cierto que son mutuamente excluyentes y exhaustivas.
Tipos de contraste
Puedo someter la hipótesis a distintos tipos de contraste:
- Bilateral: no se si el valor teórico será mayor o menor que la media poblacional, por lo que la hipótesis nula sencillamente dice que será igual, por ejemplo
- Unilateral derecho: si asumimos que el valor teórico será superior al valor poblacional, por lo que la hipótesis nula dice que el valor será igual o mayor, por ejemplo
- Unilateral izquierdo: si asumimos que el valor teórico será menor al valor poblacional, por lo que la hipótesis nula dice que el valor será igual o menor, por ejemplo
Pregunta
Asumiendo un alfa = 0.01, puedo llegar a la conclusión de que la zona de rechazo es mayor en un contraste bilateral que en el unilateral derecho
Métodos de contraste de hipótesis
Imagina una investigación en el campo de la psicología que busca estudiar el efecto de tres programas de entrenamiento para mejorar la memoria, que llaman entrenamiento verde, entrenamiento amarillo y entrenamiento azul. Los investigadores han determinado que para la población general, la puntuación media es de 200 y la desviación estándar es 100.
Para medir si los programas de entrenamiento han mejorado la memoria, después de implementar los programas de entrenamiento, quieren saber si la puntuación media de los participantes que han completado el programa es significativamente mayor que la puntuación media poblacional, generando éstos resultados:
La hipótesis nula que quiero contrastar es que la media muestral no es significativamente mayor de la media poblacional conocida (). Es decir, los investigadotres plantean las siguientes hipótesis:
- (El programa no tiene efecto en la memoria de trabajo.)
- (El programa mejora la memoria de trabajo.
Hay dos formas de contrastar la hipótesis: mediante intervalos de confianza, y mediante pruebas de significancia.
Por ejemplo, en la investigación del entrenamiento azul, en el que la media muestral es , para saber si la puntuación es signicativamente distinta de la población general , podríamos seguir ambos métodos:
Mediante intervalos de confianza | Mediante pruebas de significación |
---|---|
El intervalo de confianza se indica con la caja azul, que se calcula añadiendo un margen de error al valor muestral que estoy analizando. | La zona de aceptación (caja azul) se calcula utilizando el error estándar del valor poblacional. Las áreas rojas representan las zonas de rechazo para un nivel de significancia (). |
Como vemos, la media poblacional cae fuera del intervalo de confianza de la muestra. Por eso, podríamos rechazar la hipótesis nula. Es decir, la diferencia entre y es significativa. | El estadístico cae fuera de la zona de aceptación. Por lo que hay una diferencia significativa y la hipótesis nula se rechaza. No sucede lo mismo para los valores verde y amarillo. |
Como vemos, la principal diferencia entre ambos métodos es cómo se calcula el intervalo de confianza:
- En el método de contraste mediante intervalos de confianza, el IC se calcula a partir del valor muestral, añadiendo un margen de error.
- En el método de contraste mediante pruebas de significancia, la zona de aceptación se calcula a partir del valor poblacional, en base al error estándar.
Contraste mediante intervalos de confianza
Este método está explicado en el apartado estadística inferencial.
Los ejercicios de contraste de hipótesis son distintos de los de cálculo de intervalo de confianza, aunque el procedimiento sea similar. En los ejercicios de cálculo de hipótesis, el enunciado nos pedita contrastar un valor. Además, los ejercicios de contraste de hipótesis proporcionarán el valor poblacional.
Ejercicio práctico
Contrasta la media muestral de 25 que ha sido obtenida en una muestra de 100 sujetos con una varianza muestral de 16, que pertenece a una población con una media de 26, con
En este ejercicio, estoy interesados en contrastar la media muestral obtenida con la media poblacional cuando la varianza poblacional es desconocida.
- Media muestral (): 25
- Media poblacional hipotética (): 26
- Tamaño de la muestra (): 100
- Varianza muestral (): 16
- Nivel de significancia (): 0.01
El primer paso es aclarar cuál es la hipótesis:
Para realizar el contraste de la hipótesis, calculo los límites del intervalo de confianza. Como expliqué en el apartado de estadística inferencial, cuando no se la varianza poblacional, tenemos que usar la fórmula de la distribución de Student. De lo contrario, usaríamos la puntuación-
Para el límite inferior ():
Para el límite superior ():
Sustituyendo los valores conocidos y el valor crítico obtenido de la tabla de distribución T de Student para 99 grados de libertad y , que es aproximadamente 2.626:
El intervalo de confianza de 99% para la media muestral va de 23.95 a 26.05. Siendo así, se que la media poblacional hipotética () cae dentro de este intervalo. Por eso, no hay suficiente evidencia para rechazar la hipótesis nula (). Por lo tanto, mantenemos y concluimos que no hay evidencia suficiente para afirmar que la media poblacional difiere de 26.
Contraste mediante pruebas de significación
Este método no consiste en crear un intervalo de confianza a partir del parámetro de la población, sino en utilizar el intervalo de confianza para estimar el parámetro de la población a partir de una muestra. Si el valor del parámetro poblacional bajo la hipótesis nula cae fuera del intervalo de confianza, entonces se rechaza la hipótesis nula.
Cómo hacer el contraste mediante pruebas de significación
Los pasos para realizar un contraste de hipótesis son:
- Calcular el valor del estadístico de contraste ( o de Student).
- Determinar los valores críticos que delimitan la zona de aceptación o rechazo de la hipótesis.
- Comparar el valor del estadístico de contraste con los valores críticos.
Explico cada paso a continuación.
1. Calcular el valor del estadístico de contraste ( o )
El estadístico de contraste es un valor calculado a partir de los datos de la muestra.
El valor del estadístico de contraste dependerá de si conocemos, o no, la varianza poblacional ().
donde:
- es la media de la muestra,
- es la media poblacional bajo la hipótesis nula,
- es la desviación estándar poblacional conocida,
- es el tamaño de la muestra.
- es el error estándar, cuya fórmula es precisamente
donde:
- es la media de la muestra,
- es la media poblacional (bajo la hipótesis nula),
- es la desviación estándar de la muestra, y
- es el tamaño de la muestra.
2. Determinar los valores críticos
Los valores críticos se obtienen de la distribución de probabilidad del estadístico bajo la hipótesis nula y del nivel de significancia elegido. Estos valores delimitan la zona de aceptación o rechazo de la hipótesis nula.
Es decir, utilizando el valor de , calculo los límites de la zona de aceptación. A estos límites, los llamamos valores críticos.
Recuerda que el contraste de hipótesis puede ser bilateral o unilateral, en función de si quiero contrastar que el valor es mayor, menor o ambos. Por ejemplo, si quiero contrastar la hipótesis nula , necesito un contraste bilateral, porque el valor puede estar por encima o por dejabo. Sin embargo, si la hipótesis nula es , sólo necesito saber si el valor está por debajo; es decir: será un contraste unilateral.
3. Comparar el valor del estadístico de contraste con los valores críticos
Con el valor del estadístico de contraste y los valores críticos, puedo determinar si rechazamos o no la hipótesis nula. Es decir, ahora que tenemos el valor Z o el valor T de Student, y tenemos los valores críticos, realizo las comprobaciones:
- Con puntuación :
- Para pruebas de dos colas con , rechazamos la hipótesis nula si o .
- Para pruebas de una cola con , rechazamos la hipótesis nula si .
- Para pruebas de una cola con , rechazamos la hipótesis nula si .
- Con de Student:
- Para pruebas de dos colas con , rechazamos la hipótesis nula si es menor que o mayor que .
- Para pruebas de una cola con , rechazamos la hipótesis nula si es mayor que .
- Para pruebas de una cola con , rechazamos la hipótesis nula si es menor que .
Si el valor del estadístico de contraste cae dentro de la zona de aceptación, entonces no rechazamos la hipótesis nula. Si cae en la zona de rechazo, entonces hay evidencia suficiente para rechazar la hipótesis nula en favor de la alternativa.
Ejercicio práctico con puntuación Z
Contrasta si la media poblacional toma un valor de 25 con una varianza poblacional de 16 para una muestra de 100 sujetos que tiene una media de 24. Asumiendo un
En este ejercicio, se propone contrastar la hipótesis nula de que la media poblacional es igual a 25 frente a la hipótesis alternativa de que la media poblacional es diferente de 25, con una muestra de 100 sujetos y una varianza poblacional de 16. La media muestral obtenida es 24 y se utiliza un nivel de significancia .
La hipótesis nula y la hipótesis alternativa se establecen como:
Con esto, ya se que tenemos que realizar un contraste bilateral, porque el valor puede estar por encima o por debajo de 25. Es decir, que el intervalo de confianza tendrá un límite inferior y un límite superior.
El primer paso es calcular el estadístico de contraste. En este caso, conocemos la varianza poblacional (). Por lo tanto, utilizo la puntuación como estadístico de contraste:
El siguiente paso es determinar los valores críticos que delimitan la zona de aceptación. Para ello, necesito el valor de (el nivel de significancia). Siendo así, la zona de aceptación es:
- Límite inferior:
- Límite superior:
Estos valores se pueden encontrar utilizando la tabla de la distribución normal estándar, en la que consulto la puntuación Z para las frecuencia acumuladas 0.025 y 0.975, que son:
- Límite inferior:
- Límite superior:
Finalmente, comparamos el valor del estadístico de contraste , con los valores críticos. Vemos que es menor que . Es decir, que cae en la zona crítica unilateral izquierda, lo que indica que deberíamos rechazar la hipótesis nula () en favor de la hipótesis alternativa (). En otras palabras, hay evidencia suficiente al nivel del 5% para afirmar que la media poblacional no es 25.
Es muy frecuente en estadística utilizar un nivel de significancia . Tanto es así, que es buena idea memorizar los valores y .
En esencia, implica que el 95% de la distribución se encuentra entre entre y . La puntuación para un nivel de significancia de se encuentra en la cola izquierda de la distribución normal estándar y corresponde a un valor que deja a su izquierda el 2.5% del área bajo la curva. La puntuación para un nivel de está en la cola derecha y deja a su izquierda el 97.5% del área bajo la curva.
Ejercicio práctico con T de Student
Contrasta si la media poblacional toma un valor menor de 25 con una varianza muestral de 16 para una muestra de 100 sujetos que tiene una media de 24. Asumiendo un
quiero contrastar si la media poblacional es menor que 25 en una muestra de 100 sujetos con una varianza muestral de 16 y una media muestral de 24, asumiendo un nivel de significancia .
Las hipótesis son:
- Hipótesis nula ():
- Hipótesis alternativa ():
Primero calculo el estadístico de contraste utilizando la fórmula para la distribución t de Student. Recuerda que no conocemos la varianza poblacional, sólo la muestral, por eso utilizo la T de Student y no la puntuación Z.
Sustituimos los valores conocidos en la fórmula:
Después, determinamos los valores críticos. En este caso, se trata de un contraste unilateral. Concretamente, nos preguntan si la media poblacional toma un valor menor de 25., busco el valor crítico para la zona crítica unilateral izquierda, donde:
Al consultar la tabla de la distribución t de Student, encontramos que para 99 grados de libertad y , el valor crítico es aproximadamente -1.984 (el signo negativo indica la cola izquierda de la distribución).
Finalmente, comparamos el estadístico de contraste con el valor crítico:
- Si , rechazamos la hipótesis nula.
- Si , no puedo rechazar la hipótesis nula.
En este caso, lapuesto que , es menor que -1.984, no rechazamos la hipótesis nula. Es decir, el contraste nos lleva a aceptar la hipótesis nula, lo que sugiere no hay suficiente evidencia para afirmar que la media poblacional es menor que 25.
Para el contraste mediante pruebas de significación, tenemos que tener en cuenta la significación estadística y la relevancia práctica. La relevancia práctica hace referencia a la contundencia o el tamaño del efecto.