Las pruebas de hipótesis son un pilar de la inferencia estadística, permitiéndonos tomar decisiones sobre una población basándonos en datos de una muestra. Todo comienza con la formulación de dos hipótesis contrapuestas:
Es la afirmación que se asume como verdadera por defecto, a menos que la evidencia de la muestra demuestre lo contrario. Generalmente, H₀ postula que no hay efecto, no hay diferencia, no hay relación o que un parámetro poblacional es igual a un valor específico. Es la hipótesis del "status quo" o de la "no novedad". El objetivo de la prueba es intentar refutar H₀.
Ejemplo: "El nuevo fertilizante no tiene efecto en el crecimiento de las plantas." (μ_nuevo = μ_estándar)
Es la afirmación que se intenta probar. Representa lo que se cree que es cierto si la hipótesis nula es falsa. H₁ suele postular que sí hay un efecto, sí hay una diferencia, sí hay una relación o que un parámetro poblacional es diferente de un valor específico (mayor, menor o simplemente distinto).
Ejemplo: "El nuevo fertilizante aumenta el crecimiento de las plantas." (μ_nuevo > μ_estándar)
La prueba de hipótesis no "prueba" que H₁ es verdadera, sino que evalúa si hay suficiente evidencia para rechazar H₀ a favor de H₁.
Dado que las pruebas de hipótesis se basan en muestras y no en la población completa, siempre existe la posibilidad de cometer un error al tomar una decisión. Hay dos tipos de errores:
Ocurre cuando rechazamos la hipótesis nula (H₀) cuando en realidad es verdadera. Es un "falso positivo". Imagina que un test de embarazo da positivo, pero la persona no está embarazada. Es un error de alarma.
La probabilidad de cometer un Error Tipo I se denota con la letra griega alfa (α), y es lo que conocemos como nivel de significancia.
Consecuencia: Podríamos implementar un cambio costoso (ej., lanzar un nuevo producto) basándonos en un efecto que no existe.
Ocurre cuando no rechazamos la hipótesis nula (H₀) cuando en realidad es falsa. Es un "falso negativo". Imagina que un test de embarazo da negativo, pero la persona sí está embarazada. Es un error de omisión.
La probabilidad de cometer un Error Tipo II se denota con la letra griega beta (β).
Consecuencia: Podríamos perder una oportunidad valiosa (ej., no lanzar un producto que sí sería exitoso) al no detectar un efecto real.
Existe una relación inversa entre α y β: reducir la probabilidad de un tipo de error a menudo aumenta la probabilidad del otro. El desafío es encontrar un equilibrio adecuado.
El nivel de significancia (α) es un umbral predefinido que establece la probabilidad máxima de cometer un Error Tipo I que estamos dispuestos a aceptar. Es una decisión que se toma antes de realizar la prueba.
La elección de α depende del contexto del problema y de las consecuencias de cometer un Error Tipo I. En campos como la medicina, donde un falso positivo puede tener graves implicaciones, α suele ser más bajo (ej., 0.01).
La potencia estadística de una prueba es la probabilidad de rechazar correctamente la hipótesis nula cuando esta es falsa. Se calcula como 1 - β
(uno menos la probabilidad de cometer un Error Tipo II).
Calcular la potencia antes de un estudio (análisis de potencia a priori) ayuda a determinar el tamaño de muestra necesario para detectar un efecto de un tamaño determinado con una probabilidad deseada.
Para solidificar estos conceptos, veamos algunos ejemplos prácticos de cómo se formulan las hipótesis:
En cada caso, la prueba de hipótesis nos ayudará a decidir si la evidencia de nuestros datos es lo suficientemente fuerte como para rechazar la hipótesis nula y aceptar la alternativa.