3. Introducción a las pruebas de hipótesis

3.1 Hipótesis nula (H₀) y alternativa (H₁)

Las pruebas de hipótesis son un pilar de la inferencia estadística, permitiéndonos tomar decisiones sobre una población basándonos en datos de una muestra. Todo comienza con la formulación de dos hipótesis contrapuestas:

  • Hipótesis Nula (H₀):

    Es la afirmación que se asume como verdadera por defecto, a menos que la evidencia de la muestra demuestre lo contrario. Generalmente, H₀ postula que no hay efecto, no hay diferencia, no hay relación o que un parámetro poblacional es igual a un valor específico. Es la hipótesis del "status quo" o de la "no novedad". El objetivo de la prueba es intentar refutar H₀.

    Ejemplo: "El nuevo fertilizante no tiene efecto en el crecimiento de las plantas." (μ_nuevo = μ_estándar)

  • Hipótesis Alternativa (H₁ o Ha):

    Es la afirmación que se intenta probar. Representa lo que se cree que es cierto si la hipótesis nula es falsa. H₁ suele postular que sí hay un efecto, sí hay una diferencia, sí hay una relación o que un parámetro poblacional es diferente de un valor específico (mayor, menor o simplemente distinto).

    Ejemplo: "El nuevo fertilizante aumenta el crecimiento de las plantas." (μ_nuevo > μ_estándar)

La prueba de hipótesis no "prueba" que H₁ es verdadera, sino que evalúa si hay suficiente evidencia para rechazar H₀ a favor de H₁.

3.2 Errores tipo I y II

Dado que las pruebas de hipótesis se basan en muestras y no en la población completa, siempre existe la posibilidad de cometer un error al tomar una decisión. Hay dos tipos de errores:

  • Error Tipo I (α - Alfa):

    Ocurre cuando rechazamos la hipótesis nula (H₀) cuando en realidad es verdadera. Es un "falso positivo". Imagina que un test de embarazo da positivo, pero la persona no está embarazada. Es un error de alarma.

    La probabilidad de cometer un Error Tipo I se denota con la letra griega alfa (α), y es lo que conocemos como nivel de significancia.

    Consecuencia: Podríamos implementar un cambio costoso (ej., lanzar un nuevo producto) basándonos en un efecto que no existe.

  • Error Tipo II (β - Beta):

    Ocurre cuando no rechazamos la hipótesis nula (H₀) cuando en realidad es falsa. Es un "falso negativo". Imagina que un test de embarazo da negativo, pero la persona sí está embarazada. Es un error de omisión.

    La probabilidad de cometer un Error Tipo II se denota con la letra griega beta (β).

    Consecuencia: Podríamos perder una oportunidad valiosa (ej., no lanzar un producto que sí sería exitoso) al no detectar un efecto real.

Existe una relación inversa entre α y β: reducir la probabilidad de un tipo de error a menudo aumenta la probabilidad del otro. El desafío es encontrar un equilibrio adecuado.

3.3 Nivel de significancia (α)

El nivel de significancia (α) es un umbral predefinido que establece la probabilidad máxima de cometer un Error Tipo I que estamos dispuestos a aceptar. Es una decisión que se toma antes de realizar la prueba.

  • Los valores más comunes para α son 0.05 (5%), 0.01 (1%) y 0.10 (10%).
  • Si elegimos α = 0.05, estamos diciendo que estamos dispuestos a aceptar un 5% de posibilidades de rechazar una H₀ verdadera.
  • Si el p-value (que veremos en el siguiente tema) es menor que α, rechazamos H₀.

La elección de α depende del contexto del problema y de las consecuencias de cometer un Error Tipo I. En campos como la medicina, donde un falso positivo puede tener graves implicaciones, α suele ser más bajo (ej., 0.01).

3.4 Potencia estadística

La potencia estadística de una prueba es la probabilidad de rechazar correctamente la hipótesis nula cuando esta es falsa. Se calcula como 1 - β (uno menos la probabilidad de cometer un Error Tipo II).

  • Una prueba con alta potencia es deseable porque tiene una mayor capacidad para detectar un efecto real si este existe en la población.
  • Factores que influyen en la potencia: el tamaño de la muestra (a mayor n, mayor potencia), el tamaño del efecto (efectos más grandes son más fáciles de detectar) y el nivel de significancia (un α más alto aumenta la potencia, pero también el riesgo de Error Tipo I).

Calcular la potencia antes de un estudio (análisis de potencia a priori) ayuda a determinar el tamaño de muestra necesario para detectar un efecto de un tamaño determinado con una probabilidad deseada.

3.5 Ejemplos cotidianos de hipótesis

Para solidificar estos conceptos, veamos algunos ejemplos prácticos de cómo se formulan las hipótesis:

  • Ejemplo 1: Eficacia de un nuevo medicamento

    • H₀: El nuevo medicamento no tiene efecto en la presión arterial (es decir, la presión arterial promedio de los pacientes tratados con el nuevo medicamento es igual a la de los tratados con placebo).
    • H₁: El nuevo medicamento reduce la presión arterial (es decir, la presión arterial promedio de los pacientes tratados con el nuevo medicamento es menor que la de los tratados con placebo).
  • Ejemplo 2: Preferencia de clientes por un producto

    • H₀: El porcentaje de clientes que prefieren el producto A es igual al del producto B.
    • H₁: El porcentaje de clientes que prefieren el producto A es diferente al del producto B.
  • Ejemplo 3: Impacto de una campaña publicitaria

    • H₀: La nueva campaña publicitaria no aumenta las ventas.
    • H₁: La nueva campaña publicitaria aumenta las ventas.

En cada caso, la prueba de hipótesis nos ayudará a decidir si la evidencia de nuestros datos es lo suficientemente fuerte como para rechazar la hipótesis nula y aceptar la alternativa.