7. Prueba t para una muestra

7.1 Concepto y cuándo usarla

La prueba t para una muestra es una herramienta estadística utilizada para determinar si la media de una única muestra es significativamente diferente de un valor poblacional conocido o hipotético. Es una de las pruebas de hipótesis más fundamentales y se aplica en situaciones donde:

  • Se tiene una muestra de datos numéricos.
  • Se conoce un valor de referencia (media poblacional hipotética) con el que se quiere comparar la media de la muestra.
  • La desviación estándar de la población es desconocida (lo cual es muy común).
  • Los datos de la muestra provienen de una población con distribución aproximadamente normal, o el tamaño de la muestra es suficientemente grande (n > 30) para que el Teorema del Límite Central aplique.

Ejemplo: Un fabricante afirma que la vida útil promedio de sus bombillas es de 1000 horas. Tomamos una muestra de 30 bombillas y queremos saber si la vida útil promedio de nuestra muestra es significativamente diferente de 1000 horas.

7.2 Contraste unilateral y bilateral

La forma en que se formula la hipótesis alternativa (H₁) determina si la prueba es unilateral (de una cola) o bilateral (de dos colas):

  • Prueba Bilateral (Two-tailed test):

    Se utiliza cuando estamos interesados en detectar una diferencia en cualquier dirección. La hipótesis alternativa establece que la media de la muestra es diferente del valor hipotético (μ ≠ μ₀).

    H₀: μ = μ₀ (La media de la población es igual al valor hipotético)

    H₁: μ ≠ μ₀ (La media de la población es diferente del valor hipotético)

  • Prueba Unilateral (One-tailed test):

    Se utiliza cuando tenemos una expectativa direccional específica sobre la diferencia. La hipótesis alternativa establece que la media de la muestra es mayor que (μ > μ₀) o menor que (μ < μ₀) el valor hipotético.

    H₀: μ ≤ μ₀ (La media de la población es menor o igual al valor hipotético)

    H₁: μ > μ₀ (La media de la población es mayor que el valor hipotético)

    O

    H₀: μ ≥ μ₀ (La media de la población es mayor o igual al valor hipotético)

    H₁: μ < μ₀ (La media de la población es menor que el valor hipotético)

La elección entre una prueba unilateral y bilateral debe hacerse antes de analizar los datos, basándose en la pregunta de investigación.

7.3 Cálculo manual

El estadístico t para una muestra se calcula utilizando la siguiente fórmula:

t = (x̄ - μ₀) / (s / √n)

Donde:

  • es la media de la muestra.
  • μ₀ es la media poblacional hipotética (el valor de H₀).
  • s es la desviación estándar de la muestra.
  • n es el tamaño de la muestra.
  • s / √n es el error estándar de la media.

Una vez calculado el valor de t, se compara con un valor crítico de la distribución t de Student (obtenido de tablas o software) con n-1 grados de libertad y el nivel de significancia (α) elegido. Alternativamente, se calcula el p-value asociado al estadístico t y se compara con α.

7.4 Ejemplo en Python (ttest_1samp)

Vamos a utilizar un ejemplo práctico para aplicar la prueba t para una muestra en Python. Supongamos que un profesor cree que el promedio de calificaciones de sus estudiantes es diferente de 70 (la media histórica del departamento).


import numpy as np
from scipy import stats

# Puntuaciones de una muestra de estudiantes del profesor
puntuaciones = np.array([68, 72, 65, 75, 70, 73, 69, 71, 67, 74, 78, 66, 70, 72, 69])

# Media hipotética del departamento (valor de H0)
media_departamento_h0 = 70

# Nivel de significancia
alfa = 0.05

print(f"Puntuaciones de la muestra: {puntuaciones}")
print(f"Media de la muestra: {np.mean(puntuaciones):.2f}")
print(f"Media hipotética del departamento (H0): {media_departamento_h0}")
print(f"Tamaño de la muestra (n): {len(puntuaciones)}")

# Realizar la prueba t para una muestra (bilateral por defecto)
# stats.ttest_1samp devuelve el estadístico t y el p-value
t_statistic, p_value = stats.ttest_1samp(puntuaciones, media_departamento_h0)

print(f"\nEstadístico t: {t_statistic:.3f}")
print(f"Valor p: {p_value:.4f}")
print(f"Nivel de significancia (alfa): {alfa}")

# Interpretación de resultados
if p_value < alfa:
    print("\nDecisión: Se rechaza la hipótesis nula.")
    print("Conclusión: Hay evidencia estadística significativa para afirmar que la media de las calificaciones de los estudiantes del profesor es diferente de 70.")
else:
    print("\nDecisión: No se rechaza la hipótesis nula.")
    print("Conclusión: No hay evidencia estadística suficiente para afirmar que la media de las calificaciones de los estudiantes del profesor es diferente de 70.")

# --- Ejemplo de prueba unilateral (si el profesor cree que sus estudiantes tienen un promedio MAYOR) ---
# En scipy.stats.ttest_1samp, el p-value es bilateral. Para obtener un p-value unilateral:
# Si t_statistic > 0 y H1: mu > mu0, p_unilateral = p_value / 2
# Si t_statistic < 0 y H1: mu < mu0, p_unilateral = p_value / 2
# Si la dirección es opuesta a H1, p_unilateral = 1 - (p_value / 2)

print("\n--- Prueba unilateral (H1: media > 70) ---")
if t_statistic > 0:
    p_value_unilateral = p_value / 2
else:
    p_value_unilateral = 1 - (p_value / 2) # Si t es negativo, la diferencia es en la dirección opuesta a H1

print(f"P-value unilateral (H1: media > 70): {p_value_unilateral:.4f}")
if p_value_unilateral < alfa:
    print("Decisión: Se rechaza la hipótesis nula (unilateral).")
    print("Conclusión: Hay evidencia estadística significativa para afirmar que la media de las calificaciones de los estudiantes del profesor es MAYOR que 70.")
else:
    print("Decisión: No se rechaza la hipótesis nula (unilateral).")
    print("Conclusión: No hay evidencia estadística suficiente para afirmar que la media de las calificaciones de los estudiantes del profesor es MAYOR que 70.")
            

Este ejemplo muestra cómo aplicar la prueba t y cómo interpretar los resultados tanto para una hipótesis bilateral como unilateral.