Una de las grandes ventajas de NumPy, la biblioteca numérica de Python, es que incluye funciones estadísticas y de agregación muy rápidas. Operan sobre arrays completos o sobre subconjuntos definidos por ejes, lo que permite analizar datos sin escribir bucles manuales.
Con np.min()
y np.max()
obtenemos el valor más bajo y más alto de un array.
import numpy as np
arr = np.array([5, 12, 7, 20, 15])
print("Mínimo:", np.min(arr)) # 5
print("Máximo:", np.max(arr)) # 20
👉 También existen los métodos .min()
y .max()
que funcionan igual:
print("Mínimo (método):", arr.min())
print("Máximo (método):", arr.max())
Media (promedio): np.mean()
. Mediana (valor central): np.median()
.
arr = np.array([1, 2, 3, 4, 5, 100])
print("Media:", np.mean(arr)) # 19.166...
print("Mediana:", np.median(arr)) # 3.5
👉 Diferencia clave: la media se ve afectada por valores extremos (outliers), mientras que la mediana no.
La desviación estándar mide la dispersión de los datos respecto de la media.
arr = np.array([10, 12, 14, 16, 18])
print("Media:", np.mean(arr))
print("Desviación estándar:", np.std(arr)) # 2.828...
np.sum()
suma todos los elementos; np.prod()
multiplica todos los elementos.
arr = np.array([1, 2, 3, 4])
print("Suma:", np.sum(arr)) # 10
print("Producto:", np.prod(arr)) # 24
En matrices (2D) o arrays de más dimensiones, podemos aplicar funciones estadísticas por filas o columnas usando el parámetro axis
.
Regla: axis=0
opera por columnas (a lo largo de las filas) y axis=1
opera por filas (a lo largo de las columnas).
mat = np.array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
print("Suma total:", np.sum(mat)) # 45
print("Suma por columnas:", np.sum(mat, axis=0)) # [12 15 18]
print("Suma por filas:", np.sum(mat, axis=1)) # [ 6 15 24]
print("Media por columnas:", np.mean(mat, axis=0)) # [4. 5. 6.]
print("Máximo por filas:", np.max(mat, axis=1)) # [3 6 9]
np.min()
/ np.max()
: valores mínimo y máximo.np.mean()
/ np.median()
: promedio y mediana.np.std()
: desviación estándar.np.sum()
/ np.prod()
: suma y producto.axis
para trabajar por filas (axis=1
) o columnas (axis=0
).Nota: Estas funciones estadísticas y de agregación son la base de cualquier análisis de datos con NumPy.