Funciones de ciencia de datos


Este capítulo muestra tres funciones comúnmente utilizadas cuando se trabaja con Data Science: max(), min() y mean().


El conjunto de datos del reloj deportivo

Duración Pulso_promedio Max_pulso Calorías_quemadas Horas_Trabajo Horas_Sueño
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

El conjunto de datos anterior consta de 6 variables, cada una con 10 observaciones:

  • Duración - ¿Cuánto duró la sesión de entrenamiento en minutos?
  • Average_Pulse - ¿Cuál fue el pulso promedio de la sesión de entrenamiento? Esto se mide en latidos por minuto.
  • Max_Pulse - ¿Cuál fue el pulso máximo de la sesión de entrenamiento?
  • Calorie_Burnage : ¿cuántas calorías se quemaron en la sesión de entrenamiento?
  • Hours_Work - ¿Cuántas horas trabajábamos en nuestro trabajo antes de la sesión de formación?
  • Hours_Sleep - ¿Cuánto dormimos la noche anterior a la sesión de entrenamiento?

Usamos guión bajo (_) para separar cadenas porque Python no puede leer el espacio como separador.



La función max()

La función de Python max()se usa para encontrar el valor más alto en una matriz.

Ejemplo

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

La función min()

La función de Python min()se usa para encontrar el valor más bajo en una matriz.

Ejemplo

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

La función media()

La función NumPy mean()se usa para encontrar el valor promedio de una matriz.

Ejemplo

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

Escribimos np. delante de mean para que Python sepa que queremos activar la función mean de la biblioteca Numpy .