Ciencia de datos - Trazado de funciones lineales


El conjunto de datos del reloj deportivo

Eche un vistazo a nuestro conjunto de datos de salud:

Duración Pulso_promedio Max_pulso Calorías_quemadas Horas_Trabajo Horas_Sueño
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Trazar los datos existentes en Python

Ahora, primero podemos trazar los valores de Average_Pulse contra Calorie_Burnage usando la biblioteca matplotlib.

La plot()función se usa para hacer un gráfico binning hexagonal 2D de los puntos x,y:

Ejemplo

import matplotlib.pyplot as plt

health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)

plt.show()

Ejemplo explicado

  • Importe el módulo pyplot de la biblioteca matplotlib
  • Trazar los datos de Average_Pulse contra Calorie_Burnage
  • kind='line'nos dice qué tipo de parcela queremos. Aquí, queremos tener una línea recta.
  • plt.ylim() y plt.xlim() nos dicen en qué valor queremos que comience el eje. Aquí, queremos que el eje comience desde cero.
  • plt.show() nos muestra la salida

El código anterior producirá el siguiente resultado:

Función lineal

La salida del gráfico

Como podemos ver, existe una relación entre Average_Pulse y Calorie_Burnage. Calorie_Burnage aumenta proporcionalmente con Average_Pulse. Significa que podemos usar Average_Pulse para predecir Calorie_Burnage.



¿Por qué la línea no se dibuja completamente hacia abajo hasta el eje y?

La razón es que no tenemos observaciones donde Average_Pulse o Calorie_Burnage sean iguales a cero. 80 es la primera observación de Average_Pulse y 240 es la primera observación de Calorie_Burnage.

Función lineal

Mira la línea. ¿Qué sucede con la quema de calorías si el pulso promedio aumenta de 80 a 90?

Función lineal

Podemos usar la línea diagonal para encontrar la función matemática para predecir el consumo de calorías.

Como resulta:

  • Si el pulso promedio es 80, el consumo de calorías es 240
  • Si el pulso promedio es 90, el consumo de calorías es 260
  • Si el pulso promedio es 100, el consumo de calorías es 280

Hay un patrón. Si el pulso promedio aumenta en 10, el consumo de calorías aumenta en 20.