Ciencia de datos - Trazado de funciones lineales
El conjunto de datos del reloj deportivo
Eche un vistazo a nuestro conjunto de datos de salud:
Duración | Pulso_promedio | Max_pulso | Calorías_quemadas | Horas_Trabajo | Horas_Sueño |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Trazar los datos existentes en Python
Ahora, primero podemos trazar los valores de Average_Pulse contra Calorie_Burnage usando la biblioteca matplotlib.
La plot()
función se usa para hacer un gráfico binning hexagonal 2D de los puntos x,y:
Ejemplo
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
Ejemplo explicado
- Importe el módulo pyplot de la biblioteca matplotlib
- Trazar los datos de Average_Pulse contra Calorie_Burnage
kind='line'
nos dice qué tipo de parcela queremos. Aquí, queremos tener una línea recta.- plt.ylim() y plt.xlim() nos dicen en qué valor queremos que comience el eje. Aquí, queremos que el eje comience desde cero.
- plt.show() nos muestra la salida
El código anterior producirá el siguiente resultado:
La salida del gráfico
Como podemos ver, existe una relación entre Average_Pulse y Calorie_Burnage. Calorie_Burnage aumenta proporcionalmente con Average_Pulse. Significa que podemos usar Average_Pulse para predecir Calorie_Burnage.
¿Por qué la línea no se dibuja completamente hacia abajo hasta el eje y?
La razón es que no tenemos observaciones donde Average_Pulse o Calorie_Burnage sean iguales a cero. 80 es la primera observación de Average_Pulse y 240 es la primera observación de Calorie_Burnage.
Mira la línea. ¿Qué sucede con la quema de calorías si el pulso promedio aumenta de 80 a 90?
Podemos usar la línea diagonal para encontrar la función matemática para predecir el consumo de calorías.
Como resulta:
- Si el pulso promedio es 80, el consumo de calorías es 240
- Si el pulso promedio es 90, el consumo de calorías es 260
- Si el pulso promedio es 100, el consumo de calorías es 280
Hay un patrón. Si el pulso promedio aumenta en 10, el consumo de calorías aumenta en 20.