Pandas - Trazado
Graficado
Pandas usa el plot()
método para crear diagramas.
Podemos usar Pyplot, un submódulo de la biblioteca Matplotlib para visualizar el diagrama en la pantalla.
Lea más sobre Matplotlib en nuestro Tutorial de Matplotlib .
Ejemplo
Importe pyplot desde Matplotlib y visualice nuestro DataFrame:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
Los ejemplos en esta página usan un archivo CSV llamado: 'data.csv'.
Descargar data.csv o Abrir data.csv
Gráfico de dispersión
Especifique que desea un diagrama de dispersión con el
kind
argumento:
kind = 'scatter'
Un diagrama de dispersión necesita un eje x y uno y.
En el siguiente ejemplo, usaremos "Duración" para el eje x y "Calorías" para el eje y.
Incluya los argumentos x e y así:
x = 'Duration', y = 'Calories'
Ejemplo
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
Resultado
Recuerda:
en el ejemplo anterior, aprendimos que la correlación entre "Duración" y "Calorías" era 0.922721
, y llegamos a la conclusión de que una mayor duración significa más calorías quemadas.
Al mirar el diagrama de dispersión, estaré de acuerdo.
Vamos a crear otro diagrama de dispersión, donde haya una mala relación entre las columnas, como "Duración" y "Pulso máximo", con la correlación 0.009403
:
Ejemplo
Un diagrama de dispersión donde no hay relación entre las columnas:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
Resultado
¡Obtener la certificación!
$10 INSCRÍBETE
Histograma
Utilice el
kind
argumento para especificar que desea un histograma:
kind = 'hist'
Un histograma necesita solo una columna.
Un histograma nos muestra la frecuencia de cada intervalo, por ejemplo, ¿cuántos entrenamientos duraron entre 50 y 60 minutos?
En el siguiente ejemplo, usaremos la columna "Duración" para crear el histograma:
Ejemplo
df["Duration"].plot(kind = 'hist')
Resultado
Nota: El histograma nos dice que hubo más de 100 entrenamientos que duraron entre 50 y 60 minutos.