Pandas - Trazado



Graficado

Pandas usa el plot()método para crear diagramas.

Podemos usar Pyplot, un submódulo de la biblioteca Matplotlib para visualizar el diagrama en la pantalla.

Lea más sobre Matplotlib en nuestro Tutorial de Matplotlib .

Ejemplo

Importe pyplot desde Matplotlib y visualice nuestro DataFrame:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

Los ejemplos en esta página usan un archivo CSV llamado: 'data.csv'.

Descargar data.csv o Abrir data.csv


Gráfico de dispersión

Especifique que desea un diagrama de dispersión con el kindargumento:

kind = 'scatter'

Un diagrama de dispersión necesita un eje x y uno y.

En el siguiente ejemplo, usaremos "Duración" para el eje x y "Calorías" para el eje y.

Incluya los argumentos x e y así:

x = 'Duration', y = 'Calories'

Ejemplo

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

Resultado

Recuerda: en el ejemplo anterior, aprendimos que la correlación entre "Duración" y "Calorías" era 0.922721, y llegamos a la conclusión de que una mayor duración significa más calorías quemadas.

Al mirar el diagrama de dispersión, estaré de acuerdo.

Vamos a crear otro diagrama de dispersión, donde haya una mala relación entre las columnas, como "Duración" y "Pulso máximo", con la correlación 0.009403:

Ejemplo

Un diagrama de dispersión donde no hay relación entre las columnas:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

Resultado


w3schools CERTIFIED . 2021

¡Obtener la certificación!

¡Complete los módulos de Pandas, haga los ejercicios, tome el examen y obtendrá la certificación de w3schools!

$10 INSCRÍBETE

Histograma

Utilice el kindargumento para especificar que desea un histograma:

kind = 'hist'

Un histograma necesita solo una columna.

Un histograma nos muestra la frecuencia de cada intervalo, por ejemplo, ¿cuántos entrenamientos duraron entre 50 y 60 minutos?

En el siguiente ejemplo, usaremos la columna "Duración" para crear el histograma:

Ejemplo

df["Duration"].plot(kind = 'hist')

Resultado

Nota: El histograma nos dice que hubo más de 100 entrenamientos que duraron entre 50 y 60 minutos.


Ponte a prueba con ejercicios

Ejercicio:

Inserte una sintaxis correcta para visualizar los datos en DataFrame como un diagrama (trazado).

df.()