Marcos de datos de pandas
¿Qué es un marco de datos?
Un Pandas DataFrame es una estructura de datos bidimensional, como una matriz bidimensional o una tabla con filas y columnas.
Ejemplo
Cree un marco de datos Pandas simple:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
#load data into a DataFrame object:
df = pd.DataFrame(data)
print(df)
Resultado
calories duration 0 420 50 1 380 40 2 390 45
Localizar Fila
Como puede ver en el resultado anterior, el DataFrame es como una tabla con filas y columnas.
Los pandas usan el loc
atributo para devolver una o más filas específicas
Ejemplo
Regresar fila 0:
#refer to the row index:
print(df.loc[0])
Resultado
calories 420 duration 50 Name: 0, dtype: int64
Nota: este ejemplo devuelve una serie Pandas .
Ejemplo
Devolver fila 0 y 1:
#use a list of indexes:
print(df.loc[[0, 1]])
Resultado
calories duration 0 420 50 1 380 40
Nota: Al usar []
, el resultado es un Pandas DataFrame .
¡Obtener la certificación!
$10 INSCRÍBETE
Índices con nombre
Con el index
argumento, puede nombrar sus propios índices.
Ejemplo
Agrega una lista de nombres para darle un nombre a cada fila:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2",
"day3"])
print(df)
Resultado
calories duration day1 420 50 day2 380 40 day3 390 45
Localizar índices con nombre
Utilice el índice con nombre en el loc
atributo para devolver las filas especificadas.
Ejemplo
Devolver "día2":
#refer to the named index:
print(df.loc["day2"])
Resultado
calories 380 duration 40 Name: 0, dtype: int64
Cargar archivos en un marco de datos
Si sus conjuntos de datos están almacenados en un archivo, Pandas puede cargarlos en un DataFrame.
Ejemplo
Cargue un archivo separado por comas (archivo CSV) en un DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
Aprenderá más sobre la importación de archivos en los próximos capítulos.