Ciencia de datos: tabla de base de datos
Tabla de base de datos
Una tabla de base de datos es una tabla con datos estructurados.
La siguiente tabla muestra una tabla de base de datos con datos de salud extraídos de un reloj deportivo:
Duración | Pulso_promedio | Max_pulso | Calorías_quemadas | Horas_Trabajo | Horas_Sueño |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Este conjunto de datos contiene información de una sesión de entrenamiento típica, como la duración, el pulso promedio, el consumo de calorías, etc.
Estructura de la tabla de la base de datos
Una tabla de base de datos consta de columna(s) y fila(s):
columna 1 | columna 2 | columna 3 | columna 4 | columna 5 | columna 6 | |
Duración | Pulso_promedio | Max_pulso | Calorías_quemadas | Horas_Trabajo | Horas_Sueño | |
---|---|---|---|---|---|---|
Fila 1 | 30 | 80 | 120 | 240 | 10 | 7 |
Fila 2 | 30 | 85 | 120 | 250 | 10 | 7 |
Fila 3 | 45 | 90 | 130 | 260 | 8 | 7 |
Fila 4 | 45 | 95 | 130 | 270 | 8 | 7 |
Fila 5 | 45 | 100 | 140 | 280 | 0 | 7 |
Fila 6 | 60 | 105 | 140 | 290 | 7 | 8 |
Fila 7 | 60 | 110 | 145 | 300 | 7 | 8 |
Fila 8 | 60 | 115 | 145 | 310 | 8 | 8 |
Fila 9 | 75 | 120 | 150 | 320 | 0 | 8 |
Fila 10 | 75 | 125 | 150 | 330 | 8 | 8 |
Una fila es una representación horizontal de datos.
Una columna es una representación vertical de datos.
Variables
Una variable se define como algo que se puede medir o contar.
Los ejemplos pueden ser caracteres, números o tiempo.
En el siguiente ejemplo, podemos observar que cada columna representa una variable.
Duración | Pulso_promedio | Max_pulso | Calorías_quemadas | Horas_Trabajo | Horas_Sueño |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Hay 6 columnas, lo que significa que hay 6 variables (Duración, Pulso_promedio, Pulso_máximo, Quema_de_calorías, Horas_de_trabajo, Horas_de_sueño).
Hay 11 filas, lo que significa que cada variable tiene 10 observaciones.
Pero si hay 11 filas, ¿cómo es que solo hay 10 observaciones?
Es porque la primera fila es la etiqueta, lo que significa que es el nombre de la variable.