Ciencia de datos: tabla de base de datos


Tabla de base de datos

Una tabla de base de datos es una tabla con datos estructurados.

La siguiente tabla muestra una tabla de base de datos con datos de salud extraídos de un reloj deportivo:

Duración Pulso_promedio Max_pulso Calorías_quemadas Horas_Trabajo Horas_Sueño
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Este conjunto de datos contiene información de una sesión de entrenamiento típica, como la duración, el pulso promedio, el consumo de calorías, etc.


Estructura de la tabla de la base de datos

Una tabla de base de datos consta de columna(s) y fila(s):

columna 1 columna 2 columna 3 columna 4 columna 5 columna 6
Duración Pulso_promedio Max_pulso Calorías_quemadas Horas_Trabajo Horas_Sueño
Fila 1 30 80 120 240 10 7
Fila 2 30 85 120 250 10 7
Fila 3 45 90 130 260 8 7
Fila 4 45 95 130 270 8 7
Fila 5 45 100 140 280 0 7
Fila 6 60 105 140 290 7 8
Fila 7 60 110 145 300 7 8
Fila 8 60 115 145 310 8 8
Fila 9 75 120 150 320 0 8
Fila 10 75 125 150 330 8 8

Una fila es una representación horizontal de datos.

Una columna es una representación vertical de datos.


Variables

Una variable se define como algo que se puede medir o contar.

Los ejemplos pueden ser caracteres, números o tiempo.

En el siguiente ejemplo, podemos observar que cada columna representa una variable.

Duración Pulso_promedio Max_pulso Calorías_quemadas Horas_Trabajo Horas_Sueño
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Hay 6 columnas, lo que significa que hay 6 variables (Duración, Pulso_promedio, Pulso_máximo, Quema_de_calorías, Horas_de_trabajo, Horas_de_sueño).

Hay 11 filas, lo que significa que cada variable tiene 10 observaciones.

Pero si hay 11 filas, ¿cómo es que solo hay 10 observaciones?

Es porque la primera fila es la etiqueta, lo que significa que es el nombre de la variable.